Qwen2-Math: Bước ngoặt mới cho các thiên tài toán học AI

  • Người khởi tạo Người khởi tạo kieutrongtu
  • Ngày bắt đầu Ngày bắt đầu

qwen2-math-buoc-ngoat-moi-cho-cac-thien-tai-toan-hoc-ai.jpg


Đội ngũ Qwen của Alibaba Cloud đã ra mắt Qwen2-Math, một loạt các mô hình ngôn ngữ lớn được thiết kế đặc biệt để giải quyết các vấn đề toán học phức tạp.

Những mô hình mới này – được xây dựng trên nền tảng Qwen2 hiện có – thể hiện sự thành thạo đáng kinh ngạc trong việc giải các thách thức về số học và toán học, và vượt trội hơn so với các đối thủ dẫn đầu trong ngành trước đây.

Đội ngũ Qwen đã phát triển Qwen2-Math bằng cách sử dụng một Tập hợp dữ liệu Toán học chuyên biệt, phong phú và đa dạng. Tập hợp này bao gồm một loạt các tài nguyên chất lượng cao, bao gồm văn bản từ web, sách, mã nguồn, câu hỏi thi, và dữ liệu tổng hợp được tạo ra bởi chính Qwen2.

Qua quá trình đánh giá nghiêm ngặt trên cả các tiêu chuẩn toán học tiếng Anh và tiếng Trung – bao gồm GSM8K, Math, MMLU-STEM, CMATH, và Toán Gaokao – khả năng xuất sắc của Qwen2-Math đã được thể hiện rõ. Đặc biệt, mô hình hàng đầu, Qwen2-Math-72B-Instruct, đã vượt qua hiệu suất của các mô hình độc quyền như GPT-4o và Claude 3.5 trong nhiều nhiệm vụ toán học khác nhau.

“Qwen2-Math-Instruct đạt được hiệu suất tốt nhất trong số các mô hình có cùng kích thước, với RM@8 vượt trội hơn Maj@8, đặc biệt là ở các mô hình 1.5B và 7B,” nhóm Qwen lưu ý.

Hiệu suất vượt trội này là do việc triển khai hiệu quả mô hình phần thưởng đặc biệt dành cho toán học trong quá trình phát triển.

Qwen2-Math tiếp tục thể hiện sức mạnh của mình khi đạt được kết quả ấn tượng trong các cuộc thi toán học đầy thử thách như Kỳ thi Toán học Mời Mỹ (AIME) 2024 và Cuộc thi Toán học Mỹ (AMC) 2023.

Để đảm bảo tính toàn vẹn của mô hình và ngăn ngừa sự nhiễm bẩn, nhóm Qwen đã thực hiện các phương pháp làm sạch mạnh mẽ trong cả hai giai đoạn tiền huấn luyện và hậu huấn luyện. Quá trình nghiêm ngặt này bao gồm việc loại bỏ các mẫu trùng lặp và xác định sự trùng lặp với các bộ kiểm tra để duy trì độ chính xác và độ tin cậy của mô hình.

Nhìn về phía trước, nhóm Qwen dự định mở rộng khả năng của Qwen2-Math vượt ra ngoài tiếng Anh, với các mô hình song ngữ và đa ngôn ngữ đang được phát triển. Cam kết này nhằm mang lại khả năng giải quyết các vấn đề toán học nâng cao cho khán giả toàn cầu.

“Chúng tôi sẽ tiếp tục nâng cao khả năng của các mô hình để giải quyết các vấn đề toán học phức tạp và thách thức,” nhóm Qwen khẳng định.

Bạn có thể tìm thấy các mô hình Qwen2 trên Hugging Face tại đây.
 

Đăng ký nhận bản tin

File Google sheet đầy đủ kiến thức SEO
Đăng ký kênh Youtube. Đăng ký Google News.



Chúng tôi tôn trọng sự riêng tư của bạn. Hủy đăng ký bất cứ lúc nào. Xem Chính sách quyền riêng tư.

Back
Top