213
/
175686
Alibaba ra mắt mô hình ngôn ngữ cạnh tranh với GPT-4o và DeepSeek V3
alibaba-ra-mat-mo-hinh-ngon-ngu-canh-tranh-voi-gpt-4o-va-deepseek-v3
news

Alibaba ra mắt mô hình ngôn ngữ cạnh tranh với GPT-4o và DeepSeek V3

Thứ 4, 29/01/2025 | 19:42:51
1,847 lượt xem

Bộ phận đám mây của tập đoàn Alibaba, Alibaba Cloud, vừa công bố phát hành mô hình ngôn ngữ quy mô lớn mang tên Qwen2.5-Max.

Mô hình AI (trí tuệ nhân tạo) này của Alibaba được xây dựng dựa trên kiến trúc Mixture-of-Experts (MoE) và đã được đào tạo trên hơn 20.000 tỉ token. Theo các nhà phát triển, Qwen2.5-Max đã thể hiện "sự tiến bộ đáng kể về khả năng trí tuệ" và hiện đã sẵn sàng để đưa vào sử dụng. 

Những kết quả ban đầu cho thấy Qwen2.5-Max mạnh mẽ hơn các đối thủ ẢNH: ALIBABA

Qwen2.5-Max không chỉ cải thiện hiệu suất và độ chính xác mà còn có khả năng xử lý tốt hơn các tác vụ yêu cầu hiểu biết sâu sắc về ngữ cảnh, như phân tích văn bản, dịch thuật và tạo nội dung. Trong một bài viết trên blog, Alibaba cho biết: "Qwen2.5-Max thể hiện sự tiến bộ đáng kể trong việc xử lý các truy vấn phức tạp và cung cấp các câu trả lời có liên quan".

Các con số ấn tượng từ mô hình mới của Alibaba

Mô hình Qwen2.5-Max đã được thử nghiệm trên nhiều điểm chuẩn quan trọng, bao gồm MMLU-Pro, LiveCodeBench, LiveBench và Arena-Hard. Kết quả cho thấy Qwen2.5-Max vượt trội so với DeepSeek V3 trong các bài kiểm tra như Arena-Hard, LiveBench và LiveCodeBench, đồng thời cho thấy kết quả cạnh tranh trong MMLU-Pro. So với các mô hình hàng đầu khác như GPT-4o và Claude-3.5-Sonnet, Qwen2.5-Max cũng khẳng định được vị thế dẫn đầu của mình.

Alibaba Cloud dự kiến sẽ tích hợp Qwen2.5-Max vào các dịch vụ đám mây của mình nhằm giúp khách hàng giải quyết nhiều vấn đề, từ tự động hóa xử lý dữ liệu đến cải thiện tương tác với khách hàng thông qua chatbot và tối ưu hóa quy trình kinh doanh. Mô hình AI này hiện đã có sẵn thông qua dịch vụ Qwen Chat, cho phép người dùng tương tác, kiểm tra khả năng và thử nghiệm các chức năng khác nhau. Ngoài ra, API cũng được mở cho các nhà phát triển. Để truy cập, người dùng cần đăng ký với Alibaba Cloud, kích hoạt dịch vụ Model Studio và tạo khóa API.

Theo Kiến Văn/ Thanh Niên

https://thanhnien.vn/alibaba-ra-mat-mo-hinh-ngon-ngu-canh-tranh-voi-gpt-4o-va-deepseek-v3-185250129152256505.htm

  • Từ khóa

Vệ tinh dẫn đường NVS-02 của Ấn Độ gặp sự cố kỹ thuật khi nâng quỹ đạo

Vệ tinh dẫn đường NVS-02 đã gặp sự cố kỹ thuật trong quá trình nâng quỹ đạo, nguyên nhân là do các van tiếp nhận chất oxy hóa để kích hoạt động cơ đẩy đã...
16:38 - 04/02/2025
169 lượt xem

Hàng trăm trang web của các cơ quan chính phủ Mỹ bất ngờ ngừng hoạt động

Các trang web bị sập bao gồm các trang liên kết với nhiều cơ quan chính phủ quan trọng như Bộ Quốc phòng, Bộ Thương mại, Bộ Năng lượng, Bộ Giao thông, Bộ...
15:27 - 04/02/2025
190 lượt xem

Đào tạo nhân lực AI trong xu thế mới

Đầu năm mới, PV Thanh Niên có cuộc trao đổi với PGS-TS Nguyễn Văn Vũ, Phó trưởng khoa Công nghệ thông tin kiêm Trưởng bộ môn Công nghệ phần mềm Trường ĐH...
15:37 - 04/02/2025
185 lượt xem

Apple đặt niềm tin vào DeepSeek cho iPhone?

Sau khi gây chú ý với ngành công nghệ, công ty khởi nghiệp DeepSeek đã nhận được sự quan tâm từ Apple để tích hợp vào công cụ AI (trí tuệ nhân tạo) của...
11:57 - 04/02/2025
261 lượt xem

Microsoft ngừng cung cấp dịch vụ Defender VPN

Dịch vụ VPN trong Microsoft Defender sẽ ngừng hoạt động từ ngày 28.2 do không thu hút người dùng và không đáp ứng được kỳ vọng về bảo mật.
09:18 - 04/02/2025
342 lượt xem