213
/
175224
AI dịch thuật của startup Việt tốt hơn cả Google, ChatGPT
ai-dich-thuat-cua-startup-viet-tot-hon-ca-google-chatgpt
news

AI dịch thuật của startup Việt tốt hơn cả Google, ChatGPT

Thứ 6, 17/01/2025 | 07:19:00
2,173 lượt xem

Doctranslate.io có thể dịch được hình ảnh, âm thanh, video và hiểu sâu sắc tiếng Việt, nhờ đó kết quả benchmark cũng vượt trội so với ChatGPT, Google Translate.

Doctranslate.io là nền tảng dịch thuật bằng AI (trí tuệ nhân tạo), được sáng lập bởi tiến sĩ Trần Vũ Anh. Startup ra đời năm 2023, được Google chọn tham gia chương trình Google Accelerator for Startups 2024. Mới đây, Doctranslate.io tiếp tục nằm trong top 5 startup tiềm năng nhất tại Ngày hội Khởi nghiệp đổi mới sáng tạo Quốc gia (TECHFEST 2024).

AI dịch tối ưu hơn Google, ChatGPT

Sau nhiều năm sinh sống và làm việc ở nước ngoài, Vũ Anh nhận thấy ngôn ngữ là rào cản lớn để mang tri thức đến gần hơn với người Việt. Trong khi các mô hình ngôn ngữ lớn như Google dịch thuật, ChatGPT làm rất tốt công việc phiên dịch trong giao tiếp, hội thoại, Vũ Anh nhận ra còn một "thị trường ngách" nhiều dư địa mà các ông lớn chưa "với tay" đến là dịch thuật văn bản.

"Nếu bạn có một file tài liệu, bài nghiên cứu khoa học dài 20 trang, bạn có thể đưa vào cho ChatGPT dịch. Nhưng chatbot sẽ chỉ trả về các bản dịch dưới dạng chữ viết. Những phần rất quan trọng như biểu đồ, hình ảnh, bảng dữ liệu… gần như bị mất tất cả định dạng. Nếu phải ngồi sắp xếp, thiết kế lại các bảng biểu đó sẽ vô cùng mất thời gian, công sức, thậm chí có thể xảy ra sai sót. Các mô hình ngôn ngữ lớn của Google, OpenAI dù mạnh nhưng vẫn chưa xử lý được triệt để vấn đề. Đó là lý do Doctranslate.io ra đời, tập trung vào việc dịch văn bản, hình ảnh, âm thanh, video", Vũ Anh nói.

File hình ảnh gốc (trái) và file dịch thuật của Doctranslate.io 

Điểm đặc biệt của nền tảng là người dùng có thể đưa đầu vào là một file văn bản, nhiều định dạng với biểu đồ, hình ảnh. Sau đó AI không chỉ dịch các đoạn văn mà còn dịch cả hình ảnh, giữ nguyên định dạng gốc, giúp người dùng có thể so sánh trực tiếp và dùng ngay, không tốn thêm thời gian để thiết kế lại. Với một file hình ảnh nhiều nội dung, Doctranslate.io thậm chí còn cho phép xuất ra file PowerPoint để người dùng tùy chỉnh từng chi tiết và dùng vào nhiều mục đích khác nhau.

Trong nghiên cứu khoa học được công bố tại hội nghị IEEE-RIVF (International Conference on Computing and Communication Technologies) và IEEE - tổ chức kỹ thuật chuyên nghiệp lớn nhất thế giới), mô hình ALMA-Gemma-7B-IT-ST của Doctranslate.io đã cho điểm vượt trội so với Google Translate, GPT-3.5-Turbo của OpenAI… trong bài kiểm tra dịch thuật từ tiếng Anh sang tiếng Việt.

Cụ thể, trong khi GPT-3.5 Turbo lần lượt được 39,3 điểm và 34,1 điểm cho bài dịch Anh - Việt và ngược lại Việt - Anh, AI của Doctranslate.io vượt trội với 56,21 điểm và 57,32 điểm. Còn Google Translate được 39,86 điểm và 35,76 điểm.

Công thức riêng của startup Việt

Ngoài việc cung cấp những sản phẩm ngách mà các mô hình AI lớn chưa đánh chiếm, một trong những lý do khiến Doctranslate.io vượt trội so với ChatGPT, Google Translate là khả năng hiểu tiếng Việt sâu sắc.

Theo Vũ Anh, tiếng Việt có nhiều đặc trưng so với tiếng Anh và những ngôn ngữ khác. Nếu không nắm rõ, sẽ không thể cải thiện được khả năng dịch thuật của AI. Một trong những ví dụ đơn giản nhất là ngôi thứ. "Chúng ta có rất nhiều danh từ, đại từ nhân xưng để chỉ mối quan hệ và cả sắc thái trong từng ngữ cảnh khác nhau. Ví dụ khi dịch truyện, nói 'ông Chí Phèo' và 'thằng Chí Phèo' là khác nhau rất nhiều. Đây là điều các mô hình AI lớn, nếu không hiểu biết sâu sắc tiếng Việt và không tinh chỉnh sẽ không thể cải thiện được độ chính xác", người sáng lập Doctranslate.io nói.

Giao diện nền tảng dịch thuật Doctranslate.io 

Trong quá trình triển khai, đội ngũ của Vũ Anh cũng nhận thấy nhu cầu dịch thuật về tài liệu trong ngành y tế, văn bản của các công ty đa quốc gia, ngân hàng, dịch nội dung các cuộc họp, dịch truyện… là rất lớn. Tuy nhiên không phải lúc nào các tổ chức này cũng sẵn sàng sử dụng các mô hình ngôn ngữ lớn miễn phí như của Google, OpenAI trong hệ thống. Một số định chế cần những mô hình "offline" để có thể dễ dàng tích hợp vào hệ thống, đem lại hiệu quả công việc tốt nhưng đặc biệt hơn là đảm bảo quyền riêng tư của dữ liệu.

Nắm bắt được nhu cầu đó, Doctranslate.io phát triển cả nền tảng dịch thuật cho người dùng phổ thông lẫn phiên bản được tùy chỉnh để có thể dễ dàng tích hợp vào các hệ thống của doanh nghiệp chuyển đổi số cần riêng tư, bảo mật. Hiện tại người dùng có thể sử dụng bản dùng thử miễn phí của Doctranslate.io để dịch văn bản, hình ảnh, video, cuộc hội thoại. Trong khi đó các doanh nghiệp có thể dùng bản cloud hoặc API của Doctranslate.io. Cao hơn, Doctranslate.io còn cung cấp phiên bản on-premises, có độ tùy biến cao và dữ liệu được xử lý ngay tại hệ thống của công ty.

Sau hơn một năm có mặt trên thị trường, Doctranslate.io đang có hơn 200.000 người dùng hoạt động thường xuyên mỗi tháng và được tích hợp trong nhiều hệ thống của doanh nghiệp. Startup AI của Việt Nam dự định sẽ tiếp tục mở rộng thị trường ra các nước trong khu vực Đông Nam Á, sau đó là toàn cầu. "Với Doctranslate.io, chúng tôi từng bước hiện thực hóa mục tiêu đưa tri thức đến gần hơn với mọi người và khẳng định vị thế của trí tuệ Việt trên bản đồ công nghệ toàn cầu", Trần Vũ Anh chia sẻ.

Theo Khương Nha/ Thanh niên

https://thanhnien.vn/ai-dich-thuat-cua-startup-viet-tot-hon-ca-google-chatgpt-185250115142214607.htm

  • Từ khóa

ChatGPT thêm công cụ Deep Research, cạnh tranh DeepSeek

OpenAI khẳng định với công cụ Deep Research mới nhất, ChatGPT có thể 'hoàn thành trong vài chục phút những việc mà con người phải mất đến nhiều giờ'.
16:54 - 03/02/2025
326 lượt xem

Tích trữ điện cho gia đình từ pin laptop cũ

Trong lần cập nhật mới nhất, chủ nhân hệ thống tích trữ điện từ pin laptop cũ đã hoạt động trong hơn 8 năm mà không gặp phải vấn đề cháy nổ hoặc bị phồng...
15:34 - 03/02/2025
346 lượt xem

Thúc đẩy công nghệ cơ khí và tự động hóa

Hiện nay, công nghiệp là ngành kinh tế chủ chốt, chiếm tỷ trọng cao trong cơ cấu kinh tế của cả nước. Do đó, việc tìm “đòn bẩy” khoa học và công nghệ nhằm...
14:51 - 03/02/2025
369 lượt xem

Viettel Global đạt lợi nhuận quý cao kỷ lục

Tổng công ty cổ phần Đầu tư Quốc tế Viettel (Viettel Global - VGI) ngày 3.2 công bố báo cáo tài chính hợp nhất quý 4/2024.
11:42 - 03/02/2025
443 lượt xem

AI thua chuột khi nhận diện vật thể bị che khuất

Các mô hình trí tuệ nhân tạo (AI) tiên tiến đã có thể tạo ra mã máy tính và giúp khám phá các loại dược phẩm mới. Nhưng khi nói đến việc nhận diện các vật...
08:50 - 03/02/2025
510 lượt xem