Khả Năng Xử Lý Ngôn Ngữ Tiếng Việt Của AI Việt So Với GPT-4 Và Llama
Các mô hình ngôn ngữ lớn (LLM) do các kỹ sư trong nước phát triển như KiLM và ViGPT đang đạt được khả năng tương đương với các mô hình lớn quốc tế như GPT-4 và Llama trong việc xử lý tiếng Việt.
Một báo cáo về sự phát triển của các mô hình ngôn ngữ lớn tiếng Việt được công bố gần đây cho biết tính đến cuối năm 2024, đã có ít nhất 45 mô hình ngôn ngữ lớn tiếng Việt được xây dựng bởi các doanh nghiệp và tổ chức trong và ngoài nước.

Để đánh giá hiệu suất của các mô hình này, các chuyên gia đã sử dụng bộ tiêu chuẩn VMLU (Vietnamese Multitask Language Understanding Benchmark Suite for Large Language Models), được phát triển bởi Viện Khoa học và Công nghệ Tiên tiến Nhật Bản (JAIST) và Zalo AI từ tháng 11/2023. Bộ tiêu chuẩn này bao gồm 10.880 câu hỏi, phân chia thành 58 chủ đề và 4 lĩnh vực: tổng quát, STEM, Khoa học xã hội, Khoa học nhân văn và mở rộng.
- AI Contact Center OmiCX lọt vào danh sách 14 giải pháp AI sáng tạo hàng đầu
- Sinh viên Việt Nam xuất sắc giành giải nhất với sáng kiến drone hỗ trợ cứu hộ trong thiên tai
- Doanh Nghiệp Việt Lên Kế Hoạch Đầu Tư Trăm Triệu USD Phát Triển Mạng Blockchain
- Tiktok Cảnh Báo Sẽ Ngừng Hoạt Động Tại Mỹ
- Việt Nam Hướng Tới Top 50 Thế Giới Về Hạ Tầng Số và Công Nghệ Đến Năm 2030
Theo bảng xếp hạng cho các mô hình From-scratch (mô hình huấn luyện từ đầu), Llama-3-70B của Meta đứng đầu về khả năng xử lý tiếng Việt tổng quát với 66,44 điểm, trong khi GPT-4 của OpenAI xếp ở vị trí thứ ba với 65,53 điểm. Các mô hình của Việt Nam, KiLM-13b-v24.7.1 do Zalo AI phát triển, đứng thứ hai, trong khi ViGPT-1.6B-v1 của VinBigData đứng thứ tám. Các vị trí còn lại trong top 10 thuộc về các mô hình như GPT-4o-mini, Gemma, và Phi-3-128k của OpenAI, Google và Microsoft.
Trong lĩnh vực Khoa học Xã hội tiếng Việt, Llama-3 của Meta chiếm ưu thế, trong khi GPT-4 dẫn đầu về năng lực STEM. Zalo AI tiếp tục nổi bật với việc dẫn đầu ở hạng mục Khoa học Nhân văn.
Trong bảng xếp hạng các mô hình LLM đã được tinh chỉnh (fine-tuned models), tức là các mô hình được điều chỉnh từ các LLM có sẵn với dữ liệu chuyên biệt, có tới 9 mô hình do các nhà phát triển trong nước huấn luyện lọt vào top 10. Ba vị trí đầu tiên thuộc về các mô hình VNPTAI-IO-Large-v2, VNPTAI-IO-Large-v3 và CakebyVPBank-Large.
Cộng đồng AI tiếng Việt đang ngày càng phát triển
Các mô hình ngôn ngữ lớn đóng vai trò nền tảng quan trọng trong việc phát triển các ứng dụng AI về ngôn ngữ. Ví dụ, để có được ChatGPT, OpenAI đã phải phát triển mô hình GPT.
Trong số 45 mô hình LLM tiếng Việt được đánh giá trong bảng xếp hạng, nhiều mô hình đến từ các trường đại học trong nước như ML4U của Trường Đại học Bách khoa (ĐHQG TP HCM) và Trường Đại học FPT TP HCM. Bên cạnh đó, nhiều tổ chức quốc tế cũng tham gia vào việc tối ưu các mô hình LLM cho tiếng Việt, điển hình là UONLP x Ontocord từ Đại học Oregon, DAMO Academy của Alibaba và SDSRV teams từ Samsung.
Mặc dù con số này vẫn còn thấp so với các quốc gia khác trên thế giới, các chuyên gia nhận định rằng kết quả này phản ánh những nỗ lực của các tổ chức trong việc tiếp cận và ứng dụng công nghệ tiên tiến toàn cầu, đồng thời cho thấy tiềm năng phát triển của lĩnh vực này tại Việt Nam. Điều đáng chú ý là nhiều mô hình do các nhà phát triển trong nước huấn luyện đã đạt được vị trí cao trong bảng xếp hạng, cạnh tranh trực tiếp với những mô hình từ các “ông lớn” như Llama-3, GPT-4 và Gemini.
Sự gia tăng số lượng mô hình ngôn ngữ lớn tại Việt Nam cho thấy sự quan tâm mạnh mẽ từ các tổ chức và cá nhân đối với việc phát triển và ứng dụng GenAI. Theo giáo sư Nguyễn Lê Minh, Giám đốc Trung tâm Nghiên cứu Interpretable AI thuộc Viện Khoa học và Công nghệ Tiên tiến Nhật Bản (JAIST), trong tương lai, xu hướng phát triển các mô hình LLM tại Việt Nam sẽ tập trung vào việc tận dụng các mô hình LLM mã nguồn mở như Llama, từ đó điều chỉnh chúng để phù hợp với các bài toán và dữ liệu chuyên biệt.
JAIST và Zalo AI cho biết sẽ tiếp tục cải thiện bộ tiêu chuẩn đánh giá năng lực tiếng Việt VMLU, nhằm nâng cao khả năng huấn luyện LLM cho cộng đồng AI tại Việt Nam, tạo ra nền tảng vững chắc để phát triển các ứng dụng AI có ích cho người dân Việt Nam.
Tiến sĩ Đặng Trần Thái, Trưởng phòng Xử lý Ngôn ngữ Tự nhiên tại VinBigData, cho rằng để huấn luyện các mô hình AI chất lượng cao, cần có các bộ tiêu chuẩn đánh giá (benchmark) tốt, điều này sẽ giúp đảm bảo quá trình huấn luyện có cơ sở vững vàng.