VinBigdata cho ra mắt mô hình ChatGPT phiên bản Việt
ViGPT được giới thiệu là mô hình ChatGPT phiên bản Việt dành cho người dùng cuối và doanh nghiệp, tập trung nội dung đặc thù của Việt Nam, ra mắt ngày 27/12.
VinBigdata, thuộc Tập đoàn Vingroup, đã thông báo rằng ứng dụng của họ tập trung vào nhiều lĩnh vực như pháp luật, lịch sử, văn hóa, danh nhân, danh lam thắng cảnh và đặc trưng vùng miền. Người dùng có thể trải nghiệm phiên bản giới hạn của ViGPT bằng tiếng Việt trên giao diện website, tương tự như ChatGPT. Bên cạnh phiên bản dành cho người dùng cá nhân, ViGPT cũng sẽ ra mắt phiên bản dành cho doanh nghiệp, được tích hợp trong nền tảng trí tuệ nhân tạo đa nhận thức VinBase 2.0.
VinBigdata kỳ vọng rằng ứng dụng này sẽ góp phần thay đổi thói quen vận hành và tăng hiệu quả trong lĩnh vực kinh doanh, marketing, dịch vụ khách hàng và quản trị rủi ro. Đặc biệt, ViGPT sử dụng mô hình AI tạo sinh với điểm khác biệt là hướng đến người dùng cuối. Hiện nay, trong lĩnh vực nghiên cứu và phát triển AI tạo sinh trên toàn cầu, các đơn vị thường cung cấp sản phẩm theo nhiều hình thức như mã nguồn mở, mã nguồn đóng hay mã nguồn đóng có sẵn qua API và ứng dụng cho người dùng cuối.
- Các ông lớn trong giới công nghệ nỗ lực tích hợp AI tạo sinh trên smartphone
- Sự khác biệt lớn nhất giữa AI của Trung Quốc và phương Tây là tính ứng dụng
- Meta công bố Meta Al, trợ lý ảo miễn phí tiên tiến nhất hiện nay
- Al tạo sinh tiềm ẩn nhiều nguy cơ về dữ liệu
- Apple đưa AI tạo sinh lên iPhone và các sản phẩm khác của hãng
Với các mã nguồn mở như LLaMA (Meta), mô hình được công khai để các nhà phát triển và cộng đồng có thể tải xuống, sử dụng, chỉnh sửa và tùy biến theo nhu cầu. Ngược lại, các mã nguồn đóng thường không công khai hoặc được cung cấp thông qua giao thức kết nối (APIs) như GPT-4 (OpenAI), cho phép doanh nghiệp tích hợp phần lõi công nghệ này vào sản phẩm của mình.
Các ứng dụng như ChatGPT hay Bard là những sản phẩm được hoàn thiện dành cho người dùng cuối; họ có thể dễ dàng truy cập, cài đặt và sử dụng các tác vụ cụ thể. Đại diện của VinBigdata cho biết: “Đến thời điểm hiện tại, chưa có ứng dụng 100% made in Vietnam cho người dùng cuối chính thức công bố tại thị trường Việt Nam”
Phân tích của đại diện VinBigdata cũng chỉ ra rằng AI tạo sinh (Generative AI) được xem là thế hệ tiếp theo của trí tuệ nhân tạo, tập trung vào việc tạo ra nội dung, giải pháp hoặc ý tưởng mới thay vì chỉ đơn thuần phân tích dữ liệu như hiện tại.
Mô hình cơ bản đằng sau hoạt động của AI tạo sinh được gọi là mô hình ngôn ngữ lớn (Large Language Model hay LLM). Đây là một loại mô hình ngôn ngữ được đào tạo bằng các kỹ thuật học sâu trên tập dữ liệu văn bản khổng lồ. Các mô hình này có khả năng tạo văn bản tương tự như con người và thực hiện nhiều tác vụ xử lý ngôn ngữ tự nhiên. Một số mô hình phổ biến có thể kể đến như GPT-4 của OpenAI và Bard của Google.
Để làm chủ AI tạo sinh hoàn toàn từ tầng lõi sâu nhất, các doanh nghiệp cần xây dựng và huấn luyện mô hình ngôn ngữ lớn từ những bước ban đầu. Như với ViGPT, ở giai đoạn nền tảng, mô hình có thể được đào tạo trên tập dữ liệu lớn để ghi nhớ các quy luật và cấu trúc ngôn ngữ. Sau giai đoạn đào tạo, mô hình bắt đầu tự rút ra mối quan hệ giữa các từ, cụm từ, câu và các khái niệm khác nhau. Sau đó tiếp tục được tinh chỉnh qua nhiều bước để tạo ra nền tảng phát triển các ứng dụng thực tế của AI tạo sinh.
Mới đây, Bộ Thông tin và Truyền thông vừa công bố một kế hoạch, đặt mục tiêu đến năm 2025, Việt Nam sẽ có ít nhất một nền tảng công nghệ LLM tiếng Việt. Kế hoạch này nhấn mạnh vào việc nghiên cứu, phát triển và ứng dụng LLM tiếng Việt, coi đó là một nhiệm vụ quan trọng, cần thiết và ý nghĩa. LLM tiếng Việt sẽ sử dụng tri thức và dữ liệu đào tạo đã được sàng lọc từ Việt Nam với chi phí thấp dành cho người dân, doanh nghiệp và tổ chức tại Việt Nam để phát triển các ứng dụng mới.
Việt Nam đang bắt đầu hành trình chinh phục lĩnh vực AI tạo sinh. Đại diện của VinBigdata cho biết rằng sự xuất hiện của ViGPT góp phần thể hiện nỗ lực của các đơn vị công nghệ trong nước nhằm giảm thiểu sự phụ thuộc vào sản phẩm quốc tế, đảm bảo tính chính xác của thông tin.