DeepSeek R1-0528: Bước tiến mới của AI Trung Quốc trong cuộc đua toàn cầu

Thứ Sáu, 30/05/2025 04:46

Vào ngày 29 tháng 5 năm 2025, công ty khởi nghiệp trí tuệ nhân tạo (AI) Trung Quốc DeepSeek đã âm thầm phát hành bản cập nhật đầu tiên cho mô hình suy luận R1 của mình, mang tên R1-0528, trên nền tảng Hugging Face. Dù không có thông báo chính thức hay tài liệu chi tiết đi kèm, bản cập nhật này đã nhanh chóng thu hút sự chú ý của cộng đồng AI toàn cầu, đặc biệt là trong bối cảnh cạnh tranh gay gắt với các đối thủ từ Mỹ như OpenAI và Google.

*DeepSeek đang được kỳ vọng sẽ phát hành R2*

Nâng Cao Khả Năng Suy Luận và Giảm Thiểu Sai Lệch

DeepSeek cho biết R1-0528 là một bản nâng cấp nhỏ của R1, nhưng đã cải thiện đáng kể độ sâu của khả năng suy luận và suy diễn, bao gồm việc xử lý tốt hơn các nhiệm vụ phức tạp, đưa hiệu suất của nó gần hơn với các mô hình suy luận o3 của OpenAI và Gemini 2.5 Pro của Google.

Một điểm nổi bật khác của R1-0528 là tỷ lệ “ảo giác” (hallucination) — tức là việc mô hình tạo ra thông tin sai lệch hoặc không chính xác — đã giảm khoảng 45-50% trong các tình huống như viết lại và tóm tắt nội dung.

Hiệu Suất Vượt Trội Trên Các Thước Đo Chuẩn

Theo bảng xếp hạng LiveCodeBench, một thước đo được phát triển bởi các nhà nghiên cứu từ UC Berkeley, MIT và Cornell, mô hình R1-0528 của DeepSeek xếp ngay sau các mô hình o4 mini và o3 của OpenAI về khả năng tạo mã, đồng thời vượt qua Grok 3 mini của xAI và Qwen 3 của Alibaba.

Ngoài ra, R1-0528 còn hỗ trợ tốt hơn cho việc gọi hàm (function calling), xuất dữ liệu ở định dạng JSON, và cải thiện trải nghiệm lập trình giao diện người dùng (front-end).

Đối Thủ Đáng Gờm Trong Cuộc Đua AI Toàn Cầu

Sự ra mắt của R1 vào tháng 1 đã gây chấn động thị trường toàn cầu, khiến cổ phiếu công nghệ ngoài Trung Quốc giảm mạnh và thách thức quan điểm cho rằng việc mở rộng AI đòi hỏi sức mạnh tính toán và đầu tư khổng lồ. Kể từ khi R1 được phát hành, các ông lớn công nghệ Trung Quốc như Alibaba và Tencent đã tung ra các mô hình tuyên bố vượt qua R1 của DeepSeek.

Để đối phó với sự cạnh tranh từ DeepSeek, Google đã giới thiệu các mức truy cập giảm giá cho Gemini, trong khi OpenAI giảm giá và phát hành mô hình o3 Mini sử dụng ít sức mạnh tính toán hơn.

Hướng Tới Tương Lai: Mô Hình R2 và Hợp Tác Với Các Ông Lớn

DeepSeek đang được kỳ vọng sẽ phát hành R2, phiên bản kế nhiệm của R1. Reuters đưa tin vào tháng 3 rằng việc phát hành R2 ban đầu được lên kế hoạch vào tháng 5. DeepSeek cũng đã phát hành một bản nâng cấp cho mô hình ngôn ngữ lớn V3 của mình vào tháng 3.

Ngoài ra, DeepSeek đã tạo ra một biến thể của bản cập nhật bằng cách sử dụng quy trình suy luận của mô hình R1-0528 để nâng cao mô hình Qwen 3 8B Base của gã khổng lồ công nghệ Trung Quốc Alibaba, một quá trình được gọi là chưng cất. Kết quả là hiệu suất vượt qua mô hình Qwen 3 gốc hơn 10%.

Với bản cập nhật R1-0528, DeepSeek tiếp tục khẳng định vị thế của mình trong cuộc đua AI toàn cầu, chứng minh rằng các công ty khởi nghiệp Trung Quốc có thể phát triển các mô hình AI tiên tiến với chi phí thấp hơn và hiệu suất cạnh tranh. Sự cải tiến về khả năng suy luận, giảm thiểu sai lệch và hiệu suất vượt trội trên các thước đo chuẩn cho thấy DeepSeek đang tiến gần hơn đến các đối thủ hàng đầu như OpenAI và Google, đồng thời mở ra cơ hội hợp tác và phát triển trong tương lai.