Chưa vượt Mỹ về năng lực lõi

Trong năm 2024, các mô hình DeepSeek-V2 và V3 của Trung Quốc ghi nhận nhiều bước tiến đáng chú ý, đặc biệt là DeepSeek-R1, mô hình suy luận từng gây chấn động toàn cầu khi cho thấy khả năng tiệm cận các mô hình AI hàng đầu của Hoa Kỳ với chi phí thấp. Mới đây nhất, ngày 24/4/2026, DeepSeek tiếp tục ra mắt hai mô hình AI ngôn ngữ lớn mã nguồn mở là DeepSeek-V4-Pro và DeepSeek-V4-Flash. Động thái này phản ánh sự chuyển dịch trong cuộc đua AI toàn cầu: từ cạnh tranh về năng lực công nghệ sang ưu tiên chi phí thấp và khả năng phổ cập rộng hơn. Nói cách khác, Trung Quốc không chỉ tìm cách tạo ra mô hình mạnh hơn, mà còn muốn tạo ra mô hình đủ mạnh, đủ rẻ, đủ mở và đủ dễ triển khai trên quy mô lớn.

DeepSeek-V4 và nước cờ mới của Trung Quốc trong cuộc đua AI

Ngay sau khi mô hình DeepSeek-V4 ra mắt, câu hỏi được đặt ra là liệu Bắc Kinh đã thu hẹp được khoảng cách với các mô hình tiên tiến của Hoa Kỳ chưa? Câu trả lời hiện tại là chưa. Các mô hình AI của Hoa Kỳ vẫn dẫn đầu trong nhiều tác vụ khó, đặc biệt là suy luận phức tạp, lập trình và năng lực tự chủ của tác nhân AI. Dù DeepSeek-R1 từng gây chấn động toàn cầu khi chứng minh khả năng tiệm cận các mô hình AI tiên tiến của Hoa Kỳ, DeepSeek-V4 được đánh giá là chưa thể cạnh tranh trực diện với nhóm mô hình đóng tiên tiến nhất của Mỹ do thiếu hụt năng lực tính toán. Tài liệu kỹ thuật của DeepSeek thừa nhận rằng khả năng suy luận và năng lực tự chủ (agentic) của DeepSeek-V4 tương đương với GPT-5.2, Gemini 3.0 Pro và Claude Opus 4.5 - các mô hình được phát hành khoảng nửa năm trước. DeepSeek thậm chí thừa nhận rõ ràng rằng DeepSeek-V4 “chậm hơn các mô hình tiên tiến nhất hiện nay khoảng 3 đến 6 tháng”.

Bảng đánh giá Benchmark của DeepSeek-V4-Pro và DeepSeek-V4-Flash so với các mô hình AI khác

DeepSeek-V4 có gì đáng chú ý?

- Gồm hai phiên bản: DeepSeek-V4-Pro và DeepSeek-V4-Flash.

- Được phát hành dưới dạng mã nguồn mở.

- Hướng tới lợi thế chi phí thấp và khả năng triển khai rộng.

- Hỗ trợ ngữ cảnh dài lên tới 1 triệu token.

- Chưa vượt nhóm mô hình AI tiên tiến nhất của Mỹ, nhưng tạo sức ép cạnh tranh ở tầng ứng dụng.

Nhìn vào bảng đánh giá, có thể thấy chuỗi DeepSeek-V4 không phải là mô hình với chuẩn đối sánh (Benchmark) mạnh nhất. Ở các chuẩn đối sánh khó nhất về lập trình và các tác vụ mang tính tự chủ, OpenAI GPT-5.5 và Anthropic Claude Opus 4.7 vẫn duy trì vị thế dẫn đầu. Các nhà nghiên cứu Hoa Kỳ cho rằng DeepSeek-V4 vẫn chưa đủ khả năng thu hẹp khoảng cách công nghệ với Washington.

Hơn nữa, khoảng cách này cũng đang ngày càng mở rộng khi các công ty của Hoa Kỳ sử dụng AI để đẩy nhanh quá trình phát triển mô hình thế hệ tiếp theo. Claude Mythos Preview và GPT-5.5 đều có những cải thiện đáng kể hơn so với các phiên bản tiền nhiệm.

Tuy nhiên, nếu chỉ nhìn DeepSeek-V4 qua lăng kính “mạnh hơn hay yếu hơn mô hình Mỹ”, sẽ chưa thấy hết ý nghĩa của sản phẩm này. Điểm đáng chú ý hơn nằm ở cách DeepSeek đang chuyển trọng tâm cạnh tranh: từ cuộc đua giành vị trí số một về hiệu năng tuyệt đối sang cuộc đua về chi phí, khả năng triển khai, độ mở và quy mô ứng dụng. Đây mới là phần thể hiện rõ hơn tính toán chiến lược của Trung Quốc trong cạnh tranh AI.

Lợi thế từ chi phí thấp và mã nguồn mở

Vậy DeepSeek-V4 tạo ra lợi thế cạnh tranh bằng cách nào? Trên thực tế, lợi thế của DeepSeek-V4 không đến từ việc vượt trội tuyệt đối về năng lực suy luận so với các mô hình tiên tiến nhất, mà nằm ở chi phí vận hành thấp hơn đáng kể so với các đối thủ Hoa Kỳ: 0,14 USD/triệu token đầu vào và 0,28 USD/triệu token đầu ra đối với phiên bản Flash, và 1,74 USD/triệu token đầu vào và 3,48 USD/triệu token đầu ra đối với phiên bản Pro. Chỉ xét về chi phí, mô hình DeepSeek-V4 của Trung Quốc có mức giá cạnh tranh hơn rất nhiều. Đây là lợi thế quan trọng trong bối cảnh nhiều doanh nghiệp, nhà phát triển và tổ chức công không nhất thiết cần mô hình mạnh nhất, mà cần mô hình đủ tốt, ổn định và có chi phí sử dụng thấp.

Đối với các nhà phát triển phần mềm và doanh nghiệp chú trọng đến hiệu quả chi phí hơn là hiệu năng thực tế, DeepSeek V4-Pro là một phương án đáng để cân nhắc cùng với GPT-5.5 và Opus 4.7 trước khi đưa ra lựa chọn. Nếu được triển khai rộng rãi, lợi thế giá rẻ có thể giúp DeepSeek mở rộng ảnh hưởng tại các thị trường đang phát triển, nơi chi phí hạ tầng và chi phí sử dụng AI là rào cản lớn.

Bên cạnh đó, DeepSeek-V4 còn được phát hành dưới dạng mã nguồn mở và áp dụng giấy phép MIT, có nghĩa là bất kỳ ai cũng có thể tải xuống, triển khai, điều chỉnh và thương mại hóa mô hình theo nhu cầu sử dụng riêng. Điều này giúp mở rộng đáng kể khả năng tiếp cận công nghệ, đặc biệt đối với cộng đồng phát triển và các tổ chức muốn tự chủ hạ tầng AI. Với Trung Quốc, mã nguồn mở không chỉ là lựa chọn kỹ thuật, mà còn là công cụ mở rộng hệ sinh thái. Khi nhiều nhà phát triển, doanh nghiệp và quốc gia sử dụng mô hình của DeepSeek, ảnh hưởng công nghệ của Bắc Kinh cũng có cơ hội lan rộng hơn, nhất là ở những thị trường không đủ nguồn lực để phụ thuộc vào các mô hình đóng có chi phí cao.

Vì sao chi phí thấp quan trọng?

Trong cuộc đua AI, mô hình mạnh nhất chưa chắc là mô hình được sử dụng rộng rãi nhất.

Với nhiều doanh nghiệp, trường đại học, cơ quan công quyền hoặc startup, yếu tố quyết định không chỉ là hiệu năng mà còn là chi phí triển khai, khả năng tùy biến và mức độ chủ động về hạ tầng. Đây là khoảng trống mà DeepSeek-V4 đang tìm cách khai thác.

Ngữ cảnh dài và bài toán ứng dụng thực tế

Ngoài ra, lợi thế cạnh tranh của DeepSeek-V4 còn nằm ở khả năng đáp ứng tốt hơn nhu cầu sử dụng thực tế, đặc biệt với các tác vụ đòi hỏi xử lý ngữ cảnh dài. Theo DeepSeek, mô hình có thể mở rộng ngữ cảnh lên tới 1 triệu token, cho phép xử lý trực tiếp lượng dữ liệu lớn chỉ trong một lần. Trong khi đó, nhiều mô hình AI như GPT-5.4 dù vẫn hỗ trợ ngữ cảnh dài nhưng hiệu suất thường suy giảm đáng kể sau mốc 128.000 token. DeepSeek-V4 tích hợp các cơ chế HCA, CSA và kết nối siêu đa luồng có ràng buộc hình học (mHC) giúp nâng cấp kết nối dư thông thường (residual connection) và bộ tối ưu (optimizer). Nhờ vậy, mô hình của Trung Quốc giúp giải quyết thuật toán nhanh hơn, duy trì hiệu quả với các tác vụ phức tạp và văn bản dung lượng lớn mà không cần chia nhỏ dữ liệu đầu vào. Điều này mở ra khả năng thúc đẩy kỷ nguyên ngữ cảnh dài cho các mô hình ngôn ngữ lớn (LLMs) thế hệ tiếp theo của Bắc Kinh.

Tuy nhiên, phần kỹ thuật này cần được nhìn trong bối cảnh ứng dụng thực tế. Ngữ cảnh dài không chỉ là thông số để quảng bá mô hình, mà có thể tạo lợi thế trong xử lý hồ sơ pháp lý, tài liệu kỹ thuật, mã nguồn phần mềm, dữ liệu doanh nghiệp và các kho văn bản lớn. Đây là những lĩnh vực mà khả năng đọc, ghi nhớ và xử lý khối lượng thông tin lớn trong một lần có thể tạo ra giá trị kinh tế trực tiếp.

Cuộc đua AI đang đổi hướng

Song, DeepSeek-V4 vẫn vướng phải một số rủi ro chiến lược. Trung Quốc tuyên bố rằng DeepSeek-V4 là mô hình AI đầu tiên chạy hoàn toàn trên chip nội địa mà không cần đến công nghệ Hoa Kỳ và được tối ưu riêng cho Ascend 950 chip của Huawei. Dù mẫu chip này cho phép xử lý nhiều phép tính hơn mỗi giây với chi phí thấp hơn, nhưng hiệu suất vẫn thua H200 của NVIDIA. Điều này cho thấy nỗ lực tự chủ bán dẫn của Trung Quốc đã có bước tiến, nhưng vẫn chưa thể xóa bỏ hoàn toàn khoảng cách với hệ sinh thái phần cứng AI do Mỹ và các đồng minh dẫn dắt.

Về phía Hoa Kỳ, Nhà Trắng và các phòng thí nghiệm AI hàng đầu cáo buộc các công ty AI Trung Quốc, bao gồm DeepSeek, sử dụng dữ liệu được tạo ra từ các cuộc tấn công sao chép trái phép nhằm vào các mô hình của Mỹ để huấn luyện mô hình của họ. Tuy nhiên, đây là nội dung cần diễn đạt thận trọng: các cáo buộc này phản ánh mức độ căng thẳng ngày càng cao trong cạnh tranh AI Mỹ-Trung, nhưng vẫn cần được kiểm chứng độc lập trước khi xem là kết luận cuối cùng.

Những động thái của DeepSeek chứng minh công nghệ trở thành mặt trận chính trên chiến trường cạnh tranh Mỹ-Trung. Sự thống trị về AI mang lại lợi thế về tăng trưởng kinh tế, ảnh hưởng đến địa chính trị và an ninh quốc gia. DeepSeek-V4 là minh chứng cho thấy những nỗ lực của Trung Quốc trong việc thu hẹp khoảng cách với các mô hình AI của Hoa Kỳ, song vẫn chưa thể cạnh tranh trực tiếp với các mô hình tiên tiến nhất. Nhìn chung, những gì mà V4 sở hữu: mã nguồn mở, quy mô lớn, chi phí rẻ, lượng ngữ cảnh lên tới 1 triệu token, cho thấy: khi nói đến việc biến công nghệ AI thành sức mạnh toàn cầu, thành công không chỉ nằm ở việc sở hữu mô hình hoạt động tốt nhất.

Bằng cách cung cấp một mô hình mã nguồn mở, quy mô lớn với chi phí cực thấp, DeepSeek-V4 đang tạo ra sức hút lớn tại khu vực Nam bán cầu, nơi các quốc gia ưu tiên các công cụ dễ tiếp cận với giá rẻ. DeepSeek-V4 cũng được đón nhận rộng rãi bởi cộng đồng các nhà phát triển công nghệ. Trong một cuộc khảo sát đối với 85 nhà phát triển sử dụng V4-Pro, 52% cho biết họ sẵn sàng thay thế mô hình lập trình chính hiện tại của mình bằng V4, phản ánh sự kỳ vọng lớn vào khả năng áp dụng thực tế của mô hình này.

Như vậy, DeepSeek-V4 có thể chưa giúp Trung Quốc vượt Hoa Kỳ về năng lực AI tiên tiến nhất, nhưng cho thấy một cách tiếp cận cạnh tranh khác của Bắc Kinh: biến AI từ cuộc đua của những mô hình đắt đỏ thành cuộc đua về chi phí triển khai, khả năng phổ cập và quy mô xử lý các thuật toán. Trong bối cảnh cạnh tranh Mỹ-Trung ngày càng gắn với bán dẫn, dữ liệu, nền tảng điện toán và tiêu chuẩn công nghệ, DeepSeek-V4 không chỉ là một sản phẩm AI mới, mà còn là tín hiệu chiến lược: Trung Quốc đang tìm cách biến AI thành năng lực công nghiệp có thể nhân rộng, thay vì chỉ là thành tích trong phòng thí nghiệm.

Đây cũng là điểm khiến DeepSeek-V4 đáng chú ý. Mô hình này chưa làm thay đổi vị trí dẫn đầu của Mỹ trong AI tiên tiến, nhưng có thể làm thay đổi cách cuộc đua AI được định nghĩa. Nếu Mỹ tiếp tục dẫn đầu ở tầng mô hình mạnh nhất, Trung Quốc đang tìm cách mở rộng ảnh hưởng ở tầng triển khai rộng nhất. Và trong dài hạn, cuộc đua AI toàn cầu có thể không chỉ được quyết định bởi ai có mô hình thông minh nhất, mà còn bởi ai có khả năng đưa AI vào đời sống, sản xuất và quản trị với chi phí thấp nhất, nhanh nhất và rộng nhất.