DeepSeek-V4 và nước cờ mới của Trung Quốc trong cuộc đua AI

Hoàng Thị Vân Anh - Đinh Lê Đức Huy
DeepSeek-V4 chưa giúp Trung Quốc vượt Mỹ về năng lực AI tiên tiến nhất, nhưng cho thấy một hướng cạnh tranh đáng chú ý: giảm chi phí triển khai, mở rộng mã nguồn mở, kéo dài ngữ cảnh xử lý và từng bước xây dựng hệ sinh thái AI ít phụ thuộc hơn vào công nghệ Mỹ.
Theo dõi Baoquocte.vn trên

Chưa vượt Mỹ về năng lực lõi

Trong năm 2024, các mô hình DeepSeek-V2 và V3 của Trung Quốc ghi nhận nhiều bước tiến đáng chú ý, đặc biệt là DeepSeek-R1, mô hình suy luận từng gây chấn động toàn cầu khi cho thấy khả năng tiệm cận các mô hình AI hàng đầu của Hoa Kỳ với chi phí thấp. Mới đây nhất, ngày 24/4/2026, DeepSeek tiếp tục ra mắt hai mô hình AI ngôn ngữ lớn mã nguồn mở là DeepSeek-V4-Pro và DeepSeek-V4-Flash. Động thái này phản ánh sự chuyển dịch trong cuộc đua AI toàn cầu: từ cạnh tranh về năng lực công nghệ sang ưu tiên chi phí thấp và khả năng phổ cập rộng hơn. Nói cách khác, Trung Quốc không chỉ tìm cách tạo ra mô hình mạnh hơn, mà còn muốn tạo ra mô hình đủ mạnh, đủ rẻ, đủ mở và đủ dễ triển khai trên quy mô lớn.

DeepSeek-V4 và nước cờ mới của Trung Quốc trong cuộc đua AI

Ngay sau khi mô hình DeepSeek-V4 ra mắt, câu hỏi được đặt ra là liệu Bắc Kinh đã thu hẹp được khoảng cách với các mô hình tiên tiến của Hoa Kỳ chưa? Câu trả lời hiện tại là chưa. Các mô hình AI của Hoa Kỳ vẫn dẫn đầu trong nhiều tác vụ khó, đặc biệt là suy luận phức tạp, lập trình và năng lực tự chủ của tác nhân AI. Dù DeepSeek-R1 từng gây chấn động toàn cầu khi chứng minh khả năng tiệm cận các mô hình AI tiên tiến của Hoa Kỳ, DeepSeek-V4 được đánh giá là chưa thể cạnh tranh trực diện với nhóm mô hình đóng tiên tiến nhất của Mỹ do thiếu hụt năng lực tính toán. Tài liệu kỹ thuật của DeepSeek thừa nhận rằng khả năng suy luận và năng lực tự chủ (agentic) của DeepSeek-V4 tương đương với GPT-5.2, Gemini 3.0 Pro và Claude Opus 4.5 - các mô hình được phát hành khoảng nửa năm trước. DeepSeek thậm chí thừa nhận rõ ràng rằng DeepSeek-V4 “chậm hơn các mô hình tiên tiến nhất hiện nay khoảng 3 đến 6 tháng”.

DeepSeek-V4 và nước cờ mới của Trung Quốc trong cuộc đua AI

Bảng đánh giá Benchmark của DeepSeek-V4-Pro và DeepSeek-V4-Flash so với các mô hình AI khác

DeepSeek-V4 có gì đáng chú ý?

- Gồm hai phiên bản: DeepSeek-V4-Pro và DeepSeek-V4-Flash.

- Được phát hành dưới dạng mã nguồn mở.

- Hướng tới lợi thế chi phí thấp và khả năng triển khai rộng.

- Hỗ trợ ngữ cảnh dài lên tới 1 triệu token.

- Chưa vượt nhóm mô hình AI tiên tiến nhất của Mỹ, nhưng tạo sức ép cạnh tranh ở tầng ứng dụng.

Nhìn vào bảng đánh giá, có thể thấy chuỗi DeepSeek-V4 không phải là mô hình với chuẩn đối sánh (Benchmark) mạnh nhất. Ở các chuẩn đối sánh khó nhất về lập trình và các tác vụ mang tính tự chủ, OpenAI GPT-5.5 và Anthropic Claude Opus 4.7 vẫn duy trì vị thế dẫn đầu. Các nhà nghiên cứu Hoa Kỳ cho rằng DeepSeek-V4 vẫn chưa đủ khả năng thu hẹp khoảng cách công nghệ với Washington.

Hơn nữa, khoảng cách này cũng đang ngày càng mở rộng khi các công ty của Hoa Kỳ sử dụng AI để đẩy nhanh quá trình phát triển mô hình thế hệ tiếp theo. Claude Mythos Preview và GPT-5.5 đều có những cải thiện đáng kể hơn so với các phiên bản tiền nhiệm.

Tuy nhiên, nếu chỉ nhìn DeepSeek-V4 qua lăng kính “mạnh hơn hay yếu hơn mô hình Mỹ”, sẽ chưa thấy hết ý nghĩa của sản phẩm này. Điểm đáng chú ý hơn nằm ở cách DeepSeek đang chuyển trọng tâm cạnh tranh: từ cuộc đua giành vị trí số một về hiệu năng tuyệt đối sang cuộc đua về chi phí, khả năng triển khai, độ mở và quy mô ứng dụng. Đây mới là phần thể hiện rõ hơn tính toán chiến lược của Trung Quốc trong cạnh tranh AI.

Lợi thế từ chi phí thấp và mã nguồn mở

Vậy DeepSeek-V4 tạo ra lợi thế cạnh tranh bằng cách nào? Trên thực tế, lợi thế của DeepSeek-V4 không đến từ việc vượt trội tuyệt đối về năng lực suy luận so với các mô hình tiên tiến nhất, mà nằm ở chi phí vận hành thấp hơn đáng kể so với các đối thủ Hoa Kỳ: 0,14 USD/triệu token đầu vào và 0,28 USD/triệu token đầu ra đối với phiên bản Flash, và 1,74 USD/triệu token đầu vào và 3,48 USD/triệu token đầu ra đối với phiên bản Pro. Chỉ xét về chi phí, mô hình DeepSeek-V4 của Trung Quốc có mức giá cạnh tranh hơn rất nhiều. Đây là lợi thế quan trọng trong bối cảnh nhiều doanh nghiệp, nhà phát triển và tổ chức công không nhất thiết cần mô hình mạnh nhất, mà cần mô hình đủ tốt, ổn định và có chi phí sử dụng thấp.

Đối với các nhà phát triển phần mềm và doanh nghiệp chú trọng đến hiệu quả chi phí hơn là hiệu năng thực tế, DeepSeek V4-Pro là một phương án đáng để cân nhắc cùng với GPT-5.5 và Opus 4.7 trước khi đưa ra lựa chọn. Nếu được triển khai rộng rãi, lợi thế giá rẻ có thể giúp DeepSeek mở rộng ảnh hưởng tại các thị trường đang phát triển, nơi chi phí hạ tầng và chi phí sử dụng AI là rào cản lớn.

Bên cạnh đó, DeepSeek-V4 còn được phát hành dưới dạng mã nguồn mở và áp dụng giấy phép MIT, có nghĩa là bất kỳ ai cũng có thể tải xuống, triển khai, điều chỉnh và thương mại hóa mô hình theo nhu cầu sử dụng riêng. Điều này giúp mở rộng đáng kể khả năng tiếp cận công nghệ, đặc biệt đối với cộng đồng phát triển và các tổ chức muốn tự chủ hạ tầng AI. Với Trung Quốc, mã nguồn mở không chỉ là lựa chọn kỹ thuật, mà còn là công cụ mở rộng hệ sinh thái. Khi nhiều nhà phát triển, doanh nghiệp và quốc gia sử dụng mô hình của DeepSeek, ảnh hưởng công nghệ của Bắc Kinh cũng có cơ hội lan rộng hơn, nhất là ở những thị trường không đủ nguồn lực để phụ thuộc vào các mô hình đóng có chi phí cao.

Vì sao chi phí thấp quan trọng?

Trong cuộc đua AI, mô hình mạnh nhất chưa chắc là mô hình được sử dụng rộng rãi nhất.

Với nhiều doanh nghiệp, trường đại học, cơ quan công quyền hoặc startup, yếu tố quyết định không chỉ là hiệu năng mà còn là chi phí triển khai, khả năng tùy biến và mức độ chủ động về hạ tầng. Đây là khoảng trống mà DeepSeek-V4 đang tìm cách khai thác.

Ngữ cảnh dài và bài toán ứng dụng thực tế

Ngoài ra, lợi thế cạnh tranh của DeepSeek-V4 còn nằm ở khả năng đáp ứng tốt hơn nhu cầu sử dụng thực tế, đặc biệt với các tác vụ đòi hỏi xử lý ngữ cảnh dài. Theo DeepSeek, mô hình có thể mở rộng ngữ cảnh lên tới 1 triệu token, cho phép xử lý trực tiếp lượng dữ liệu lớn chỉ trong một lần. Trong khi đó, nhiều mô hình AI như GPT-5.4 dù vẫn hỗ trợ ngữ cảnh dài nhưng hiệu suất thường suy giảm đáng kể sau mốc 128.000 token. DeepSeek-V4 tích hợp các cơ chế HCA, CSA và kết nối siêu đa luồng có ràng buộc hình học (mHC) giúp nâng cấp kết nối dư thông thường (residual connection) và bộ tối ưu (optimizer). Nhờ vậy, mô hình của Trung Quốc giúp giải quyết thuật toán nhanh hơn, duy trì hiệu quả với các tác vụ phức tạp và văn bản dung lượng lớn mà không cần chia nhỏ dữ liệu đầu vào. Điều này mở ra khả năng thúc đẩy kỷ nguyên ngữ cảnh dài cho các mô hình ngôn ngữ lớn (LLMs) thế hệ tiếp theo của Bắc Kinh.

Tuy nhiên, phần kỹ thuật này cần được nhìn trong bối cảnh ứng dụng thực tế. Ngữ cảnh dài không chỉ là thông số để quảng bá mô hình, mà có thể tạo lợi thế trong xử lý hồ sơ pháp lý, tài liệu kỹ thuật, mã nguồn phần mềm, dữ liệu doanh nghiệp và các kho văn bản lớn. Đây là những lĩnh vực mà khả năng đọc, ghi nhớ và xử lý khối lượng thông tin lớn trong một lần có thể tạo ra giá trị kinh tế trực tiếp.

Cuộc đua AI đang đổi hướng

Song, DeepSeek-V4 vẫn vướng phải một số rủi ro chiến lược. Trung Quốc tuyên bố rằng DeepSeek-V4 là mô hình AI đầu tiên chạy hoàn toàn trên chip nội địa mà không cần đến công nghệ Hoa Kỳ và được tối ưu riêng cho Ascend 950 chip của Huawei. Dù mẫu chip này cho phép xử lý nhiều phép tính hơn mỗi giây với chi phí thấp hơn, nhưng hiệu suất vẫn thua H200 của NVIDIA. Điều này cho thấy nỗ lực tự chủ bán dẫn của Trung Quốc đã có bước tiến, nhưng vẫn chưa thể xóa bỏ hoàn toàn khoảng cách với hệ sinh thái phần cứng AI do Mỹ và các đồng minh dẫn dắt.

Về phía Hoa Kỳ, Nhà Trắng và các phòng thí nghiệm AI hàng đầu cáo buộc các công ty AI Trung Quốc, bao gồm DeepSeek, sử dụng dữ liệu được tạo ra từ các cuộc tấn công sao chép trái phép nhằm vào các mô hình của Mỹ để huấn luyện mô hình của họ. Tuy nhiên, đây là nội dung cần diễn đạt thận trọng: các cáo buộc này phản ánh mức độ căng thẳng ngày càng cao trong cạnh tranh AI Mỹ-Trung, nhưng vẫn cần được kiểm chứng độc lập trước khi xem là kết luận cuối cùng.

Những động thái của DeepSeek chứng minh công nghệ trở thành mặt trận chính trên chiến trường cạnh tranh Mỹ-Trung. Sự thống trị về AI mang lại lợi thế về tăng trưởng kinh tế, ảnh hưởng đến địa chính trị và an ninh quốc gia. DeepSeek-V4 là minh chứng cho thấy những nỗ lực của Trung Quốc trong việc thu hẹp khoảng cách với các mô hình AI của Hoa Kỳ, song vẫn chưa thể cạnh tranh trực tiếp với các mô hình tiên tiến nhất. Nhìn chung, những gì mà V4 sở hữu: mã nguồn mở, quy mô lớn, chi phí rẻ, lượng ngữ cảnh lên tới 1 triệu token, cho thấy: khi nói đến việc biến công nghệ AI thành sức mạnh toàn cầu, thành công không chỉ nằm ở việc sở hữu mô hình hoạt động tốt nhất.

DeepSeek-V4 và nước cờ mới của Trung Quốc trong cuộc đua AI

Bằng cách cung cấp một mô hình mã nguồn mở, quy mô lớn với chi phí cực thấp, DeepSeek-V4 đang tạo ra sức hút lớn tại khu vực Nam bán cầu, nơi các quốc gia ưu tiên các công cụ dễ tiếp cận với giá rẻ. DeepSeek-V4 cũng được đón nhận rộng rãi bởi cộng đồng các nhà phát triển công nghệ. Trong một cuộc khảo sát đối với 85 nhà phát triển sử dụng V4-Pro, 52% cho biết họ sẵn sàng thay thế mô hình lập trình chính hiện tại của mình bằng V4, phản ánh sự kỳ vọng lớn vào khả năng áp dụng thực tế của mô hình này.

Như vậy, DeepSeek-V4 có thể chưa giúp Trung Quốc vượt Hoa Kỳ về năng lực AI tiên tiến nhất, nhưng cho thấy một cách tiếp cận cạnh tranh khác của Bắc Kinh: biến AI từ cuộc đua của những mô hình đắt đỏ thành cuộc đua về chi phí triển khai, khả năng phổ cập và quy mô xử lý các thuật toán. Trong bối cảnh cạnh tranh Mỹ-Trung ngày càng gắn với bán dẫn, dữ liệu, nền tảng điện toán và tiêu chuẩn công nghệ, DeepSeek-V4 không chỉ là một sản phẩm AI mới, mà còn là tín hiệu chiến lược: Trung Quốc đang tìm cách biến AI thành năng lực công nghiệp có thể nhân rộng, thay vì chỉ là thành tích trong phòng thí nghiệm.

Đây cũng là điểm khiến DeepSeek-V4 đáng chú ý. Mô hình này chưa làm thay đổi vị trí dẫn đầu của Mỹ trong AI tiên tiến, nhưng có thể làm thay đổi cách cuộc đua AI được định nghĩa. Nếu Mỹ tiếp tục dẫn đầu ở tầng mô hình mạnh nhất, Trung Quốc đang tìm cách mở rộng ảnh hưởng ở tầng triển khai rộng nhất. Và trong dài hạn, cuộc đua AI toàn cầu có thể không chỉ được quyết định bởi ai có mô hình thông minh nhất, mà còn bởi ai có khả năng đưa AI vào đời sống, sản xuất và quản trị với chi phí thấp nhất, nhanh nhất và rộng nhất.

Vì sao Mỹ và Trung Quốc lựa chọn hai hướng tách biệt trong cuộc đua AI?

Mỹ và Trung Quốc đang theo đuổi những con đường hoàn toàn khác biệt trong phát triển trí tuệ nhân tạo (AI) – những con ...

Robot vào bếp: Khi Trung Quốc đưa AI từ nhà máy về phòng khách

Robot hình người từng được xem là biểu tượng của tương lai xa. Nhưng tại Trung Quốc, tương lai ấy đang được kéo gần hơn ...

Đọc thêm

Chuỗi cung ứng toàn cầu vào ‘tâm bão’, APEC nhóm họp khẩn

Chuỗi cung ứng toàn cầu vào ‘tâm bão’, APEC nhóm họp khẩn

APEC thúc đẩy hợp tác kinh tế giữa lúc chiến sự, mất cân bằng thương mại và nguy cơ gián đoạn chuỗi cung ứng gia tăng.
DeepSeek-V4 và nước cờ mới của Trung Quốc trong cuộc đua AI

DeepSeek-V4 và nước cờ mới của Trung Quốc trong cuộc đua AI

DeepSeek-V4 chưa giúp Trung Quốc vượt Mỹ về năng lực AI tiên tiến nhất, nhưng cho thấy một hướng cạnh tranh đáng chú ý: giảm chi phí triển khai, mở ...
Hệ thống văn bia Chăm tại Mỹ Sơn hướng tới hồ sơ Di sản Tư liệu thế giới

Hệ thống văn bia Chăm tại Mỹ Sơn hướng tới hồ sơ Di sản Tư liệu thế giới

Chuyên gia Viện Viễn Đông Bác Cổ (EFEO) sẽ hỗ trợ dịch thuật hệ thống văn bia Chăm tại Thánh địa Mỹ Sơn, phục vụ xây dựng hồ sơ đề ...
Quảng bá nông sản, thực phẩm Việt tại hội chợ ẩm thực toàn cầu ở Gwangju, Hàn Quốc

Quảng bá nông sản, thực phẩm Việt tại hội chợ ẩm thực toàn cầu ở Gwangju, Hàn Quốc

Hiệp hội Doanh nhân & Đầu tư Việt Nam-Hàn Quốc phối hợp cùng chính quyền thành phố Gwangju và Cục Du lịch Gwangju tổ chức Gwangju Global Food Fair 2026.
Hàn Quốc chi hàng trăm triệu USD cho ‘át chủ bài’ phòng thủ trên biển đến từ Mỹ

Hàn Quốc chi hàng trăm triệu USD cho ‘át chủ bài’ phòng thủ trên biển đến từ Mỹ

Hàn Quốc phê duyệt kế hoạch mua tên lửa đánh chặn SM-6 của Mỹ trị giá 530 tỷ Won nhằm tăng cường năng lực phòng thủ tên lửa trên biển.
Prudential ra mắt ‘Tiếp bước sống vui’ tri ân khách hàng đáo hạn năm 2026

Prudential ra mắt ‘Tiếp bước sống vui’ tri ân khách hàng đáo hạn năm 2026

Prudential Việt Nam (Prudential) vừa ra mắt chương trình ‘Tiếp bước sống vui’ như một món quà tri ân dành riêng cho khách hàng có hợp đồng đáo hạn.
Thượng đỉnh Mỹ-Trung: Hướng tới ổn định chiến lược và thể chế hóa khuôn khổ hợp tác thực chất

Thượng đỉnh Mỹ-Trung: Hướng tới ổn định chiến lược và thể chế hóa khuôn khổ hợp tác thực chất

Cuộc gặp thượng đỉnh giữa hai nhà lãnh đạo Mỹ và Trung Quốc thể hiện nhu cầu lớn của cả hai về ổn định chiến lược và thúc đẩy hợp tác.
Những vấn đề phức tạp của xung đột Trung Đông

Những vấn đề phức tạp của xung đột Trung Đông

Sau hơn hai tháng bom đạn bao phủ vùng Vịnh, cuộc xung đột ở Trung Đông vẫn mờ mịt, nhưng hậu họa thì đã rõ.
Myanmar: Cuộc chuyển giao quyền lực

Myanmar: Cuộc chuyển giao quyền lực

Quá trình chuyển giao quyền lực tại Myanmar từ chính quyền quân sự sang chính phủ dân sự chính danh đã bắt đầu.
Hội nghị Ngoại trưởng G7: Ngăn cú sốc năng lượng toàn cầu

Hội nghị Ngoại trưởng G7: Ngăn cú sốc năng lượng toàn cầu

Việc G7 tổ chức cuộc họp khẩn cấp về nguồn cung dầu mỏ tại Paris là để khẳng định vai trò trung tâm của nhóm trong định hình kinh tế và quản trị toàn cầu.
Chương mới của quan hệ đồng minh Mỹ-Nhật Bản

Chương mới của quan hệ đồng minh Mỹ-Nhật Bản

Thủ tướng Nhật Bản Takaichi Sanae đã lên đường sang Washington trong chuyến thăm 4 ngày (từ ngày 18/3).
Tính toán phía sau Lá chắn châu Mỹ

Tính toán phía sau Lá chắn châu Mỹ

Sự ra đời của 'Lá chắn châu Mỹ' có thể coi là bước đi đầu tiên nhằm hiện thực hóa tham vọng của Washington giữ vai trò và vị thế áp đảo tại Tây bán ...
Thấy gì từ cuộc đua giành khoáng sản thiết yếu trong bối cảnh biến đổi khí hậu?

Thấy gì từ cuộc đua giành khoáng sản thiết yếu trong bối cảnh biến đổi khí hậu?

Cuộc đua chuyển đổi sang năng lượng xanh nhằm chống biến đổi khí hậu đang đẩy các cường quốc vào làn sóng tranh giành nguồn khoáng sản thiết yếu.
Động lực đằng sau chiến dịch 'Cưới ở Ấn Độ' của Thủ tướng Modi

Động lực đằng sau chiến dịch 'Cưới ở Ấn Độ' của Thủ tướng Modi

Thủ tướng Modi thúc đẩy chiến dịch 'Cưới ở Ấn Độ', kêu gọi người dân hạn chế tổ chức đám cưới ở nước ngoài nhằm bảo vệ đồng Rupee và giữ ngoại tệ.
Tổng thống Nga thăm Trung Quốc: Chất xúc tác cho dự án khí đốt Sức mạnh Siberia 2 'nóng trở lại'

Tổng thống Nga thăm Trung Quốc: Chất xúc tác cho dự án khí đốt Sức mạnh Siberia 2 'nóng trở lại'

Chuyến thăm Trung Quốc của Tổng thống Nga Putin được đánh giá là chất xúc tác cho dự án khí đốt Sức mạnh Siberia 2 'nóng trở lại'.
CNBC bình luận về ba chuyển biến lớn từ cuộc gặp giữa Tổng thống Mỹ và Chủ tịch Trung Quốc

CNBC bình luận về ba chuyển biến lớn từ cuộc gặp giữa Tổng thống Mỹ và Chủ tịch Trung Quốc

Bên cạnh những nghi thức ngoại giao trong Hội nghị thượng đỉnh Mỹ-Trung Quốc, điều gì thực sự thay đổi đối với giới kinh doanh?
Tổng thống Putin thăm Trung Quốc: Phép thử cho nỗ lực 'cân bằng quan hệ' của Bắc Kinh?

Tổng thống Putin thăm Trung Quốc: Phép thử cho nỗ lực 'cân bằng quan hệ' của Bắc Kinh?

Theo CNBC, chuyến thăm Bắc Kinh của Tổng thống Nga Putin được đánh giá là một phép thử cho nỗ lực 'cân bằng quan hệ' của Trung Quốc.
Hội nghị thượng đỉnh Mỹ-Trung: Khi đối thoại giúp 'giảm nhiệt' quan hệ

Hội nghị thượng đỉnh Mỹ-Trung: Khi đối thoại giúp 'giảm nhiệt' quan hệ

Trang East Asia Forum đăng bài bình luận về triển vọng quan hệ Mỹ-Trung sau Hội nghị thượng đỉnh giữa Tổng thống Donald Trump và Chủ tịch Tập Cận Bình.
Phiên bản di động