HGX-H20 là mẫu GPU được Nvidia tuỳ chỉnh nhằm đáp ứng quy tắc xuất khẩu của Bộ Thương mại Mỹ, song vẫn mang lại hiệu suất thực hiện tác vụ trí tuệ nhân tạo (AI) vượt trội.
Nvidia tạo ra các phiên bản GPU tuỳ chỉnh để bán sang Trung Quốc |
GPU HGX-H20 có tốc độ xử lý 296 INT8 TOPS/FP8 TFLOPS, đi kèm 96 GB bộ nhớ băng thông cao HBM3 cùng tốc độ 4.0 TB/s bandwidth. Mặc dù những thông số trên giấy có vẻ kém mạnh mẽ nhưng mẫu GPU này vẫn có đủ khả năng cạnh tranh vượt trội so với đối thủ trực tiếp là AI Ascend 920 do Huawei sản xuất nhờ sở hữu hiệu suất bộ nhớ tốt hơn.
Theo QZ đưa tin, những sản phẩm GPU H20 của Nvidia có thể đối mặt với lệnh cấm xuất khẩu khi Washington xem xét chính sách xuất khẩu bán dẫn vào tháng 10/2024. Lệnh cấm có thể bao gồm nhiều hình thức khác nhau, từ việc cấm bán đối với một sản phẩm cụ thể cho đến yêu cầu giảm sức mạnh tính toán hoặc là giới hạn dung lượng bộ nhớ tối đa.
Hầu hết những công ty AI Trung Quốc đã và đang phát triển hệ sinh thái ứng dụng nền tảng CUDA của Nvidia. Bởi vậy, việc chuyển đối sang những sản phẩm khác, chẳng hạn như Huawei Ascend tốn kém thêm chi phí cũng như mất thời gian.
GPU HGX H20 tương thích hoàn toàn so với CUDA nên dễ dàng trở thành sản phẩm ưu tiên của nhiều công ty mặc dù tốc độ chậm hơn đáng kể với phiên bản H100.
Bất chấp những lệnh hạn chế xuất khẩu hiện có, doanh nghiệp Trung Quốc vẫn có được các GPU Nvidia tiên tiến thông qua trung gian, cũng như bằng cách thuê máy chủ từ Microsoft và Google.