Cuộc chiến vi mạch giữa Mỹ và Trung Quốc leo thang từ năm 2018, kéo dài từ thời Tổng thống Donald Trump đến nay. Theo tờ Economist, các lệnh cấm vận công nghệ cao của Mỹ, dù nhằm mục đích kiềm chế tham vọng xây dựng ngành công nghiệp sản xuất chip tiên tiến của Trung Quốc, lại vô tình thúc đẩy nước này tăng cường tự chủ.
Tháng 1 vừa qua, DeepSeek đã gây bất ngờ khi tung ra mô hình AI có sức mạnh tương đương các sản phẩm hàng đầu, nhưng chi phí đào tạo lại thấp hơn đáng kể. Các nhà sản xuất chip Trung Quốc cũng đang hướng tới mục tiêu tương tự. Mặc dù chưa thể sánh ngang phương Tây, họ đang nỗ lực tối đa hóa hiệu quả các công cụ hiện có, xây dựng các cụm xử lý lớn để bù đắp sức mạnh, đồng thời hợp nhất phần cứng và phần mềm để khai thác tối đa hiệu suất.
Trong lĩnh vực chip, dữ liệu từ công ty đầu tư mạo hiểm Edgerunner Ventures cho thấy hiệu suất trung bình của chip AI Trung Quốc đạt 114 teraflop (nghìn tỷ phép tính mỗi giây), thấp hơn đáng kể so với các đối thủ Mỹ. Ví dụ, Huawei Ascend 910C, được xem là chip hàng đầu của Trung Quốc, đạt 800 teraflop, trong khi B200 của Nvidia đạt 2.500 teraflop.
Trong nhiều thập kỷ, các nhà sản xuất chip đã tăng hiệu suất bằng cách thu nhỏ bóng bán dẫn. B200 của Nvidia sở hữu 208 tỷ bóng bán dẫn, được chia thành hàng nghìn lõi riêng lẻ và tích hợp trên một dải silicon mỏng chỉ vài chục milimet. Rất ít công ty có khả năng thực hiện quy trình này, trong đó có TSMC và Samsung Semiconductor, những đơn vị bị hạn chế cung cấp công nghệ tiên tiến cho Trung Quốc theo yêu cầu của Mỹ.
Do đó, Trung Quốc phải dựa vào năng lực sản xuất trong nước, chủ yếu là SMIC. Tuy nhiên, do các hạn chế từ Mỹ, SMIC chỉ được phép sử dụng máy quang khắc cực tím sâu (DUV) đời cũ, thay vì máy quang khắc siêu cực tím (EUV) hiện đại. ASML của Hà Lan hiện là công ty duy nhất phát triển hệ thống EUV, nhưng không được phép bán cho Trung Quốc.
Để vượt qua khó khăn, các công ty Trung Quốc như SMIC đang cố gắng tận dụng tối đa máy DUV, sử dụng bước sóng 193 nm, bằng cách đẩy công suất lên mức tối đa. Một kỹ thuật phổ biến là “in nhiều mẫu” (multi-patterning), trong đó kỹ sư lặp lại quy trình khắc nhiều lần để tạo ra các chi tiết nhỏ hơn, thay vì chỉ đặt tấm wafer dưới nguồn sáng một lần. Kỹ thuật này làm tăng chi phí và giảm hiệu suất (tỷ lệ chip không bị lỗi trên mỗi tấm wafer). Tuy nhiên, theo các chuyên gia, khả năng tự cung tự cấp quan trọng hơn hiệu suất đối với Trung Quốc trong giai đoạn này.

Mặc dù còn отставать về chất lượng, Trung Quốc đang chuyển hướng sang số lượng. Trong điện toán AI, phương pháp “song song hóa” (chia nhỏ tác vụ thành nhiều phần để nhiều chip xử lý đồng thời) đang được ưa chuộng. Tháng 4 vừa qua, Huawei đã tận dụng triệt để phương pháp này khi tung ra CloudMatrix 384, trang bị 384 chip Ascend 910C, được giới thiệu có sức mạnh tương đương Nvidia GB200 NVL72, hệ thống sử dụng 72 chip B200.
Công ty phân tích SemiAnalysis ước tính hiệu năng của mỗi chip Ascend chỉ bằng một phần ba so với B200. Việc Huawei sử dụng số lượng chip gấp năm lần dẫn đến mức tiêu thụ điện năng cao hơn đáng kể. Tuy nhiên, chuyên gia Ryan Cunningham của Edgerunner Ventures nhận định đây là “sự đánh đổi hợp lý” và năng lượng “không phải là vấn đề ở Trung Quốc”.
Việc kết nối nhiều chip song song cũng phát huy thế mạnh của Huawei. Thay vì điện, CloudMatrix 384 chuyển đổi dữ liệu dưới dạng xung ánh sáng, sử dụng mạng quang học (optical-networking), vốn tiêu thụ ít điện năng và tạo ra ít nhiệt hơn so với sử dụng điện.
“Trước đây, phương pháp này chủ yếu được sử dụng trong cáp quang đường dài, nhưng hiện đang được ứng dụng vào các trung tâm dữ liệu”, Qingyuan Lin, nhà phân tích bán dẫn tại công ty đầu tư Bernstein, cho biết. “Phương pháp của Huawei đang thay đổi căn bản cách thức xây dựng cơ sở hạ tầng AI”.
Bước tiếp theo trong chiến lược của Trung Quốc là điều chỉnh phần cứng phù hợp với phần mềm. Các hệ thống vi xử lý đa năng hiện đại thường sử dụng kiến trúc 32-bit hoặc 64-bit, nhưng các công ty Trung Quốc đang cố gắng “chia nhỏ” bằng 16-bit, 8-bit hoặc 4-bit, đồng thời chấp nhận các lỗi có thể xảy ra. Rakesh Kumar, kỹ sư điện tại Đại học Illinois (Mỹ), gọi đây là một cách “đơn giản nhưng hiệu quả” để tối ưu hóa phần cứng.
Thực tế, vào tháng 8, DeepSeek đã phát hành một định dạng đánh số mới, lưu trữ số 8-bit không phân biệt số dương, số âm và hoàn toàn không có thành phần phân số. Sơ đồ này không thể biểu diễn một dải số lớn và phức tạp, cũng như thiếu độ chính xác, nhưng có thể áp dụng cho một số công việc cụ thể. Cổ phiếu của Cambricon Technologies, một nhà thiết kế chip Trung Quốc, đã tăng vọt sau thông báo áp dụng giải pháp từ DeepSeek.
Trong khi đó, tháng trước, Tencent cho biết đã điều chỉnh cơ sở hạ tầng điện toán để hỗ trợ bộ xử lý AI do Trung Quốc thiết kế. Động thái này được đánh giá là có thể giúp các doanh nghiệp trong nước tăng cường tiếp cận phần cứng nội địa. Qiu Yuepeng, Chủ tịch Tencent Cloud, xác nhận công ty hiện đang sử dụng “các chip nội địa chính thống” và xây dựng cơ sở hạ tầng xung quanh chúng. Phó chủ tịch Dowson Tong Tao-sang cho biết thêm rằng họ đang hợp tác với nhiều công ty chip trong nước để áp dụng phần cứng phù hợp cho từng tình huống, với chiến lược dài hạn tập trung vào tối ưu hóa thiết kế đồng bộ phần cứng – phần mềm nhằm giảm chi phí tính toán.
Bên cạnh phần cứng, nỗ lực xây dựng nền tảng AI nội địa của Trung Quốc cũng có khởi đầu hứa hẹn, mặc dù chỉ bằng các giải pháp riêng lẻ. Trong khi đó, các công cụ lập trình bán dẫn mà doanh nghiệp nước này sử dụng chủ yếu là Nvidia Cuda hoặc chương trình thiết kế chip từ Synopsys hoặc Cadence.
Theo CNBC, các chuyên gia đánh giá Trung Quốc đang ngày càng giảm sự phụ thuộc vào công nghệ Mỹ. Vào tháng 4, Mỹ hạn chế bán chip Nvidia H20 cho thị trường Trung Quốc, nhưng đã nới lỏng vào tháng 7. Tuy nhiên, thay vì phản ứng “nhẹ nhõm” sau khi được nhượng bộ, Bắc Kinh đã thúc giục các công ty công nghệ trong nước tăng cường đầu tư và “nên từ bỏ hoàn toàn” sản phẩm của Nvidia, thay vào đó sử dụng sản phẩm trong nước.
Admin
Nguồn: VnExpress

 
                         
                         
                         
                         
                         
                         
			 
			 
			