Sự cố siêu máy tính AI Tesla: Nguyên nhân và bài học

Trong nhiều năm, tham vọng của Elon Musk không chỉ dừng lại ở việc biến Tesla thành một nhà sản xuất ô tô đơn thuần, mà còn là một công ty hàng đầu về trí tuệ nhân tạo (AI), tiên phong trong lĩnh vực xe tự lái. Để hiện thực hóa mục tiêu này, Musk tin rằng việc thiết kế một siêu máy tính riêng, có khả năng đào tạo hệ thống Tự lái hoàn toàn (FSD), là yếu tố then chốt.

Vào thời điểm đó, hệ thống FSD của Tesla chưa đạt đến trình độ tự lái hoàn toàn. Dù có thể thực hiện một số tác vụ lái xe tự động, hệ thống vẫn cần sự giám sát của người lái. Tuy nhiên, Tesla tin tưởng rằng việc bổ sung dữ liệu, tăng cường sức mạnh tính toán và cải tiến chương trình đào tạo sẽ giúp FSD đạt đến ngưỡng tự lái hoàn toàn.

Tỷ phú Mỹ Elon Musk tại hội thảo ở Paris năm 2023. Ảnh: Reuters
Elon Musk tại Viva Technology 2023: Góc nhìn từ Paris. Ảnh: Internet

Tại Ngày hội Tự động hóa vào tháng 4/2019, Tesla đã giới thiệu đội ngũ AI của mình để thảo luận về hệ thống Autopilot, FSD và công nghệ AI hỗ trợ. Trong sự kiện này, Musk lần đầu tiên đề cập đến Dojo, mô tả nó như một siêu máy tính đào tạo AI “siêu mạnh mẽ”. Ông khẳng định rằng tất cả xe Tesla đều được trang bị đầy đủ phần cứng cần thiết cho khả năng tự lái hoàn toàn và chỉ cần cập nhật phần mềm.

Đến đầu năm 2020, Musk tiếp tục ca ngợi Dojo, nhấn mạnh khả năng xử lý lượng lớn dữ liệu đào tạo video, vận hành hiệu quả các mảng dữ liệu đa chiều với lượng tham số khổng lồ, bộ nhớ dồi dào và băng thông cực cao giữa các lõi của siêu máy tính này.

Tháng 8/2021, Tesla chính thức công bố Dojo tại Ngày hội AI đầu tiên của công ty, một sự kiện được tổ chức nhằm thu hút và chiêu mộ các kỹ sư AI. Tesla cũng giới thiệu chip D1 do hãng tự phát triển, dự kiến sẽ vận hành Dojo cùng với bộ xử lý đồ họa (GPU) của Nvidia. Cụm AI của công ty dự kiến sẽ chứa 3.000 chip D1.

Bên trong trung tâm dữ liệu sử dụng chip Dojo D1 của Tesla. Ảnh: X/Elon Musk
Khám phá trung tâm dữ liệu Tesla: Sức mạnh chip Dojo D1. Ảnh: Internet

Tại Ngày hội AI thứ hai diễn ra vào tháng 9/2022, Tesla tiết lộ đã lắp đặt tủ máy đầu tiên của Dojo và tiến hành thử nghiệm tải 2,2 MW. Khoảng một năm sau, Musk thông báo rằng siêu máy tính đã đi vào hoạt động và đang thực hiện các tác vụ tại trung tâm dữ liệu của Tesla. Ông cũng hé lộ kế hoạch đầu tư một tỷ USD vào Dojo đến năm 2024 và coi đây là một canh bạc mạo hiểm nhưng đáng để đặt cược. Thậm chí, Musk còn lên kế hoạch phát triển Dojo 2 và Dojo 3.

Tuy nhiên, nhiều mục tiêu mà Musk đặt ra cho Dojo đã không trở thành hiện thực. Trong cuộc họp báo cáo tài chính quý 4 và cả năm 2024 của Tesla, siêu máy tính này hoàn toàn không được nhắc đến. Thay vào đó, vào tháng 8/2024, Tesla bắt đầu quảng bá Cortex, một siêu cụm đào tạo AI mới được xây dựng tại cơ sở của Tesla ở Austin, nhằm giải quyết những bài toán AI thực tế. Musk cho biết Cortex sẽ có “bộ nhớ khổng lồ” để đào tạo video cho FSD và robot hình người Optimus, và khác với Dojo, Cortex sử dụng GPU của Nvidia thay vì chip do Tesla tự phát triển.

Cũng trong tháng 8, Bloomberg đưa tin rằng gần 20 người trong nhóm Dojo, bao gồm cả trưởng nhóm, đã rời công ty để thành lập một startup chuyên sản xuất chip AI, phần mềm và phần cứng, đánh dấu sự chấm dứt của dự án Dojo.

Sự việc này diễn ra chỉ vài tuần sau khi Tesla ký hợp đồng trị giá 16,5 tỷ USD với Samsung để sản xuất chip AI thế hệ thứ sáu. Trên trang X, Musk giải thích rằng khi mọi con đường đều dẫn đến AI6, ông buộc phải đóng cửa Dojo và đưa ra một số quyết định nhân sự khó khăn, vì Dojo 2 giờ đây là một ngõ cụt tiến hóa.

Theo The Verge, trong nhiều năm, Tesla đã quảng bá siêu máy tính AI Dojo như một nền tảng giúp hãng vượt trội hơn các nhà phát triển xe tự hành khác. Trong khi phần lớn đối thủ phụ thuộc vào các nhà cung cấp bên ngoài về điện toán và chip, Tesla sẽ tự thiết kế phần cứng. Theo tầm nhìn của Musk, một nỗ lực AI tích hợp theo chiều dọc sẽ giúp công ty vượt lên trên các đối thủ vốn bị hạn chế về nguồn cung.

Tuy nhiên, những chậm trễ về kỹ thuật và sự ra đi của nhiều nhân tài dường như đã khiến mục tiêu của Musk trở nên khó khăn hơn. Jim Keller, nhà phát triển chip AI nổi tiếng, người đầu tiên được Tesla tuyển dụng để dẫn dắt nỗ lực sản xuất chip, đã rời đi vào năm 2018. Người kế nhiệm của ông, Ganesh Venkataramanan, cũng rời đi vào năm 2023 để thành lập startup Density AI. Trưởng nhóm Dojo tiếp theo, Peter Bannon, cũng đã “chia tay” Tesla để gia nhập startup này.

Quan điểm của Tesla rằng việc bổ sung càng nhiều dữ liệu sẽ giúp tiến gần hơn đến khả năng tự lái hoàn toàn cũng vấp phải sự hoài nghi của một số chuyên gia. Họ cho rằng phương pháp “nhồi nhét” dữ liệu vào một mô hình để mong nó thông minh hơn sẽ có những hạn chế nhất định.

Anand Raghunathan, giáo sư kỹ thuật máy tính và điện tại Đại học Purdue, giải thích rằng có một giới hạn về kinh tế và việc này sẽ sớm trở nên quá tốn kém để tiếp tục. Ông cũng cho rằng có thể đến một thời điểm chúng ta sẽ cạn kiệt dữ liệu hữu ích để đào tạo mô hình, vì nhiều dữ liệu hơn không nhất thiết đồng nghĩa với nhiều thông tin hơn. Điều đó phụ thuộc vào việc dữ liệu có thông tin hữu ích để tạo ra một mô hình tốt hơn hay không, và liệu quá trình đào tạo có thể chắt lọc thông tin đó thành một mô hình tốt hơn hay không.

Một vấn đề khác là Tesla cho rằng phần cứng và phần mềm nên được thiết kế để hoạt động cùng nhau. Do đó, công ty đã nỗ lực thoát khỏi phần cứng GPU tiêu chuẩn và tự thiết kế chip riêng để vận hành Dojo. Tuy nhiên, phần lớn phần mềm AI hiện nay được viết để hoạt động với GPU. Việc sử dụng chip Dojo để đào tạo các mô hình AI đa năng sẽ đòi hỏi phải viết lại phần mềm, tạo ra một thách thức không nhỏ.

Việc Dojo giải thể đã nhận được nhiều phản ứng trái chiều. Một số người coi đây là một ví dụ cho thấy Musk đang đưa ra những lời hứa không thể thực hiện được trong bối cảnh doanh số xe điện đang giảm và việc triển khai robotaxi còn khá ảm đạm. Những người khác lại cho rằng quyết định của Musk không phải là một thất bại, mà là một sự thay đổi chiến lược từ việc phát triển phần cứng tự chủ, rủi ro cao, sang một lộ trình hợp lý hơn, dựa vào các đối tác để phát triển chip. Dù thế nào, quyết định này cũng thể hiện một sự thay đổi lớn trong “công thức chiến thắng” của Tesla mà Musk đã ca ngợi trong nhiều năm qua.

Admin


Nguồn: VnExpress

Leave a Reply

Your email address will not be published. Required fields are marked *