Quảng cáo #23

App giao đồ ăn Trung Quốc làm được điều bất khả thi: Huấn luyện AI 1,6 nghìn tỷ tham số không cần chip NVIDIA, vượt GPT-5.5 về lập trình

Ứng dụng giao đồ ăn này cho thấy Trung Quốc có thể hoàn toàn thoát khỏi sự phụ thuộc vào chip AI của NVIDIA để tạo nên các mô hình AI khổng lồ.

Trong hơn hai tháng qua, một mô hình AI ẩn danh tên "Owl Alpha" đã âm thầm leo lên vị trí thống trị trên OpenRouter, nền tảng cho phép lập trình viên truy cập và so sánh các mô hình AI lớn nhất thế giới.

Với hơn 10,1 nghìn tỷ token được xử lý mỗi tháng, tăng 242% so với tháng trước, mô hình không tên này lọt vào top 3 toàn cầu, đứng trên nhiều sản phẩm có thương hiệu của OpenAI và Google. Giới lập trình viên không biết nó là gì, chỉ biết nó hoạt động rất tốt.

Tuần này, câu trả lời được tiết lộ. Owl Alpha chính là LongCat 2.0, sản phẩm của Meituan, công ty nổi tiếng nhất Trung Quốc không phải vì AI mà vì giao đồ ăn. Với hơn 770 triệu người dùng giao dịch hàng năm và mạng lưới hơn 14,5 triệu người bán, Meituan gần như không có trên bản đồ AI toàn cầu cho đến thời điểm này.

App giao đồ ăn Trung Quốc làm được điều bất khả thi: Huấn luyện AI 1,6 nghìn tỷ tham số không cần chip NVIDIA, vượt GPT-5.5 về lập trình- Ảnh 1.

Vốn là ứng dụng giao đồ ăn nổi tiếng Trung Quốc, nhưng Meituan lại vừa gia nhập sân chơi mô hình AI

LongCat 2.0 là mô hình Mixture-of-Experts với 1,6 nghìn tỷ tham số, ngưỡng quy mô mà phần lớn các mô hình AI lớn nhất thế giới đang hoạt động. Điểm khác biệt không nằm ở con số tham số mà nằm ở cách mô hình này được tạo ra: toàn bộ quá trình huấn luyện diễn ra trên cụm 50.000 chip nội địa Trung Quốc, bao gồm các chip ASIC chuyên dụng kết hợp với khung giao tiếp HCCL của Huawei. Không có một chip NVIDIA nào trong quá trình đó.

App giao đồ ăn Trung Quốc làm được điều bất khả thi: Huấn luyện AI 1,6 nghìn tỷ tham số không cần chip NVIDIA, vượt GPT-5.5 về lập trình- Ảnh 2.

Đây là cột mốc kỹ thuật đáng chú ý vì trước LongCat 2.0, chip nội địa Trung Quốc chưa được chứng minh đủ khả năng để huấn luyện mô hình ở quy mô nghìn tỷ tham số. Inference, tức chạy mô hình để phục vụ người dùng, là việc chip nội địa đã làm được. Nhưng pre-training, tức quá trình huấn luyện mô hình từ đầu, đòi hỏi năng lực tính toán phối hợp ở mức độ mà cho đến nay chỉ chip NVIDIA mới được chứng minh xử lý được ở quy mô lớn. LongCat 2.0 phá vỡ giả định đó.

Về hiệu năng thực tế, LongCat 2.0 không phải mô hình tốt nhất trong mọi lĩnh vực. Trong các benchmark tổng quát như FORTE và BrowseComp, mô hình vẫn thua Claude Opus 4.8. Nhưng trong lĩnh vực lập trình phần mềm, nơi Meituan tập trung toàn lực, kết quả khác hẳn. Trên SWE-bench Pro, thước đo tiêu chuẩn cho khả năng giải quyết các lỗi phần mềm thực tế, LongCat 2.0 đạt 59,5 điểm, vượt qua GPT-5.5 của OpenAI với 58,6 điểm.

App giao đồ ăn Trung Quốc làm được điều bất khả thi: Huấn luyện AI 1,6 nghìn tỷ tham số không cần chip NVIDIA, vượt GPT-5.5 về lập trình- Ảnh 3.

Dù là sản phẩm của một hãng tay ngang, nhưng mô hình AI của Meituan lại có điểm số hiệu năng vượt mặt GPT-5.5 của OpenAI

Trên nền tảng Claude Code, mô hình xếp thứ hai. Trên OpenClaw, xếp thứ ba. Đây là lý do giới lập trình viên tìm đến Owl Alpha ngay cả khi chưa biết nó là gì.

Thời điểm ra mắt không phải ngẫu nhiên. Trong những tuần vừa qua, Mỹ đã siết quyền truy cập vào Fable 5 và Mythos 5 của Anthropic, đồng thời yêu cầu OpenAI giới hạn GPT-5.6 chỉ cho một nhóm đối tác được chọn lọc. (Đến thời điểm hiện tại các mô hình AI Mythos 5 và Fable 5 của Anthropic đã được chính phủ Mỹ cấp phép xuất khẩu).

Khoảng trống mà các biện pháp kiểm soát này tạo ra là nơi LongCat 2.0 xuất hiện, mã nguồn mở hoàn toàn theo giấy phép MIT, với giá 0,30 USD mỗi triệu token đầu vào trong giai đoạn khuyến mãi và toàn bộ cache hits được xử lý miễn phí. Nhiều chuyên gia trong ngành đã cảnh báo từ trước rằng chính sách hạn chế mô hình AI Mỹ vô tình tạo cơ hội vàng cho các mô hình Trung Quốc lấp đầy khoảng trống bằng sản phẩm rẻ hơn và không bị kiểm soát xuất khẩu.

Câu chuyện Meituan cũng phản ánh một bài học rộng hơn về chiến lược kiểm soát chip của Mỹ. Lệnh hạn chế xuất khẩu NVIDIA sang Trung Quốc được thiết kế để làm chậm sự phát triển AI của nước này. Nhưng thay vào đó, nó đã thúc đẩy các công ty Trung Quốc đầu tư mạnh vào chip nội địa và cuối cùng tạo ra hệ sinh thái đủ khả năng huấn luyện mô hình nghìn tỷ tham số mà không cần đến thứ đang bị cấm. Meituan là bằng chứng mới nhất và rõ ràng nhất cho vòng lặp đó.