DeepSeek V4 trở lại sau 1 năm ở ẩn: "Cú tát" vào thế độc quyền của Nvidia và lời cảnh báo đanh thép tới OpenAI

Theo tờ Huxiu, cách đây không lâu, làn sóng “Người dân đang nhớ DeepSeek” lan tỏa khắp các cộng đồng công nghệ. Lý do rất đơn giản, DeepSeek từng là “người hùng” kéo chi phí mô hình lớn (LLM) xuống mức bình dân, giúp toàn ngành tận hưởng nguồn Token giá rẻ.

Nhưng hiện tại, khi các ứng dụng Agent thế hệ mới (như OpenClaw) đang “đốt” Token với tốc độ chóng mặt, đẩy chi phí sử dụng lên cao, áp lực giảm chi phí và tăng hiệu quả lại một lần nữa đè nặng lên vai DeepSeek.

Đã hơn một năm kể từ khi DeepSeek V3 và R1 gây chấn động toàn cầu. Thời gian qua, giới công nghệ kỳ vọng DeepSeek V4 sẽ “gây bão” vào dịp Tết năm nay, nhưng cuối cùng kì vọng đã không thành hiện thưc. Sự im lặng kéo dài của họ khiến giới công nghệ vừa sốt ruột vừa kỳ vọng.

Tuy nhiên, với những tín hiệu về sự cố hệ thống và sự xuất hiện của “chế độ chuyên gia” gần đây, có vẻ DeepSeek V4 đang ở rất gần. Đây có thể cũng là lần “thúc giục cập nhật” cuối cùng dành cho “một tượng đài” như DeepSeek.

Câu chuyện AI của Trung Quốc đã thay đổi

Tết Nguyên đán năm 2025, DeepSeek R1 ra mắt với chi phí thấp, hiệu năng cao, mã nguồn mở. Ngay lập tức chiếm lĩnh tâm trí người dùng toàn cầu ngay khi ra mắt. Nhưng chỉ sau một năm, cục diện AI tại Trung Quốc đã chuyển dịch sang một hệ tự sự phức tạp hơn với ba trụ cột.

Thứ nhất là sự tham gia của nhiều người chơi chứ không còn là cuộc chơi của riêng DeepSeek. Cấu trúc “(3+1) + 6 + N” đã hình thành. Ngoài “3+1” gã khổng lồ là ByteDance, Alibaba, Tencent và Baidu, “6” là chỉ các hãng như Kimi, Zhipu AI, MiniMax, StepFun, Baichuan, ModelBest đã dần lớn mạnh. Đa số đã hoặc đang phát hành cổ phiếu lần đầu ra công chúng (IPO).

“N” là các công ty AI theo chiều dọc và thị trường chuyên biệt khác.Đây là một quân đoàn có sức cạnh tranh tập thể, những đối thủ mà DeepSeek buộc phải vượt qua để tái lập vị thế.

Tiếp đó là chuỗi cung ứng Trung Quốc. Nền kinh tế này đã hoàn thiện chuỗi cung ứng toàn diện từ chip, điện toán đám mây đến thuật toán và hệ sinh thái phát triển ứng dụng AI. Hiện tại, các nhà sản xuất như MiniMax đã có nguồn thu vững chắc từ thị trường quốc tế, chứng minh năng lực xuất khẩu công nghệ thông minh.

Theo Huxiu, Trung Quốc trở thành quốc gia thứ hai trên thế giới sở hữu toàn bộ chuỗi ngành khoa học công nghệ thông minh.

Ngoài ra, Trung Quốc có được sự kết nối giữa công nghiệp, ứng dụng thị trường và dòng vốn đầu tư đã vận hành thông suốt. AI không còn là phòng thí nghiệm mà đã len lỏi vào hàng tỷ gia đình và mọi ngành nghề.

Tất cả những điều này tạo nên một thị trường AI sôi động ở xứ sở tỷ dân.

Bốn làn sóng đã trôi qua trong sự im lặng của DeepSeek

Thần thoại Trung Hoa có câu “Một ngày trên trời bằng một năm dưới hạ giới”. Trong một năm DeepSeek “ngừng cập nhật”, thế giới AI đã trải qua bốn làn sóng.

Thứ nhất là lập trình AI với các công cụ như Cursor, Claude Code chiếm lĩnh cộng đồng nhà phát triển. Trong khi đó, DeepSeek dần bị lu mờ.

Làn sóng thứ 2 là đa phương thức (Multimodal) khi Gemini 3 Pro và Seedance 2.0 (ByteDance) đã thể hiện xuất sắc khả năng hiểu thị giác và tạo video.

Tiếp đó, hệ sinh thái Agent bắt đầu bùng nổ với làn sóng thứ 3. So với khả năng hiểu và đổi thoại của trợ lý AI, Agent đã tiến hoá lên tầng lớp thực thi, chuyển từ “trả lời câu hỏi” sang “chủ động thực thi nhiệm vụ”.

Mới đây nhất, sự xuất hiện của OpenClaw hay Claude Code đã biến AI thành một “hệ điều hành tiếp quản” các thao tác trên máy tính và vượt xa cấp độ Agent.

DeepSeek dường như đang đứng ngoài các cuộc vui này. Với V3.2, họ mới bắt đầu thử nghiệm giới hạn ngữ cảnh triệu Token. Liệu DeepSeek có đang kẹt lại ở một lộ trình kỹ thuật cũ, hay họ đang âm thầm chuẩn bị cho một cú nhảy vọt về thế hệ?

Theo thông tin từ Huxiu, kinh tế Token (Tokenomics) chính là vòng lặp giá trị của kinh tế thông minh. Trước đây, trong kỉ nguyên công nghiệp dùng GB để đo lưu lượng, thì kỷ nguyên AI dùng Token để đo “năng lực”.

Lượng tiêu thụ Token tại Trung Quốc đã tăng hơn 1.000 lần trong hai năm qua (đạt 140 nghìn tỷ lượt gọi mỗi ngày vào tháng 3/2026). Tuy nhiên, Token là đơn vị đo số lượng, không phải chất lượng.

“Thần đồng AI” La Phúc Lị của tập đoàn Xiaomi khi giới thiệu gói mô hình MiMo đã nói: “Hiện tại, nguồn cung năng lực điện toán toàn cầu không theo kịp nhu cầu Token do Agent tạo ra. Lối thoát thực sự không phải là Token rẻ hơn, mà là sự cùng tiến hoá, sự phối hợp giữa khung Agent tiết kiệm Token giá rẻ hơn và các mô hình mạnh mẽ, hiệu quả hơn”.

Chính vì vậy, DeepSeek, với xuất thân từ giới đầu tư định lượng, hiểu rõ hơn ai hết về hiệu quả chi phí. Người ta mong chờ DeepSeek quay lại không chỉ vì giá rẻ, mà vì họ cần một “mỏ neo” để cân bằng lại chi phí tiêu thụ Token khổng lồ của các Agent thế hệ mới.

Kì vọng dành cho DeepSeek V4 không nằm ở các tiêu chuẩn cũ

Theo Huxiu, dựa trên các bài báo khoa học gần đây, DeepSeek V4 không đơn giản là bản nâng cấp tham số. Nó là sự tổng hòa của các đột phá về kiến trúc. Đầu tiên là OCR 2 và thị giác nhân quả, cho phép mô hình “đọc” tài liệu dài hàng triệu trang theo logic trình bày của con người, phá vỡ giới hạn xử lý tài liệu phức tạp.

Tiếp đó, DeepSeek dùng công nghệ mHC, giải quyết bài toán bùng nổ tín hiệu trong mô hình nghìn tỷ tham số, giúp huấn luyện ổn định trên các hệ thống không phụ thuộc vào chip tiến trình tiên tiến nhất.

Sản phẩm này còn có tính năng Engram và trí nhớ dài hạn, qua đó thay đổi thiết kế “dùng tính toán đổi lấy trí nhớ” của Transformer truyền thống, giúp mô hình có trạng thái nhớ bền vững xuyên suốt các phiên làm việc với chi phí cực thấp.

Tờ Huxiu cho hay DeepSeek V4 còn tối ưu hóa phần mềm để gấp đôi hiệu suất suy luận của Agent, giải quyết tình trạng “chạy không tải” của GPU.

Mọi dấu hiệu cho thấy, mô hình hàng đầu DeepSeek sắp ra mắt có khả năng cao sẽ tích hợp khả năng tạo văn bản, hình ảnh và video, tham số mô hình trên nghìn tỷ.

Đồng thời sử hữu năng lực ghi nhớ, sử dụng công cụ, lập trình, học tập mạnh mẽ và hỗ trợ tốt cho Agent.

Một trọng trách khác của V4 là thích ứng với năng lực tính toán nội địa Trung Quốc. Có thông tin cho rằng DeepSeek đã ưu tiên mở quyền truy cập sớm cho các nhà sản xuất chip trong nước (như Huawei) để tối ưu hóa sâu.

Nếu V4 có thể chạy ổn định và đạt hiệu suất hàng đầu thế giới trên chip nội địa, đó sẽ là đòn giáng mạnh mẽ vào thế độc quyền của Nvidia, đồng thời củng cố an ninh công nghệ cho Trung Quốc.

DeepSeek cần dẫn đầu trong việc thực thi một định luật quy mô (Scaling Law) mới. Đó là dùng mô hình nhỏ đạt được năng lực của mô hình lớn thế hệ trước.

Bên cạnh đó, Deepseek cũng cần trí tuệ đường (Sugar Intelligence). Điều này có nghĩa là các mô hình 1B-8B chạy mượt trên điện thoại, phổ cập AI đến mọi người dùng.

Đồng thời, nền tảng này cũng cần trí tuệ nguyên lực (Force Intelligence). Đó là các mô hình nghìn tỷ tham số phục vụ nghiên cứu khoa học, tài chính và các nhiệm vụ siêu nặng, tạo ra giá trị thặng dư cao.

Năm 2026 là năm của sự chuyển mình từ “trận chiến mô hình” sang “trận chiến hệ sinh thái”. Thế giới không chỉ cần một chatbot mạnh hơn, mà cần một hệ điều hành trí tuệ tự chủ.

DeepSeek đã im lặng đủ lâu. Sự trở lại của V4 và R2 trong tương lai không chỉ là một đợt cập nhật sản phẩm, mà là lời khẳng định về vị thế của AI Trung Quốc trên bản đồ thế giới.

Giới công nghệ ở Trung Quốc rất hy vọng sự “im hơi lặng tiếng” một năm qua của Deepseek chính là sự chuẩn bị cho một sự bùng nổ đủ mạnh để định hình lại kỷ nguyên thông minh.

*Nguồn Huxiu

DeepSeek V4 trở lại sau 1 năm ở ẩn: "Cú tát" vào thế độc quyền của Nvidia và lời cảnh báo đanh thép tới OpenAI

Bạn đọc liên hệ quảng cáo xin vui lòng để lại thông tin