Khi mọi hãng chip đều muốn gắn nhãn “agentic AI”

Trong làn sóng AI mới, ngày càng nhiều hãng bán dẫn cố thuyết phục thị trường rằng các “AI agent” hay “tác tử AI” cần một dòng CPU hoàn toàn mới. Arm gọi mẫu silicon trung tâm dữ liệu đầu tiên của mình là “AGI CPU”, Nvidia mô tả Vera là “CPU cho agent”, còn AWS cũng liên tục gắn Graviton 5 với thông điệp phục vụ AI tác tử. Tuy nhiên, đằng sau lớp vỏ tiếp thị đó, bản chất của các con chip này không phải là một phát minh hoàn toàn mới. Chúng vẫn là CPU đa dụng, tức bộ xử lý mục đích chung có thể chạy nhiều loại phần mềm khác nhau, chỉ được điều chỉnh để phù hợp hơn với một số kiểu tải công việc AI hiện đại.

AI agent thực ra không phải một loại tải công việc duy nhất

Điểm gây nhầm lẫn lớn nhất nằm ở khái niệm “AI agent”. Đây không phải một ứng dụng đơn lẻ hay một chuẩn tác vụ thống nhất. Nói ngắn gọn, AI agent là lớp trung gian cho phép mô hình AI tương tác với công cụ, phần mềm hoặc quy trình sẵn có để tự động hoàn thành công việc. Vì vậy, khi một agent hoạt động, nó có thể gọi cơ sở dữ liệu, truy cập ứng dụng doanh nghiệp, điều phối tác vụ web, hay xử lý quy trình nội bộ giống như nhiều phần mềm đã tồn tại hàng chục năm. Điều đó đồng nghĩa nhu cầu phần cứng của agent cũng rất đa dạng, không thể gom vào một công thức CPU duy nhất.

Vì sao không thể có một “CPU cho mọi agent”

Mỗi tải công việc trong trung tâm dữ liệu lại ưu tiên một đặc tính khác nhau. Có tác vụ hưởng lợi từ băng thông bộ nhớ cao, tức tốc độ dữ liệu di chuyển giữa bộ nhớ và CPU lớn hơn. Có tác vụ cần bộ nhớ đệm hợp nhất dung lượng lớn, hay còn gọi là unified cache, để giảm thời gian truy xuất dữ liệu lặp lại. Một số ứng dụng cần xung nhịp cao, tức tốc độ xử lý của từng lõi mạnh hơn, trong khi số khác lại cần thật nhiều lõi để chạy song song. Đây là lý do AMD và Intel từ lâu đã không sản xuất chỉ một mẫu Epyc hay Xeon duy nhất. Trong thế giới máy chủ, tối ưu cho một mục tiêu thường đồng nghĩa phải đánh đổi ở mục tiêu khác.

Nvidia Vera: ưu tiên độ trễ thấp và luồng dữ liệu giữa CPU với GPU

Nếu nhìn vào Vera của Nvidia, có thể thấy hãng này theo đuổi một triết lý rất cụ thể. Con chip 88 lõi được quảng bá với hiệu năng đơn luồng cao, tức khả năng xử lý mạnh trên từng luồng tác vụ riêng lẻ, đi cùng dung lượng bộ nhớ và băng thông kết nối lớn. Theo Nvidia, đây là cách để giảm độ trễ, tức thời gian chờ từ lúc yêu cầu được gửi đi đến khi hệ thống phản hồi. Trong bối cảnh agent thường đứng cạnh GPU đắt đỏ, việc CPU không trở thành nút thắt cổ chai là điều cực kỳ quan trọng. Nói cách khác, Vera không phải “CPU thần kỳ cho AI”, mà là bộ xử lý được thiết kế để phục vụ tốt cho hệ thống nơi CPU phải liên tục cấp dữ liệu cho GPU, bộ xử lý chuyên tăng tốc các phép toán AI.

Arm AGI CPU và Graviton 5: tối giản tính năng, tối đa hiệu quả điện năng

Ở phía Arm, cái tên “AGI CPU” nghe rất tham vọng, nhưng cấu trúc thực tế lại gần với một CPU máy chủ truyền thống dựa trên kiến trúc Neoverse V3. Kiến trúc này là nền tảng lõi xử lý dành cho hạ tầng đám mây và trung tâm dữ liệu. Phiên bản 136 lõi của Arm được cho là đã lược bớt những thành phần mà tác tử AI ít cần đến để giảm điện năng tiêu thụ, chẳng hạn không dùng simultaneous multithreading, hay SMT, công nghệ cho phép một lõi xử lý nhiều luồng cùng lúc; hạn chế các phần mở rộng vector, tức các tập lệnh tăng tốc xử lý dữ liệu theo mảng; và không tích hợp bộ tăng tốc chuyên dụng. Đổi lại, chip được nhấn mạnh ở băng thông bộ nhớ cao. Graviton 5 của AWS với 192 lõi cũng đi theo hướng tương tự, thậm chí còn mang tính đa dụng hơn, cho thấy đây chủ yếu là các biến thể tối ưu hóa của CPU máy chủ Arm chứ không phải một lớp chip AI hoàn toàn mới.

AMD và Intel phản công: quy mô song song mới là thước đo quan trọng

Không đứng ngoài cuộc, Intel và AMD cũng nhanh chóng định vị lại các dòng Xeon và Epyc của mình như nền tảng lý tưởng cho AI agent. Intel từng trình diễn thiết kế rack tham chiếu chứa tới 36.864 lõi x86 trong mức điện năng 100 kW. Rack là tủ máy chủ tiêu chuẩn trong trung tâm dữ liệu, còn x86 là kiến trúc CPU phổ biến của Intel và AMD. Trong khi đó, AMD cho rằng khi triển khai agent ở quy mô lớn, yếu tố đáng quan tâm hơn độ trễ đơn lẻ là concurrency, tức khả năng xử lý đồng thời thật nhiều yêu cầu cùng lúc. Theo dự phóng của AMD, dòng Venice Epyc 256 lõi sắp ra mắt có thể mang lại throughput, tức thông lượng hay tổng khối lượng công việc xử lý được, cao hơn đáng kể trên mỗi rack so với Vera trong cùng giới hạn điện năng.

Benchmark ban đầu cho thấy không có người chiến thắng tuyệt đối

Các kết quả benchmark, tức phép đo hiệu năng tiêu chuẩn, ban đầu của Vera cũng củng cố quan điểm rằng không tồn tại một CPU “thống trị tất cả”. Trong các thử nghiệm sớm do Phoronix thực hiện, Vera đạt điểm trung bình hình học, hay geo-mean, cao hơn 10% so với AMD Epyc 9575F 128 lõi và cao hơn 55% so với Intel Xeon 6980P 128 lõi. Geo-mean là cách tính trung bình thường dùng trong benchmark để tránh một vài bài test quá cao hoặc quá thấp làm méo kết quả tổng thể. Dù vậy, khi soi kỹ từng ứng dụng, Vera không vượt trội đồng đều ở mọi tình huống. Điều này phản ánh đúng bản chất của thị trường máy chủ: mỗi loại ứng dụng đều có hồ sơ tài nguyên riêng, nên một con chip rất mạnh ở nhóm tác vụ này chưa chắc tối ưu ở nhóm khác.

Kết luận: đừng để thuật ngữ tiếp thị đánh lừa

Thông điệp quan trọng nhất từ cuộc tranh luận hiện nay là: AI agent không tạo ra nhu cầu cho một chủng loại CPU hoàn toàn mới. Chúng chỉ làm nổi bật hơn những bài toán tối ưu vốn đã tồn tại lâu nay trong trung tâm dữ liệu, từ băng thông bộ nhớ, số lõi, xung nhịp, bộ nhớ đệm đến mức tiêu thụ điện và khả năng phối hợp với GPU. Khi chu kỳ cường điệu AI bước sang giai đoạn “agentic”, tức tập trung vào các hệ thống AI có thể tự hành động nhiều bước, thị trường sẽ còn chứng kiến thêm nhiều cái tên hào nhoáng. Nhưng về kỹ thuật, đây vẫn là câu chuyện quen thuộc của CPU đa dụng được tinh chỉnh cho từng kiểu tải công việc, chứ không phải sự ra đời của một “CPU tác tử AI” đúng nghĩa.

Danh mục máy quét mã vạch

Máy quét mã vạch - Quét mã Qr - Quét mã vạch sản phẩm.

DÒNG MÁY CÓ DÂY

máy quét mã vạch không dây

DÒNG MÁY KHÔNG DÂY

DÒNG MÁY KIỂM KHO PDA

DÒNG MÁY FITMOUNT