Nvidia đặt cược lớn vào AI tác nhân trong siêu máy tính

Tại sự kiện ISC High Performance 2026 ở Hamburg, Đức, Nvidia nhấn mạnh rằng tương lai của điện toán khoa học sẽ không chỉ dựa vào mô phỏng truyền thống, mà còn kết hợp với “agentic AI” – hay AI tác nhân, một dạng trí tuệ nhân tạo có thể tự chủ thực hiện chuỗi nhiệm vụ phức tạp thay vì chỉ trả lời câu hỏi. Theo Nvidia, đây là bước chuyển từ AI như một công cụ hỗ trợ sang AI như một hệ thống có thể hành động, lập kế hoạch và phối hợp nhiều tác vụ nghiên cứu gần như một “đồng nghiệp khoa học số”.

Siêu máy tính mới sẽ kết nối AI, mô phỏng và phân tích dữ liệu trong một quy trình

Nvidia cho rằng để AI tác nhân thực sự hữu ích cho khoa học, ngành này cần một “ngăn xếp điện toán khoa học” mới, tức một tập hợp phần cứng và phần mềm được thiết kế đồng bộ. Trong mô hình đó, các tác nhân AI có thể gọi bộ mô phỏng, mô hình thay thế và công cụ phân tích để lên kế hoạch thí nghiệm, viết mã, chạy mô phỏng và xử lý dữ liệu trong cùng một quy trình làm việc. “Mô hình thay thế” ở đây là các mô hình AI được huấn luyện để bắt chước kết quả mô phỏng vật lý phức tạp nhưng chạy nhanh hơn rất nhiều, giúp rút ngắn đáng kể thời gian nghiên cứu.

Los Alamos sẽ vận hành những siêu máy tính AI tác nhân đầu tiên

Theo Nvidia, hai hệ thống Mission và Vision tại Phòng thí nghiệm Quốc gia Los Alamos (LANL) của Mỹ sẽ trở thành những siêu máy tính AI tác nhân đầu tiên trên thế giới khi đi vào hoạt động. Mục tiêu là để các nhà khoa học có thể làm việc cùng các “co-scientist” AI – tức trợ lý nghiên cứu tự động – có khả năng đọc lượng lớn tài liệu khoa học, ghi nhớ chi tiết, kết nối với công cụ mô phỏng và hỗ trợ triển khai thí nghiệm ở quy mô mà con người khó tự mình đảm đương.

Vera Rubin và Grace Blackwell là nền tảng phần cứng trung tâm

Để phục vụ tham vọng này, Nvidia đặt Vera Rubin và Grace Blackwell vào trung tâm của thế hệ siêu máy tính mới. Vera Rubin là nền tảng xử lý kế nhiệm, còn Grace Blackwell là kiến trúc kết hợp CPU và GPU cho các tác vụ AI và HPC. HPC, viết tắt của High Performance Computing, là điện toán hiệu năng cao – lĩnh vực dùng các hệ thống cực mạnh để giải các bài toán khoa học, kỹ thuật và mô phỏng quy mô lớn. Nvidia cho biết một rack Vera Rubin NVL sẽ chứa tối đa 144 GPU và đạt 5 petaFLOPS hiệu năng FP64. FP64 là phép tính dấu chấm động độ chính xác kép, tiêu chuẩn rất quan trọng trong nghiên cứu khoa học vì đảm bảo độ chính xác số học cao. Một petaFLOPS tương đương một triệu tỷ phép tính mỗi giây.

Băng thông bộ nhớ và mạng tốc độ cao trở thành yếu tố sống còn

Nvidia đặc biệt nhấn mạnh rằng nhiều tác vụ HPC không chỉ phụ thuộc vào sức mạnh xử lý, mà còn bị giới hạn bởi khả năng truy cập dữ liệu trong bộ nhớ. Vì vậy, Vera Rubin được quảng bá có băng thông bộ nhớ cao hơn 2,8 lần so với Blackwell, sử dụng 41 TB bộ nhớ HBM4 trên mỗi rack để đạt tốc độ truyền dữ liệu lên tới 3 petabyte/giây. HBM4 là thế hệ bộ nhớ băng thông cao mới, được xếp chồng theo chiều dọc để tăng tốc độ truy xuất dữ liệu cho GPU. Bên cạnh đó, Nvidia còn sử dụng Quantum InfiniBand – một công nghệ mạng độ trễ thấp, băng thông cao, thường được dùng để kết nối các nút trong siêu máy tính nhằm giảm thời gian chờ khi truyền dữ liệu giữa hàng nghìn bộ xử lý.

Ba công cụ phần mềm mới nhắm vào hóa học, thiết bị khoa học và thiên văn học

Ở lớp phần mềm, Nvidia giới thiệu ba nền tảng mới gồm ALCHEMI, DAQIRI và cuPhoton. ALCHEMI được định vị là bộ công cụ chuyên biệt theo lĩnh vực cho khám phá hóa học và vật liệu, sử dụng vi dịch vụ BGR để mô phỏng hàng triệu phân tử và cấu trúc. “Vi dịch vụ” là cách chia phần mềm thành các thành phần nhỏ, độc lập, giúp dễ mở rộng và kết hợp trong các quy trình nghiên cứu lớn. Với ALCHEMI, Nvidia muốn tăng tốc quá trình tìm vật liệu mới hoặc hợp chất tiềm năng bằng AI và mô phỏng.

DAQIRI nhắm tới dữ liệu thời gian thực từ các thiết bị khoa học thế hệ mới

Công cụ DAQIRI được thiết kế cho các thiết bị khoa học hiện đại, nơi cảm biến tạo ra dòng dữ liệu khổng lồ theo thời gian thực. Nvidia cho biết nền tảng này có thể nối trực tiếp cảm biến với các điểm suy luận AI thời gian thực. “Suy luận AI” là giai đoạn mô hình đã huấn luyện được dùng để đưa ra dự đoán hoặc quyết định trên dữ liệu mới. Tại thí nghiệm ATLAS ở CERN, nơi nghiên cứu va chạm hạt năng lượng cao, thông thường chỉ dưới 2% dữ liệu va chạm có thể được lưu lại do giới hạn hạ tầng. Nvidia nói DAQIRI bổ sung một chuỗi kích hoạt AI tăng tốc bằng GPU, trong đó FPGA xử lý định tuyến độ trễ thấp còn GPU chạy mô hình học sâu để chọn lọc thêm nhiều dữ liệu giá trị. FPGA là chip có thể lập trình lại sau sản xuất, rất phù hợp cho các tác vụ cần phản ứng cực nhanh.

cuPhoton hướng tới bài toán dữ liệu thiên văn ở quy mô petabyte

Trong khi đó, cuPhoton được xây dựng để xử lý khối dữ liệu khổng lồ từ camera khoa học và kính thiên văn. Nvidia cho biết công cụ này có thể giúp các nhà nghiên cứu phân tích tập dữ liệu vũ trụ ở quy mô petabyte chỉ trong vài phút thay vì vài tháng. Một petabyte tương đương khoảng một triệu gigabyte, tức quy mô dữ liệu vượt xa khả năng xử lý của hạ tầng thông thường. Trong thử nghiệm với 32 siêu chip Grace Blackwell mô phỏng dữ liệu từ Đài quan sát Rubin, cuPhoton được cho là tải và đọc ảnh nhanh hơn 15.000 lần, đồng thời tăng tốc xử lý tín hiệu và phân tích lên tới 8.000 lần.

Cấu hình các hệ thống Mission, Vision và Veritas cho thấy quy mô đầu tư cực lớn

Nvidia tiết lộ Mission tại LANL sẽ dùng tới 2.160 GPU Rubin cùng 1.080 CPU Vera, trong khi Vision có 1.298 GPU Rubin và 648 CPU Vera. Ngoài ra còn có hệ thống Veritas vừa được công bố tại ISC, trang bị 576 GPU Rubin và 288 CPU Vera. CPU là bộ xử lý trung tâm, thường đảm nhận điều phối tác vụ tổng quát, còn GPU là bộ xử lý đồ họa nhưng nay được dùng rộng rãi cho AI và mô phỏng nhờ khả năng xử lý song song cực mạnh.

Nvidia: AI tác nhân không bắt buộc cho khoa học, nhưng có thể mở rộng năng lực nghiên cứu vượt con người

Dù quảng bá mạnh mẽ, Nvidia cũng thừa nhận AI tác nhân không phải điều kiện bắt buộc để làm khoa học. Tuy nhiên, hãng cho rằng công nghệ này có thể trở thành công cụ giúp nghiên cứu diễn ra ở quy mô mà các nhà khoa học con người khó tự thực hiện. Theo lập luận của Nvidia, các tác nhân AI không cần nghỉ ngơi, có thể đọc hàng nghìn đến hàng triệu bài báo kỹ thuật, ghi nhớ chi tiết và thậm chí thể hiện hiểu biết ở cấp độ chuyên gia trong nhiều lĩnh vực khác nhau, từ vật lý thiên văn đến động vật học. Tầm nhìn của hãng là mỗi nhà khoa học sẽ có một “đội” tác nhân AI làm việc liên tục 24/7.

Mô hình nền tảng và LLM sẽ là lớp trí tuệ đứng sau các tác nhân

Để các tác nhân AI hoạt động, Nvidia cho biết chúng cần dựa trên “foundation models” – mô hình nền tảng được huấn luyện trên lượng dữ liệu rất lớn để có thể thích nghi với nhiều nhiệm vụ khác nhau – cùng với LLM, tức mô hình ngôn ngữ lớn, vốn chuyên xử lý và tạo văn bản. Các mô hình này chạy trên CPU nhưng khi cần kết nối đến công cụ mô phỏng, phân tích hoặc học sâu hiệu năng cao, GPU sẽ đóng vai trò then chốt để đạt tốc độ và hiệu quả tối đa.

Châu Âu nổi lên như điểm nóng mới của siêu máy tính dùng công nghệ Nvidia

Nvidia cũng cho rằng châu Âu đang trở thành trung tâm tăng trưởng mới của HPC, với 35 siêu máy tính mới được đưa vào hoạt động trong năm qua và đều sử dụng công nghệ của hãng. Danh sách này bao gồm Jupiter – hệ thống exascale của châu Âu, MareNostrum 5 tại Trung tâm Siêu máy tính Barcelona, Blue Swan của Bavaria AI, HammerHAI tại Đại học Stuttgart và hệ thống của CINECA tại Italy. “Exascale” là cấp độ siêu máy tính có thể đạt ít nhất một exaFLOPS, tức một tỷ tỷ phép tính mỗi giây, đánh dấu cột mốc quan trọng trong năng lực tính toán toàn cầu.

Tham vọng lớn, nhưng cũng đặt ra câu hỏi về tương lai của nghiên cứu khoa học

Thông điệp lớn nhất từ Nvidia không chỉ là ra mắt phần cứng mới, mà là nỗ lực tái định nghĩa cách khoa học được tiến hành trong kỷ nguyên AI. Nếu tầm nhìn này thành hiện thực, phòng thí nghiệm tương lai có thể không chỉ gồm các nhà nghiên cứu và máy móc, mà còn có cả những tác nhân AI tự động đọc tài liệu, đề xuất giả thuyết, chạy mô phỏng và sàng lọc dữ liệu theo thời gian thực. Dù vậy, câu hỏi còn bỏ ngỏ là mức độ tự chủ nào nên được trao cho AI trong khoa học, và liệu các nhà nghiên cứu có sẵn sàng dựa vào những “đồng nghiệp số” để đưa ra khám phá quan trọng hay không.

Danh mục máy quét mã vạch

Máy quét mã vạch - Quét mã Qr - Quét mã vạch sản phẩm.

DÒNG MÁY CÓ DÂY

máy quét mã vạch không dây

DÒNG MÁY KHÔNG DÂY

DÒNG MÁY KIỂM KHO PDA

DÒNG MÁY FITMOUNT