Siêu máy tính Mỹ có thể sắp rời xa GPU: Sandia thử nghiệm chip dữ liệu Maverick-2 cho các mô phỏng khoa học siêu chính xác View Larger Image Khi GPU không còn là lựa chọn mặc định cho siêu máy tínhTrong nhiều năm qua, GPU – bộ xử lý đồ họa nay được dùng rộng rãi để tăng tốc tính toán – gần như thống trị thế giới siêu máy tính. Hiện 9 trong 10 hệ thống mạnh nhất thế giới đều dựa vào GPU. Tuy nhiên, xu hướng đó có thể bắt đầu thay đổi khi các phòng thí nghiệm quốc gia của Mỹ tìm kiếm phần cứng phù hợp hơn cho các bài toán khoa học cần độ chính xác cực cao, đặc biệt là FP64, tức phép toán dấu phẩy động 64-bit, chuẩn tính toán quan trọng trong mô phỏng vật lý, khí động học hay hạt nhân. NextSilicon nổi lên với Maverick-2, con chip không đi theo lối mònMột trong những ứng viên đáng chú ý là startup NextSilicon với bộ tăng tốc Maverick-2. Khác với GPU truyền thống, Maverick-2 được thiết kế riêng cho HPC, viết tắt của high-performance computing, tức tính toán hiệu năng cao. Đây là lĩnh vực chuyên xử lý các mô phỏng khoa học, kỹ thuật và quốc phòng ở quy mô cực lớn. Theo thông tin mới công bố, Phòng thí nghiệm quốc gia Sandia đã hoàn tất quá trình nghiệm thu hệ thống Spectra, siêu máy tính thử nghiệm sử dụng chip của NextSilicon, mở đường cho khả năng triển khai ở các hệ thống lớn hơn trong tương lai. Spectra nhỏ về quy mô, lớn về ý nghĩaSo với các siêu máy tính exascale như Frontier hay El Capitan, Spectra khá khiêm tốn. Hệ thống chỉ có 64 nút tính toán và 128 bộ tăng tốc của NextSilicon. Exascale là cấp độ siêu máy tính có thể thực hiện ít nhất một tỷ tỷ phép tính mỗi giây. Dù vậy, mục tiêu của Spectra không phải là phá kỷ lục hiệu năng, mà là làm bệ thử cho Maverick-2 trong môi trường thực tế. Việc Sandia xác nhận hệ thống đáp ứng đầy đủ yêu cầu nghiệm thu cho thấy kiến trúc chip này đã vượt qua cột mốc quan trọng về độ ổn định và khả năng vận hành. Kiến trúc dataflow là gì và vì sao nó khác GPUĐiểm khác biệt lớn nhất của Maverick-2 nằm ở kiến trúc dataflow có thể tái cấu hình, thay vì kiến trúc von Neumann vốn là nền tảng phổ biến của CPU và GPU hiện nay. Với kiến trúc von Neumann, dữ liệu và lệnh thường phải liên tục di chuyển giữa bộ nhớ và đơn vị tính toán, tạo ra độ trễ và tiêu tốn năng lượng. Còn dataflow, hay luồng dữ liệu, tổ chức việc tính toán theo dạng đồ thị, nơi mỗi khối xử lý chỉ thực hiện tác vụ cụ thể khi dữ liệu đi tới. NextSilicon cho biết hai die tính toán của Maverick-2 được cấu thành từ mạng lưới các ALU, tức đơn vị số học và logic, liên kết với nhau như một đồ thị. Mỗi ALU có thể được cấu hình lúc chạy để làm phép cộng, nhân hoặc tác vụ logic khác. Khi dữ liệu đến công đoạn kế tiếp trong pipeline, tức chuỗi xử lý liên tiếp, phép tính được thực hiện ngay mà không phải chờ các thao tác load-store chuyển dữ liệu qua lại như trên kiến trúc truyền thống. Lời hứa về hiệu năng FP64 và hiệu quả điện năngTheo NextSilicon, cách tiếp cận này giúp tăng đáng kể hiệu năng và hiệu suất năng lượng trong các tải công việc thực tế. Công ty cho biết một chip Maverick-2 có thể đạt khoảng 600 gigaFLOPS FP64 trên HPCG, tức bài kiểm tra High Performance Conjugate Gradient, benchmark thường được xem là phản ánh sát hơn hiệu năng thực tế của siêu máy tính so với một số phép đo lý tưởng. Startup này tuyên bố mức hiệu năng đó tương đương các GPU hàng đầu nhưng chỉ tiêu thụ khoảng một nửa điện năng. Dù chưa có số liệu benchmark ở cấp toàn hệ thống cho Spectra, đây vẫn là tín hiệu đáng chú ý trong bối cảnh điện năng đang trở thành giới hạn lớn của siêu máy tính hiện đại. Bài toán khó nhất không phải phần cứng mà là phần mềmKiến trúc dataflow không phải mới. Các công ty như Groq, Cerebras và SambaNova cũng đã xây chip theo hướng này, nhưng chủ yếu phục vụ AI, bao gồm huấn luyện và suy luận mô hình. Điều khiến dataflow khó phổ biến là lập trình rất phức tạp. Đó cũng là lý do nhiều hãng chọn cung cấp dịch vụ trọn gói thay vì bán máy chủ thuần phần cứng. NextSilicon tuyên bố đã giải quyết nút thắt này bằng một trình biên dịch có thể hỗ trợ các mã nguồn hiện có viết bằng C, Python, Fortran hoặc CUDA. CUDA là nền tảng lập trình song song nổi tiếng của Nvidia. Theo mô tả, hệ thống trước tiên chạy khối lượng công việc trên CPU để ghi lại đồ thị tính toán, sau đó ánh xạ đồ thị đó lên chip Maverick-2 và tối ưu để đạt hiệu năng cao nhất. Nếu làm được như quảng bá, đây sẽ là lợi thế lớn vì giới HPC thường không muốn viết lại toàn bộ phần mềm đã tích lũy suốt hàng chục năm. Sandia đã kiểm chứng những gìTại Spectra, Sandia đã xác thực chip NextSilicon trên ba nhóm tải công việc quan trọng: HPCG, bộ kiểm thử động lực học phân tử LAMMPS và bộ mô phỏng Monte Carlo Sparta. Động lực học phân tử là phương pháp mô phỏng chuyển động của nguyên tử và phân tử theo thời gian, rất quan trọng trong khoa học vật liệu và hóa học. Còn Monte Carlo là kỹ thuật mô phỏng dùng số ngẫu nhiên để ước lượng các hệ thống phức tạp. Việc vượt qua các bài kiểm tra này cho thấy Maverick-2 không chỉ phù hợp với benchmark mà còn có tiềm năng xử lý các ứng dụng khoa học thực tế. Cơn sốt AI đang thay đổi cách GPU được thiết kếSự xuất hiện của Maverick-2 diễn ra đúng lúc thị trường GPU đang bị AI định hình mạnh mẽ. Nvidia, hãng dẫn đầu lĩnh vực này, ngày càng ưu tiên hiệu năng cho AI hơn là tính toán FP64 thuần túy. Dòng GPU Rubin sắp ra mắt được quảng bá có băng thông bộ nhớ rất lớn và hiệu năng tới 50 petaFLOPS ở FP4, tức định dạng dấu phẩy động 4-bit cực thấp, phù hợp cho suy luận và huấn luyện AI nơi tốc độ và mật độ tính toán được ưu tiên. Tuy nhiên, đổi lại, hiệu năng vector và ma trận FP64 phần cứng của Rubin chỉ ở mức 33 teraFLOPS, thấp hơn cả H100 ra mắt từ gần bốn năm trước. FP64 giả lập: giải pháp thông minh nhưng không phải thuốc chữa bách bệnhĐể bù lại điểm yếu FP64, Nvidia đang dựa vào một biến thể của phương pháp Ozaki. Đây là kỹ thuật dùng dữ liệu độ chính xác thấp hơn để mô phỏng phép tính độ chính xác cao hơn, nhằm tạo ra hiệu năng FP64 ma trận tốt hơn trên phần cứng vốn tối ưu cho AI. Theo Nvidia, Rubin có thể đạt tới 200 teraFLOPS FP64 cho các tác vụ ma trận bằng cách này. Tuy nhiên, FP64 giả lập không phải lúc nào cũng hiệu quả. Nó có thể hữu ích với một số khối lượng công việc HPC thiên về ma trận, như High Performance Linpack hay HPL, benchmark truyền thống dùng để xếp hạng siêu máy tính. Nhưng với các bài toán nặng về vector, chẳng hạn động lực học chất lỏng tính toán, lợi ích có thể rất hạn chế. Đây cũng chính là loại tải công việc mà NextSilicon đang nhắm tới. AMD chọn chiến lược cân bằng hơnKhông giống Nvidia, AMD dường như vẫn duy trì chỗ đứng rõ ràng cho HPC bên cạnh AI. Dòng MI455X mới của hãng cũng được tinh chỉnh cho huấn luyện và suy luận AI, nhưng AMD đồng thời phát triển những biến thể khác phục vụ tính toán khoa học. Đáng chú ý, MI430X được cho là thay các die tối ưu cho AI bằng các die chuyên cho HPC. Theo thông tin được công bố gần đây, mẫu chip này có thể đạt tới 200 teraFLOPS FP64 đỉnh và sẽ được triển khai trong các siêu máy tính Discovery của Bộ Năng lượng Mỹ và Alice Recoque tại châu Âu. Mỹ không phải bên duy nhất tìm cách thoát phụ thuộc GPUTrong khi NextSilicon còn phải chứng minh khả năng mở rộng lên các hệ thống lớn, Trung Quốc đã nhiều lần cho thấy họ có thể xây siêu máy tính mạnh mà không cần GPU phương Tây. Quốc gia này có lịch sử phát triển silicon tùy biến cho mục tiêu siêu máy tính quốc gia. Sunway TaihuLight từng dùng bộ xử lý manycore, tức chip có rất nhiều lõi xử lý đơn giản, do Trung Quốc tự phát triển. Tianhe-2A lại sử dụng Matrix 2000, một bộ xử lý tín hiệu số hay DSP, viết tắt của digital signal processor, để đảm nhiệm tính toán FP64. Gần đây, giới quan sát còn nhắc đến hệ thống LineShine, được cho là dùng khoảng 47.000 CPU tùy biến và có thể đạt 2 exaFLOPS FP64. ExaFLOPS là đơn vị đo hiệu năng ở cấp một tỷ tỷ phép tính dấu phẩy động mỗi giây. Địa chính trị, chuỗi cung ứng và áp lực từ thị trường AILý do Trung Quốc theo đuổi silicon riêng một phần đến từ các hạn chế thương mại của Mỹ đối với bộ tăng tốc cao cấp. Ngay cả khi một số dòng chip vẫn có thể bán hợp pháp, nguồn cung cũng trở thành điểm yếu chiến lược. Trước đây, quyết định của Washington ngăn Intel bán Xeon Phi cho Trung Quốc từng thúc đẩy sự ra đời của Matrix 2000. Còn tại Mỹ, thách thức lại mang màu sắc thị trường hơn: AI đang mang lại doanh thu khổng lồ, khiến các hãng thiết kế chip ưu tiên những sản phẩm phục vụ mô hình ngôn ngữ lớn và trung tâm dữ liệu AI. So với đó, HPC vẫn rất quan trọng về mặt khoa học và an ninh quốc gia, nhưng là một thị trường ngách hơn nhiều. Một tín hiệu sớm cho tương lai hậu độc tôn GPUViệc Sandia bật đèn xanh cho Spectra chưa đủ để khẳng định Maverick-2 sẽ trở thành nền tảng chủ lực tiếp theo của siêu máy tính Mỹ. Nhưng nó cho thấy một thực tế ngày càng rõ: khi GPU ngày càng nghiêng về AI, thế giới HPC đang mở cửa cho những kiến trúc mới, từ dataflow đến các chip chuyên dụng cho FP64. Nếu NextSilicon chứng minh được khả năng mở rộng, độ ổn định và lợi thế điện năng ở quy mô lớn, thị trường siêu máy tính có thể bước vào giai đoạn đa dạng kiến trúc hơn, nơi GPU không còn là đáp án duy nhất cho mọi bài toán tính toán hiệu năng cao. Mini PC – Máy Tính Công Nghiệp IPC AI PC – Máy tính AI Intel F1A | Intel Ultra 7 155H 14.500.000₫ Thêm vào giỏ hàng Details AI PC – Máy tính AI Intel F2A | Intel Ultra 7 155H 14.500.000₫ Thêm vào giỏ hàng Details Máy All In One cho văn phòng – PC Gaming – INTEL i5 12450H 8 lõi 12 luồng 15.500.000₫ Thêm vào giỏ hàng Details Máy all in one giá rẻ – PC Gaming – INTEL I5 10500H 6 lõi 12 luồng 13.700.000₫ Thêm vào giỏ hàng Details Máy tính AI – AI PC | Intel I9-12900H + Nvidia RTX3080 28.500.000₫ Thêm vào giỏ hàng Details Máy tính AI AMD AM18 | Ryzen 7 8845HS + Radeon 780M 14.500.000₫ Thêm vào giỏ hàng Details Máy tính AI PC M1A | Intel I9-13900H + Nvidia RTX-3080 28.500.000₫ Thêm vào giỏ hàng Details Máy tính All In One Optori G40 Pro – PC Gaming – INTEL i5 12450H 14.500.000₫ Thêm vào giỏ hàng Details Màn hình cảm ứng HMI – Panel PC Giải pháp HMI Panel PC chống cháy nổ cho nhà máy sản xuất hiện đại | HazardView HV-17EX-T Details Khi nào cần dùng Panel PC chống cháy nổ thay cho Panel PC công nghiệp thông thường? | HazardView HV-17EX Details Sale! Màn hình cảm ứng HMI – Touch Panel PC BE-PX09 15.6 Inch 19.500.000₫ Giá gốc là: 19.500.000₫.17.900.000₫Giá hiện tại là: 17.900.000₫. Thêm vào giỏ hàng Details Máy tính công nghiệp – Fanless Mini PC Công Nghiệp B8000 10.900.000₫ Thêm vào giỏ hàng Details Máy tính công nghiệp màn hình cảm ứng – Touch Panel HMI QY-P8156 15.6 Inch Details So sánh máy tính công nghiệp chống cháy nổ và máy tính công nghiệp tiêu chuẩn | HazardView HV-238EX Details Xu hướng ứng dụng màn hình HMI chống cháy nổ trong nhà máy thông minh | HazardView HV-19EX-R Details Danh mục máy quét mã vạchDÒNG MÁY CÓ DÂYDÒNG MÁY KHÔNG DÂYDÒNG MÁY KIỂM KHO PDADÒNG MÁY FITMOUNT admin2026-05-19T12:04:40+07:00 Related Posts New Zealand đặt cược lớn vào AI: dự kiến cắt 9.000 việc làm khu vực công, tương đương 14% biên chế New Zealand đặt cược lớn vào AI: dự kiến cắt 9.000 việc làm khu vực công, tương đương 14% biên chế Tháng 5 20th, 2026 CISA lộ kho GitHub công khai chứa mật khẩu, khóa riêng và token suốt 6 tháng CISA lộ kho GitHub công khai chứa mật khẩu, khóa riêng và token suốt 6 tháng Tháng 5 20th, 2026 Airbus đưa vào vận hành siêu máy tính mới theo mô hình HPC-as-a-service, tăng gấp 3 năng lực thiết kế máy bay Airbus đưa vào vận hành siêu máy tính mới theo mô hình HPC-as-a-service, tăng gấp 3 năng lực thiết kế máy bay Tháng 5 20th, 2026 X siết mạnh tài khoản miễn phí: người dùng chưa trả tiền chỉ còn 50 bài đăng gốc mỗi ngày X siết mạnh tài khoản miễn phí: người dùng chưa trả tiền chỉ còn 50 bài đăng gốc mỗi ngày Tháng 5 19th, 2026 Indra giành hợp đồng vé điện tử gần 1,96 tỷ bảng của TfL, Oyster chuẩn bị bước vào cuộc đại tu hệ thống hậu trường Indra giành hợp đồng vé điện tử gần 1,96 tỷ bảng của TfL, Oyster chuẩn bị bước vào cuộc đại tu hệ thống hậu trường Tháng 5 19th, 2026