Omni-Path bất ngờ tái xuất trong một siêu máy tính của Lawrence Livermore

Trong thế giới HPC (High-Performance Computing, tức điện toán hiệu năng cao dùng cho mô phỏng, khoa học và phân tích quy mô lớn), InfiniBand của Nvidia lâu nay gần như là lựa chọn thống trị cho kết nối mạng nội bộ giữa các nút tính toán. Tuy nhiên, một đối thủ cũ nay đang quay lại. Bộ Năng lượng Mỹ vừa đưa vào hoạt động cụm máy tính Lynx tại Phòng thí nghiệm Quốc gia Lawrence Livermore, và thành phần đáng chú ý nhất không phải bộ xử lý mà là công nghệ liên kết mạng Omni-Path từ Cornelis Networks, một công ty tách ra từ Intel.

Lynx không phải siêu máy tính lớn nhất, nhưng lựa chọn mạng của nó rất khác biệt

Lynx được xây dựng với 952 máy chủ Dell PowerEdge, sử dụng vi xử lý Intel Xeon Scalable thế hệ 4, còn có tên mã Sapphire Rapids. Đây không phải nền tảng CPU mới nhất, nhưng hệ thống được triển khai để bổ sung năng lực tính toán cho các tác vụ nhạy cảm của Cơ quan Quản lý An ninh Hạt nhân Quốc gia Mỹ. Điểm làm Lynx nổi bật là nó không dùng Slingshot 11 của HPE Cray hay InfiniBand của Nvidia, hai loại interconnect, tức công nghệ kết nối tốc độ cao giữa các nút trong siêu máy tính, đang phổ biến tại các hệ thống của Bộ Năng lượng Mỹ. Thay vào đó, Lynx sử dụng switch và NIC dòng CN5000 của Cornelis. NIC là card giao tiếp mạng, chịu trách nhiệm đưa dữ liệu ra vào máy chủ với độ trễ thấp và băng thông cao.

Omni-Path là gì và vì sao cái tên này quen thuộc

Omni-Path không phải công nghệ mới hoàn toàn. Intel từng phát triển nó từ năm 2015 cho các môi trường HPC, với mục tiêu tạo ra một kết nối lossless, nghĩa là hạn chế mất gói dữ liệu để phục vụ các ứng dụng cần truyền thông ổn định và đồng bộ cao. Về bản chất, Omni-Path được xem là một giải pháp cùng nhóm với InfiniBand, vốn nổi tiếng trong các cụm AI và siêu máy tính nhờ độ trễ thấp và khả năng mở rộng tốt. Trước đây, một số phòng thí nghiệm của Bộ Năng lượng Mỹ từng dùng Omni-Path, nhưng Intel dừng cuộc chơi vào năm 2019 trước khi mảng này được tách ra thành Cornelis Networks vào năm 2020.

Cornelis đưa Omni-Path trở lại với tốc độ 400 Gbps

Bước ngoặt diễn ra vào năm 2025 khi Cornelis giới thiệu dòng CN5000, bao gồm switch và NIC mới, hứa hẹn kết nối 400 Gbps. Gbps là gigabit mỗi giây, đơn vị đo băng thông mạng, và mức 400 Gbps hiện nằm trong nhóm rất cao đối với hạ tầng siêu máy tính. Công ty cho biết hệ thống của họ có thể đạt khả năng mở rộng gần tuyến tính, tức khi tăng số lượng nút tính toán thì hiệu năng mạng vẫn tăng gần tương ứng, thay vì bị nghẽn dần theo quy mô.

Vì sao Bộ Năng lượng Mỹ cần thêm một lựa chọn ngoài InfiniBand

Đối với các cơ quan nghiên cứu lớn, đa dạng hóa công nghệ mạng là vấn đề chiến lược. Phần lớn hệ thống Cray tại các phòng thí nghiệm của Bộ Năng lượng Mỹ hiện chạy ở mức 200 Gbps. Trong khi đó, InfiniBand về lý thuyết có thể hỗ trợ tốc độ cổng cao hơn, nhưng thị trường đang chứng kiến nhu cầu cực lớn từ các cụm AI, khiến nguồn cung và sự phụ thuộc vào một hệ sinh thái duy nhất trở thành bài toán cần cân nhắc. Việc Lynx dùng Omni-Path giúp cơ quan này có thêm một phương án thay thế cho các hệ thống không dựa trên Cray, đồng thời tiếp cận một trong những công nghệ liên kết nhanh nhất mà họ đang có.

Hiệu quả mở rộng 91% là con số Cornelis muốn cả ngành chú ý

Theo CEO Lisa Spelman của Cornelis, triển khai tại Lynx là minh chứng quan trọng cho thế hệ Omni-Path mới. Bà cho biết công ty đã đạt hiệu quả mở rộng mạng 91% trên cụm này. Trong bối cảnh siêu máy tính ngày càng có nhiều nút, mạng nội bộ thường trở thành nút thắt cổ chai, tức điểm giới hạn khiến tài nguyên xử lý không thể phát huy tối đa. Mức 91% cho thấy khi hệ thống tăng quy mô, phần hiệu năng giữ lại được vẫn rất cao. Cornelis thậm chí cho rằng nhờ liên kết mạng hiệu quả hơn, Lynx có thể vượt qua một số cụm cùng cỡ nhưng dùng bộ xử lý hiện đại hơn.

Không chỉ dừng ở Lynx: mục tiêu là 2.000, 5.000, thậm chí 10.000 nút

Cornelis cho biết Lynx sẽ không phải hệ thống cuối cùng dùng Omni-Path. Công ty đang làm việc với thêm nhiều dự án khác, trong đó có cả những hệ thống sử dụng các bộ tăng tốc không truyền thống. Bộ tăng tốc, hay accelerator, là phần cứng chuyên dụng như GPU hoặc các chip xử lý đặc biệt để tăng tốc một số tác vụ nhất định. Tham vọng của Cornelis là chứng minh công nghệ của họ có thể tiếp tục mở rộng lên các cụm 2.000, 5.000 rồi 10.000 nút mà vẫn duy trì hiệu năng mạng ở mức cao.

CN6000 và bước nhảy lên 800 Gbps đang được chuẩn bị

Cornelis cũng đang phát triển thiết bị 800 Gbps để ra mắt trong nửa cuối năm nay, đồng bộ với làn sóng CPU hỗ trợ PCIe Gen 6.0 từ Intel, AMD và các hãng khác. PCIe, viết tắt của Peripheral Component Interconnect Express, là chuẩn giao tiếp tốc độ cao giữa CPU và các thiết bị như card mạng hay GPU. Theo Cornelis, kết nối PCIe 5.0 hiện gần như giới hạn NIC truyền thống ở mức 400 Gbps. Một số hãng, bao gồm Nvidia, xử lý bài toán này bằng cách tích hợp thêm switch PCIe cỡ lớn ngay trên NIC để mở rộng băng thông, nhưng cách làm đó làm tăng chi phí và độ phức tạp hệ thống.

Hỗ trợ Ethernet có thể là quân bài mở rộng hệ sinh thái

Dòng CN6000 dự kiến không chỉ tăng tốc độ mà còn bổ sung hỗ trợ Ethernet. Đây là điểm quan trọng vì Ethernet là công nghệ mạng phổ biến nhất trong hạ tầng CNTT doanh nghiệp và trung tâm dữ liệu. Nếu Omni-Path có thể tương thích tốt hơn với các mạng hiện hữu thông qua Ethernet, Cornelis sẽ có cơ hội mở rộng ra ngoài thị trường HPC thuần túy, nơi các yêu cầu về tích hợp và khả năng tương thích ngày càng được coi trọng.

Một tín hiệu mới cho cuộc đua mạng siêu máy tính

Sự xuất hiện của Omni-Path tại Lynx cho thấy thị trường mạng cho siêu máy tính vẫn còn chỗ cho các đối thủ mới hoặc các công nghệ tưởng như đã rời sân khấu. Trong bối cảnh AI bùng nổ khiến chuỗi cung ứng hạ tầng mạng cao cấp ngày càng căng thẳng, một giải pháp 400 Gbps có hiệu quả mở rộng tốt và lộ trình lên 800 Gbps có thể tạo ra sức hút đáng kể. Với Lynx, Cornelis không chỉ giành được một hợp đồng triển khai thực tế, mà còn có trong tay một bài kiểm tra uy tín từ một trong những khách hàng khó tính nhất thế giới HPC.

Danh mục máy quét mã vạch

Máy quét mã vạch - Quét mã Qr - Quét mã vạch sản phẩm.

DÒNG MÁY CÓ DÂY

máy quét mã vạch không dây

DÒNG MÁY KHÔNG DÂY

DÒNG MÁY KIỂM KHO PDA

DÒNG MÁY FITMOUNT