Alibaba giới thiệu CPU máy chủ RISC-V mới cho kỷ nguyên AI

Alibaba vừa công bố XuanTie C950, con chip máy chủ mới mà hãng khẳng định là bộ xử lý mạnh nhất từng được xây dựng trên kiến trúc lệnh RISC-V. RISC-V là một chuẩn tập lệnh mã nguồn mở, cho phép các công ty tự thiết kế chip mà không phụ thuộc hoàn toàn vào các kiến trúc độc quyền như x86 của Intel/AMD hay Arm. Dự kiến CPU này cũng sẽ có một phiên bản dành cho các dòng máy tính mini pc, máy tính công nghiệp hoặc màn hình cảm ứng HMI. Theo DAMO Academy, đơn vị nghiên cứu của Alibaba, C950 được định vị để vận hành máy chủ đám mây, tác vụ AI tạo sinh, robot cao cấp và thiết bị điện toán biên, tức các hệ thống xử lý dữ liệu ngay gần nơi dữ liệu được tạo ra thay vì gửi toàn bộ về trung tâm dữ liệu.

Tập trung vào mô hình AI lớn như Qwen và DeepSeek

Điểm nhấn lớn nhất của XuanTie C950 là khả năng hỗ trợ trực tiếp các mô hình ngôn ngữ lớn, hay còn gọi là LLM, với quy mô hàng trăm tỷ tham số. Tham số là các giá trị số mà mô hình AI học được trong quá trình huấn luyện để dự đoán và tạo nội dung. Alibaba cho biết chip này có thể chạy tốt các mô hình chủ lực như Vision AI, Qwen3 và DeepSeek V3, qua đó hướng tới vai trò nền tảng cho ‘AI Agent’ – tức các hệ thống AI có thể tự động thực hiện chuỗi tác vụ thay cho con người. Hãng còn cho biết chip tích hợp một bộ tăng tốc AI tự phát triển, giúp xử lý các phép toán học dày đặc vốn là xương sống của AI hiện đại.

Hiệu năng được quảng bá ấn tượng, nhưng so sánh thực tế vẫn gây tranh luận

Alibaba tuyên bố hiệu năng đơn nhân đa dụng của chip đã vượt 70 điểm trong bài đo SPECint 2006. Đây là bộ benchmark lâu đời dùng để đánh giá khả năng xử lý các tác vụ tính toán nguyên của CPU. Hình ảnh từ sự kiện công bố cũng cho thấy kết quả liên quan đến SPECint 2017 ở mức 2,6GHz, tức xung nhịp hoạt động của chip. Theo phân tích từ nhà nghiên cứu Google Laurie Kirk, mức này đưa C950 tiến gần tới Apple M1, con chip ra mắt từ năm 2020. Nói cách khác, nếu so với thế giới RISC-V thì đây là bước tiến đáng kể, nhưng nếu đặt cạnh các bộ xử lý hàng đầu phương Tây hiện nay, sản phẩm của Alibaba vẫn bị xem là chậm vài năm.

Nhanh chóng áp dụng chuẩn RISC-V mới và hé lộ nhiều công nghệ nền

Một chi tiết gây chú ý là Alibaba cho biết đã triển khai phiên bản 23.1 của RVA trong hệ sinh thái RISC-V. RVA có thể hiểu là hồ sơ tiêu chuẩn xác định những tính năng mà một CPU RISC-V cần hỗ trợ để tương thích tốt với phần mềm hiện đại. Đây chỉ là bản cập nhật nhỏ mới được đề xuất vào tháng 8/2025, nên việc Alibaba áp dụng nhanh khiến giới quan sát bất ngờ. Tuy nhiên, tài liệu kỹ thuật của hãng vẫn chưa công bố đầy đủ những thông số quan trọng như số lượng lõi xử lý, mà chỉ mô tả chung là CPU IP 64-bit đa lõi. Trong ngành bán dẫn, IP là khối thiết kế sở hữu trí tuệ có thể được tái sử dụng để xây dựng chip.

Bộ tăng tốc TPE, định dạng dữ liệu mới và sức mạnh 8 TOPS

Từ tài liệu sản phẩm, bộ tăng tốc AI nhiều khả năng là XuanTie Tensor Processing Engine, viết tắt là TPE. Tensor là kiểu dữ liệu ma trận nhiều chiều rất phổ biến trong học máy, còn ‘processing engine’ là khối phần cứng chuyên xử lý các phép nhân cộng song song. Alibaba cho biết TPE hỗ trợ nhiều định dạng số như FP16, FP8 và INT4. Đây là các chuẩn biểu diễn số với độ chính xác khác nhau: FP là số thực dấu phẩy động, INT là số nguyên, và con số đi kèm thể hiện số bit dùng để lưu trữ. Độ chính xác thấp hơn thường giúp tăng tốc AI và giảm điện năng tiêu thụ. Chip cũng hỗ trợ các định dạng micro-scaling như MXFP8, MXFP4 và RVFP4, vốn là các cách nén và tối ưu dữ liệu để xử lý mô hình lớn hiệu quả hơn. Mỗi TPE đạt 8 TOPS, tức 8 nghìn tỷ phép toán mỗi giây, một chỉ số thường dùng để đo năng lực AI suy luận.

Hệ thống bộ nhớ và liên kết đa xử lý hướng tới máy chủ

Alibaba cũng nhấn mạnh vào kiến trúc bộ nhớ của C950. Chip sở hữu hệ thống cache nhiều tầng hiệu năng cao, trong đó cache L1 dữ liệu có độ trễ chỉ 4 chu kỳ từ lúc nạp đến lúc sử dụng. Cache là vùng nhớ cực nhanh nằm gần lõi CPU, giúp giảm thời gian phải truy cập RAM chậm hơn. Mỗi lõi còn có cache L2 riêng với dung lượng lớn, trong khi MMU, tức bộ quản lý bộ nhớ, hỗ trợ nhiều chế độ bộ nhớ ảo của RISC-V và dịch địa chỉ hai tầng. Cơ chế này rất quan trọng trong môi trường máy chủ và ảo hóa, nơi nhiều hệ điều hành hoặc máy ảo cùng chạy trên một phần cứng. Tài liệu cũng đề cập chế độ đa bộ xử lý sử dụng liên kết XL-300 để tạo cụm tối đa 8 lõi, cho thấy C950 được thiết kế để mở rộng theo hướng xử lý song song.

Quy trình 5nm là tham vọng lớn, nhưng sản xuất quy mô lớn vẫn là dấu hỏi

Một số nguồn tin cho rằng XuanTie C950 được sản xuất trên tiến trình 5nm. Trong ngành chip, tiến trình 5nm là cách gọi thế hệ công nghệ chế tạo bán dẫn tiên tiến, thường cho phép tăng mật độ transistor, cải thiện hiệu năng và giảm điện năng tiêu thụ. Dù một số nhà sản xuất Trung Quốc có thể tiếp cận mức kỹ thuật này, việc đưa chip vào sản xuất hàng loạt với sản lượng lớn và chất lượng ổn định vẫn là bài toán khó. Đây cũng là điểm then chốt, bởi một con chip tốt trên giấy tờ sẽ không tạo tác động lớn nếu không thể xuất xưởng đủ số lượng để phục vụ trung tâm dữ liệu đang bùng nổ nhu cầu AI.

Alibaba chọn chiến lược đồng thiết kế chip, đám mây và mô hình AI

CEO Alibaba, ông Ngô Vĩnh Minh, gần đây thừa nhận chip Trung Quốc vẫn đi sau các đối thủ phương Tây. Tuy vậy, chiến lược của tập đoàn không chỉ nằm ở cuộc đua hiệu năng thuần túy. Alibaba muốn đẩy mạnh ‘co-design’, tức đồng thiết kế giữa máy tính, chip, hạ tầng đám mây và mô hình AI Qwen để tối ưu chi phí và hiệu quả triển khai thực tế. Cách tiếp cận này có nghĩa là thay vì cố tạo ra con chip mạnh nhất thị trường, Alibaba xây dựng một hệ sinh thái nơi phần cứng và phần mềm được tinh chỉnh cho nhau. Nếu thành công, XuanTie C950 có thể không phải CPU mạnh nhất thế giới, nhưng vẫn trở thành mảnh ghép quan trọng trong một ngăn xếp AI khép kín, từ trung tâm dữ liệu đến mô hình ngôn ngữ, giúp Alibaba giảm phụ thuộc vào công nghệ nước ngoài.

Danh mục máy quét mã vạch

Máy quét mã vạch - Quét mã Qr - Quét mã vạch sản phẩm.

DÒNG MÁY CÓ DÂY

máy quét mã vạch không dây

DÒNG MÁY KHÔNG DÂY

DÒNG MÁY KIỂM KHO PDA

DÒNG MÁY FITMOUNT