NVIDIA ra mắt kiến trúc Rubin: Bước nhảy vọt tiếp theo trong điện toán AI
Kiến trúc AI computing NVIDIA Rubin được kỳ vọng sẽ tạo nên cuộc cách mạng trên thị trường với các chỉ số hiệu năng và mức cải thiện hiệu suất chưa từng có.
NVIDIA đã chính thức công bố kiến trúc GPU mới nhất của mình, mang tên Rubin, đánh dấu một cột mốc quan trọng trong ngành bán dẫn. Thông báo này được đưa ra trong lúc ngành công nghiệp vẫn đang tiếp nhận tác động từ dòng Blackwell, cho thấy NVIDIA đang chuyển sang chu kỳ phát hành sản phẩm nhanh, một năm một lần, để đáp ứng nhu cầu toàn cầu không ngừng tăng đối với sức mạnh Trí tuệ Nhân tạo.
Theo các thông số kỹ thuật mới nhất, các sản phẩm dựa trên Rubin đã bước vào giai đoạn sản xuất ban đầu. Các giải pháp tính toán AI tận dụng GPU Rubin dự kiến sẽ được cung cấp thông qua các công ty đối tác bắt đầu từ nửa sau năm 2026. Kiến trúc Rubin là thế hệ kế nhiệm trực tiếp của dòng Blackwell và mang đến các chỉ số hiệu năng đột phá. Cụ thể, hiệu năng suy luận của nó khi sử dụng định dạng độ chính xác NVFP4 đạt mức 50 petaflops, tương đương tăng gấp năm lần so với GPU Blackwell.
Điều làm kiến trúc Rubin đặc biệt ấn tượng là hiệu quả thiết kế của nó. Mặc dù số lượng transistor trong Rubin đã tăng lên gấp một phẩy sáu lần so với Blackwell, mức tăng hiệu năng thực tế lại vượt xa đáng kể mức tăng phần cứng này. Thành tựu này đến từ một thiết kế kiến trúc được cải tiến hoàn toàn, giúp tối ưu luồng dữ liệu và hiệu quả tính toán. Ngoài ra, nền tảng Rubin dự kiến sẽ tích hợp bộ xử lý trung tâm Vera sắp ra mắt và công nghệ Bộ nhớ Băng thông Cao 4 tiên tiến, qua đó càng củng cố vị thế của nó ở trung tâm các trung tâm dữ liệu AI trong tương lai.