NVIDIA vừa phát đi thông báo, các máy chủ NVIDIA OVX™ với các GPU mới của NVIDIA® L40S, một bộ xử lý trung tâm dữ liệu mạnh mẽ và đa năng được thiết kế để tăng tốc các ứng dụng phức tạp, yêu cầu tính toán mạnh, bao gồm huấn luyện và triển khai trí tuệ nhân tạo, thiết kế và trực quan hóa 3D, xử lý video và số hóa công nghiệp với nền tảng NVIDIA Omniverse™.
GPU mới này hỗ trợ tăng tốc công việc tính toán cho trí tuệ nhân tạo tạo tùy chỉnh, đã thay đổi cách làm việc và dịch vụ trong nhiều ngành, bao gồm tạo văn bản, hình ảnh và video, chatbot, phát triển game, thiết kế sản phẩm và chăm sóc sức khỏe.
“Khi trí tuệ nhân tạo tạo tùy chỉnh thay đổi mọi ngành công nghiệp, các doanh nghiệp ngày càng tìm kiếm nguồn tài nguyên tính toán quy mô lớn tại trung tâm dữ liệu,” Bob Pette, phó chủ tịch trách nhiệm thương hiệu chuyên nghiệp của NVIDIA, nói. “Các hệ thống OVX với GPU NVIDIA L40S tăng tốc công việc AI, đồ họa và xử lý video, và đáp ứng yêu cầu về hiệu suất đáng kể của một tập hợp ngày càng phức tạp và đa dạng các ứng dụng.”
Hiệu năng mạnh mẽ cho AI và Đồ họa
Các hệ thống NVIDIA OVX sẽ cho phép tối đa tám GPU NVIDIA L40S trên mỗi máy chủ, mỗi GPU được trang bị 48GB bộ nhớ. Dựa trên kiến trúc GPU Ada Lovelace của NVIDIA, L40S bao gồm Tensor Cores thế hệ thứ tư và Máy Biến Áp FP8, cung cấp hơn 1.45 petaflops sức mạnh xử lý tensor và hơn 2 lần hiệu năng AI so với GPU NVIDIA L40. Đối với các công việc AI phức tạp có hàng tỷ tham số và nhiều hình thái dữ liệu – như văn bản và video – L40S cho phép hiệu năng thông qua AI tạo tùy chỉnh tăng lên gấp đôi và hiệu năng huấn luyện tăng lên gấp 1.7 so với GPU A100 Tensor Core của NVIDIA.
Để cung cấp hiệu suất trải nghiệm hiển thị chuyên nghiệp có độ chính xác cao như hiển thị thời gian thực, thiết kế sản phẩm và tạo nội dung 3D, GPU NVIDIA L40S bao gồm 142 RT Cores thế hệ thứ ba cung cấp 212 teraflops hiệu năng ray-tracing. Điều này cho phép các chuyên gia sáng tạo tạo ra trải nghiệm thị giác chân thực và nội dung giả tượng.
Đối với các luồng công việc yêu cầu tính toán cao, chẳng hạn như mô phỏng kỹ thuật và khoa học, GPU NVIDIA L40S bao gồm 18,176 lõi CUDA® để cung cấp gần 5 lần hiệu năng số thực đơn (FP32) của GPU NVIDIA A100 để tăng tốc tính toán phức tạp và phân tích dữ liệu mật độ cao.
Các ứng dụng tiên phong
Trong số các nhà cung cấp dịch vụ đám mây đầu tiên cung cấp các trường hợp sử dụng L40S là CoreWeave, một nhà cung cấp chuyên về các khối lượng công việc được tăng tốc bởi GPU quy mô lớn.
“Với sự bùng nổ của trí tuệ nhân tạo tạo tùy chỉnh, khách hàng của chúng tôi trong nhiều ngành đang tìm kiếm các lựa chọn tính toán mạnh mẽ và quy mô phù hợp với độ phức tạp của bất kỳ khối lượng công việc nào – từ video tương tác đến thiết kế và tự động hóa AI,” Brian Venturo, giám đốc công nghệ của CoreWeave, nói. “GPU NVIDIA L40S sẽ mở rộng thêm danh mục rộng lớn của chúng tôi về các giải pháp NVIDIA, biến CoreWeave thành nhà cung cấp đám mây đầu tiên chuyên nghiệp cung cấp các nguồn tài nguyên mới này để tích hợp tăng tốc tính toán nhanh, hiệu quả và chi phí thấp để cung cấp năng lực cho làn sóng mới của các ứng dụng trí tuệ nhân tạo tạo tùy chỉnh.”
Phần mềm tăng cường AI
Các doanh nghiệp triển khai GPU L40S có thể tận dụng phần mềm NVIDIA AI Enterprise, vừa mới cập nhật một phiên bản lớn. Phần mềm cung cấp hỗ trợ doanh nghiệp và bảo mật sẵn sàng cho hơn 100 khung công việc, mô hình được huấn luyện trước, bộ công cụ và phần mềm, bao gồm NVIDIA Modulus cho mô phỏng, NVIDIA RAPIDS™ cho khoa học dữ liệu và NVIDIA Triton™ Inference Server cho AI sản xuất.
Omniverse mở rộng
NVIDIA cũng thông báo về các cập nhật lớn cho nền tảng Omniverse, giới thiệu khả năng và cải tiến nền tảng cho phép các nhà phát triển tăng tốc và phát triển các đường ống OpenUSD và ứng dụng số hóa công nghiệp bằng sức mạnh của trí tuệ nhân tạo tạo tùy chỉnh. Thế hệ tiếp theo của các hệ thống NVIDIA OVX cung cấp sức mạnh cho Omniverse Cloud sẽ sử dụng GPU L40S để cung cấp hiệu năng AI và đồ họa cần thiết để tăng tốc các đường ống tạo tùy chỉnh và khối lượng làm việc của Omniverse.
Sẵn có
GPU NVIDIA L40S sẽ sẵn có bắt đầu từ mùa thu này. Các nhà xây dựng hệ thống toàn cầu, bao gồm ASUS, Dell Technologies, GIGABYTE, HPE, Lenovo, QCT và Supermicro, sẽ sớm cung cấp các hệ thống OVX bao gồm GPU NVIDIA L40S. Những máy chủ này sẽ giúp các chuyên gia trên toàn thế giới phát triển trí tuệ nhân tạo tạo tùy chỉnh và đưa các ứng dụng trí tuệ nhân tạo tạo tùy chỉnh như chatbot thông minh, công cụ tìm kiếm và tóm tắt thông tin đến người dùng trong nhiều ngành công nghiệp.