THÂM QUYẾN, Trung Quốc, 18/10/2023 /PRNewswire/ — “Tôi cần gấp rút thực hiện nhiệm vụ này cho kịp thời hạn. Thời gian xếp hàng chờ tải tài nguyên quá lâu. Tôi phải làm sao?”
“Hạn chót nộp thử nghiệm là tuần sau nhưng tôi vừa nhận thấy một vài dữ liệu không chính xác. Muốn chạy lại bản mô phỏng cần tới hơn 100 giờ. Liệu có cách nào nhanh hơn không?”
“Thử nghiệm này rất quan trọng với tôi. Thời hạn còn rất ít. Liệu tôi có thể thực hiện nhiệm vụ sớm hơn không?”
Thách thức lớn nhất đối với các nhà nghiên cứu khoa học không chỉ dừng lại ở chuyển động phân tử, thành phần axit deoxyribonucleic (DNA), thử nghiệm trong hầm gió, thí nghiệm mô phỏng và mô hình hóa phức tạp mà còn nằm ở việc quản lý tài nguyên điện toán hạn chế và sắp xếp trong thời gian xếp hàng lâu.
Với mục tiêu nâng cao hiệu quả HPC và tiết kiệm chi phí nghiên cứu khoa học, nền tảng HPC công cộng của Đại học Bắc Kinh đã tiến hành thẩm định nhà cung cấp để chọn ra mạng HPC có thể đáp ứng kỳ vọng của trường. Mạng HPC thông minh bảo toàn dữ liệu của Huawei nắm giữ vị trí số 1 nhờ hiệu năng điện toán ưu việt.
Trung tâm điện toán với những thành tựu đáng chú ý
Trong số các trường đại học của Trung Quốc, Đại học Bắc Kinh là đơn vị đi đầu trong nỗ lực thành lập trung tâm điện toán khi mua chiếc máy tính đầu tiên vào năm 1963. Năm 2001, trường đã tập hợp các chuyên gia từ nhiều lĩnh vực khác nhau cùng thành lập nên Trung tâm Khoa học & Kỹ thuật điện toán. Sứ mệnh của trung tâm này là trở thành nền tảng nghiên cứu đa ngành để phục vụ hoạt động giảng dạy và nghiên cứu của trường. Năm 2018 chứng kiến màn ra mắt nền tảng HPC công cộng và ba cụm gồm Weiming số 1, Weiming Teaching số 1 và Weiming Biological Science số 1 từng bước đi vào hoạt động. Tổng số core điện toán trên nền tảng công cộng đạt 31.732 với hiệu suất điện toán cao nhất là 3,65 PFLOPS. Nền tảng này cung cấp môi trường HPC cho đa dạng ngành như toán học, cơ học, vật lý, hóa học, sinh học và địa chất.
Nền tảng vững chắc cho nghiên cứu khoa học
Chức năng chính của nền tảng HPC là hỗ trợ hoạt động nghiên cứu khoa học của trường đại học. Tính đến ngày 12/05/2023, nền tảng HPC của Đại học Bắc Kinh đã có 5070 người dùng từ khắp 96 khoa học và hỗ trợ hơn 545 dự án nghiên cứu với tổng kinh phí là 3,136 tỷ NDT cùng hơn 1400 bài báo chất lượng cao. Nền tảng cũng hỗ trợ hoạt động phát công bố Giải thưởng Gordon Bell vào năm 2020. Dự án từng đoạt giải thưởng này đã cải thiện giới hạn mô phỏng động lực học phân tử với khả năng xử lý đáng kinh ngạc lên tới 100 triệu nguyên tử thông qua học máy. Đây được coi là một trong những bước đột phá quan trọng nhất trong lĩnh vực khoa học điện toán cho đến nay.
Nhu cầu điện toán ngày càng tăng thúc bách việc tái thiết mạng
Trong bối cảnh số lượng người dùng trên nền tảng tiếp tục tăng, khối lượng công việc vận hành cũng dần vượt giới hạn tối đa. Điều này kéo theo mức độ phức tạp và thông lượng cơ sở hạ tầng mạng cao chưa từng có. Lấy cụm Weiming Biological Science số 1 làm ví dụ. Mức độ sử dụng node liên tục trên 95% trong một thời gian dài. Thời gian thực hiện nhiệm vụ tối đa là 109 giờ và thời gian xếp hàng tối đa là 550 giờ. Rõ ràng việc tái thiết hệ thống và mạng lưới là vô cùng cấp thiết.
Để giải quyết những vấn đề này, các nhà cung cấp đã đề xuất sử dụng công nghệ mạng bảo toàn dữ liệu như InfiniBand (IB), RoCEv1 và RoCEv2. Sau nhiều bài kiểm tra nghiêm ngặt, nền tảng HPC công cộng của Đại học Bắc Kinh cuối cùng đã chọn giải pháp DCN siêu hội tụ CloudFabric 3.0 của Huawei do có hiệu suất vượt trội. Giải pháp này áp dụng mạng HPC thông minh bảo toàn dữ liệu nên vô cùng phù hợp để phát triển các cụm HPC có khả năng giải phóng 100% sức mạnh điện toán và giảm thiểu thời gian thực hiện nhiệm vụ và xếp hàng.
Mạng HPC thông minh bảo toàn dữ liệu của Huawei hỗ trợ Đại học Bắc Kinh nâng cao hiệu quả nghiên cứu khoa học
Các bài kiểm tra tập trung đánh giá hiệu suất của TCP/IP, IB và RoCEv2 trong nhiều kịch bản ứng dụng khác nhau, bao gồm công cụ kiểm tra điểm chuẩn HPC LINPACK, Mô hình hệ thống khí hậu cộng đồng (CESM) và phần mềm động lực phân tử Điểm chuyển mạch analog ảo (VASP).
Trong bài kiểm tra VASP, mạng HPC thông minh bảo toàn dữ liệu của Huawei là 100GE RoCEv2 thể hiện được hiệu suất tốt hơn IB. Trong các bài kiểm tra LINPACK và CESM, 100GE RoCEv2 của Huawei về cơ bản có hiệu suất tương đương với IB. Tất cả điều này chứng tỏ mạng HPC thông minh bảo toàn dữ liệu của Huawei có thể thay thế IB trong các kịch bản ứng dụng thực tế.
Giải pháp mạng HPC thông minh bảo toàn dữ liệu của Huawei hỗ trợ duy nhất Ethernet bảo toàn dữ liệu. So với Ethernet thông thường, Ethernet bảo toàn dữ liệu có thể tăng gấp đôi hiệu suất điện toán ở cùng quy mô máy chủ. Một điểm nổi bật khác của giải pháp là bộ chuyển mạch CloudEngine 16800. Bộ chuyển mạch đa dạng tính năng này có mật độ cổng 768 x 400GE cao nhất trong ngành và là lựa chọn lý tưởng khi xây dựng cụm điện toán cực lớn cấp 10E. Bên cạnh đó, Huawei là nhà cung cấp duy nhất triển khai điện toán hỗ trợ mạng, tức là điện toán trong mạng (INC). Theo xác nhận của Tolly, giải pháp của Huawei có thời gian hoàn thành công việc (JCT) ngắn hơn 17% so với IB.
Nền tảng HPC của Đại học Bắc Kinh tự hào sở hữu cụm siêu điện toán hàng đầu Trung Quốc. Hiệu suất LINPACK của toàn bộ hệ thống luôn đứng ở vị trí đầu tiên, điều này đặt ra yêu cầu cực kỳ cao về hiệu suất và độ tin cậy của mạng. Thử thách này một lần nữa chứng minh sức mạnh từ DCN siêu hội tụ của Huawei và giúp Huawei trở thành tên tuổi uy tín trong ngành công nghiệp siêu điện toán. Trong tương lai, mạng HPC thông minh bảo toàn dữ liệu của Huawei sẽ có ứng dụng rộng rãi hơn cho nhiều lĩnh vực khác nhau như giáo dục và nghiên cứu khoa học, đặt nền tảng vững chắc cho điện toán khoa học, đổi mới kỹ thuật và nghiên cứu khoa học cao cấp.
Bài viết này được chọn từ Số phát hành Giáo dục Thông minh của tạp chí ICT Insights. Chào mừng bạn ghé thăm trang web chính thức của Huawei để tìm hiểu thêm:
https://e.huawei.com/en/ict-insights/global/ict_insights/ict34-intelligent-education
Liên hệ
hwebgcomms@huawei.com