Success-Case

Máy chủ ARM của GIGABYTE thúc đẩy phát triển giải pháp giao thông thông minh lên 200%

Một nhóm các nhà khoa học tại NTU đã sử dụng máy chủ G242-P32 của GIGABYTE và Bộ công cụ dành cho nhà phát triển Arm-HPC để tạo ra “mô hình luồng giao thông chính xác cao” - một giải pháp giao thông thông minh có thể được sử dụng để kiểm tra các phương tiện tự hành và xác định các đoạn đường dễ xảy ra tai nạn để khắc phục ngay lập tức.
Giáo sư Chi-Sheng Shih, Giám đốc tại Viện Sau đại học về Mạng và Đa phương tiện tại Đại học Đài Loan (NTU), đang dẫn dắt một nhóm các nhà khoa học phát triển một dự án mang tên "mô hình luồng giao thông chính xác cao" cho các tuyến đường bộ và đường cao tốc của Đài Loan. Những lợi ích mà mô hình như vậy mang lại là gấp đôi. Thứ nhất, các nhà phát triển xe tự hành và ADAS có thể tiến hành mô phỏng để kiểm tra các sáng tạo của họ, trong khi các cơ quan quản lý của chính phủ có thể kiểm tra độ an toàn trước khi bật đèn xanh cho một sản phẩm mới. Thứ hai, có thể nhanh chóng được xác định “các đoạn đường dễ xảy ra tai nạn” hiện có - các vị trí có tần suất xảy ra tai nạn xe cộ cao hơn và mức độ nghiêm trọng hơn, do đó có thể thực hiện các bước để ngăn ngừa nhiều tai nạn hơn và giảm thiểu số người chết do tai nạn hơn. Mô hình này đã được thử nghiệm trên các con đường ở miền bắc và miền trung Đài Loan. Nhóm đang đàm phán với Tier IV, Inc., một công ty khởi nghiệp công nghệ cao có trụ sở tại Nhật Bản, về việc kết hợp thành phẩm vào Autoware, dự án phần mềm mã nguồn mở hàng đầu thế giới về lái xe tự hành; điều này sẽ mở đường cho việc áp dụng rộng rãi hơn và khả năng thương mại hóa.

Learn More:
《Glossary: What is ADAS?
Israeli Developer of Autonomous Vehicles Chose GIGABYTE Servers

Làm thế nào là Giáo sư Shih và nhóm của anh ấy phát triển mô hình? Đầu tiên, ba hoặc bốn gói cảm biến, mỗi gói bao gồm một nắp đậy và ba camera, được lắp đặt dọc theo một đoạn đường dài khoảng một trăm đến hai trăm mét. Trong mỗi đợt thử nghiệm, các cảm biến thu thập dữ liệu từ luồng giao thông trong khoảng thời gian hai giờ. Các điểm dữ liệu bao gồm số lượng phương tiện, tốc độ phương tiện, khoảng cách giữa mỗi phương tiện,… Sau đó, dữ liệu được đưa trở lại phòng máy để xử lý. Kết quả cuối cùng là mô hình máy tính có chức năng tóm lược với độ chính xác cao hiển thị các chi tiết phức tạp về luồng giao thông; đó là một dạng hai kỹ thuật số song song có thể được sử dụng để mô phỏng và mô hình hóa tính di động, là thành phần chính của giải pháp giao thông thông minh.

"Mục tiêu của chúng tôi là trở thành Qianliyan và Shunfeng'er của xe tự hành," Giáo sư Shih đặt kì vọng với sự liên tưởng tới hai vị thần trong thần thoại Trung Quốc được biết đến với đôi mắt nhìn xa và đôi tai tinh tường. Mô hình máy tính không chỉ có thể cải thiện độ chính xác định vị và độ an toàn của ô tô tự lái, mà nó còn có thể được sử dụng để phân tích và điều chỉnh luồng giao thông, điều này có lợi cho tất cả các phương tiện, tự lái hoặc không tự lái.

Vào năm 2021, nhóm của Giáo sư Shih đã chào đón một thành viên mới đáng giá: Bộ công cụ dành cho nhà phát triển Arm HPC của Nvidia, một nền tảng phần cứng và phần mềm tích hợp để tạo, đánh giá và chấm điểm các ứng dụng máy tính khoa học, AI và HPC. Cốt lõi của giải pháp toàn diện này là sản phẩm G242-P32 của GIGABYTE Technology - Máy chủ GPU G-Series được hỗ trợ bởi một Bộ xử lý Ampere® Altra® dựa trên ARM duy nhất.

Learn More:
《Glossary: What is HPC?
《Glossary: What is AI?
《More information about GIGABYTE's GPU Servers
《More information about GIGABYTE's ARM Servers
The Advantages of ARM: From Smartphones to Supercomputers and Beyond

Đóng góp của sản phẩm cho dự án nghiên cứu là rất đáng chú ý. Bởi theo ước tính của Giáo sư Shih, thời gian phát triển đã giảm ít nhất một nửa, tức là hiệu suất tăng lên 200%. Các nhà khoa học đã gọi giải pháp dựa trên ARM của GIGABYTE là "máy học đa năng" - một giải pháp hoàn hảo trong tay có thể đào tạo AI, phát triển mô hình máy tính, truyền dữ liệu và hơn thế nữa. Đó là một lợi ích thực sự đối với sự tiến bộ của mô hình luồng lưu lượng và nó đã làm cho công việc của nhóm trở nên dễ dàng hơn đáng kể.《Glossary: What is Machine Learning?

Làm thế nào mà sản phẩm G242-P32 và Arm HPC DevKit của GIGABYTE có thể thực hiện được tất cả những điều này? Bốn lợi ích chính có thể được tóm tắt như sau:

1. Các bộ xử lý ARM là "gốc đám mây", nghĩa là chúng tuân theo cùng một kiến trúc RISC như các chip máy tính được sử dụng trong các thiết bị bên đường.

2. Ampere® Altra® CPU có vô số lõi — lên đến 80 lõi trong một bộ xử lý duy nhất, làm cho nó rất phù hợp cho tính toán song song.

3. DevKit được trang bị GPU NVIDIA® A100 kép, bổ sung cho CPU thông qua một quá trình được gọi là tính toán không đồng nhất. Hơn nữa, bộ nhớ DDR4 8 kênh 512G cung cấp băng thông cần thiết để xử lý tốc độ truyền dữ liệu cao.

4. Giải pháp ARM tuân theo các tiêu chuẩn an toàn ISO 26262, có nghĩa là các mô hình máy tính được phát triển với ARM có thể dễ dàng được triển khai bởi các công ty và viện trong ngành công nghiệp ô tô.

Glossary:
What is RISC?
What is Core?
What is Parallel Computing?
What is GPU?
What is Heterogeneous Computing?
Benefit #1: Lợi ích số 1: Bộ xử lý ARM gốc đám mây dựa trên Kiến trúc RISC
Các gói cảm biến bên đường sử dụng PC công nghiệp (IPC) chạy trên bộ xử lý ARM, tuân theo kiến trúc tập lệnh RISC (ISA, hay viết tắt là kiến trúc). Điều này không có gì khác thường: do tiêu thụ điện năng thấp hơn và hiệu quả năng lượng tốt hơn, bộ vi xử lý ARM được sử dụng rộng rãi trên các thiết bị di động và thiết bị tiên tiến, khiến ARM trở thành loại chip máy tính phổ biến nhất trên hành tinh. Tuy nhiên, trước khi giới thiệu Arm HPC DevKit, phòng máy tính tại NTU đã sử dụng các máy chủ dựa trên bộ xử lý x86 thông thường, tuân theo kiến trúc CISC. Kết quả của tất cả những điều này là nhóm phải viết hai bộ mã — một cho các thiết bị bên đường, một cho trung tâm dữ liệu ở nhà. Điều này thực sự đã tiêu tốn hết thời gian quý báu và khiến đường ống chỉ hoạt động hiệu quả bằng một nửa so với mức có thể.

Glossary:
What is Edge Computing?
What is CISC?
What is Data Center?
Trung tâm của Arm HPC DevKit là GIGABYTE G242-P32. Máy chủ GPU 2U này được cung cấp bởi một Bộ xử lý Ampere® Altra® duy nhất, là một CPU ARM gốc đám mây tuân theo cùng một ISA như hầu hết các thiết bị di động và thiết bị xung quanh. Điều này cải thiện đáng kể hiệu quả của việc phát triển các mô hình hoặc chương trình máy tính có thể được sử dụng bên ngoài các trung tâm dữ liệu thông thường - chẳng hạn như đường xá và đường cao tốc của Đài Loan.
Arm HPC DevKit đã thay đổi tất cả điều này. Vì G242-P32 của GIGABYTE chạy trên bộ xử lý ARM, kết quả ghi nhận được là cuối cùng, các IPC bên đường được sử dụng để thử nghiệm và máy chủ được sử dụng để phát triển mô hình nói cùng một "ngôn ngữ"! Không còn cần thiết phải viết hai bộ mã; cùng một mã RISC được sử dụng trong trường có thể được tận dụng trong trung tâm dữ liệu. Hơn nữa, vì sản phẩm hoàn chỉnh sẽ được triển khai trên các thiết bị bên đường dựa trên ARM, nên bắt buộc ISA của môi trường phát triển phải khớp với ISA của môi trường ứng dụng.

Giáo sư Shih cho biết: “Chúng tôi đã sử dụng một trình biên dịch để dịch các chương trình của mình từ hệ thống x86 ban đầu sang hệ thống ARM mới, nhưng chúng tôi đã có thể hoàn thành 90% đến 95% quá trình chuyển giao trong vòng một tháng. “Giải pháp ARM mới đã cải thiện đáng kể quy trình DevOps của chúng tôi và giảm thời gian phát triển của chúng tôi ít nhất là một nửa”.
Lợi ích # 2: Số lượng lõi cực cao lý tưởng cho máy tính song song
Bộ xử lý có ổ cắm đơn Ampere® Altra® bên trong G242-P32 có một lợi thế khác biệt: nó tự hào có số lượng lõi cao bất thường, lên đến 80 lõi trong một CPU. Trong khi đó, các bộ xử lý x86 hàng đầu hiện nay đạt tối đa khoảng 64 lõi trên mỗi bộ xử lý. Việc phân phối khối lượng công việc cho một số lượng lớn hơn các lõi nhỏ hơn, tiết kiệm năng lượng hơn là một trong những lý do tại sao ARM nói chung cung cấp hiệu suất tốt hơn trên mỗi watt điện. Đây là yếu tố thay đổi cuộc chơi đối với sự phát triển của "mô hình luồng giao thông chính xác cao", bởi vì nó mang lại lợi ích đáng kể từ tính song song của nhiệm vụ.

Giáo sư Shih giải thích: “Trong khoảng hai giờ để hoàn thành một loạt các thử nghiệm bên đường, chúng tôi thường tạo ra khoảng 360 gigabyte dữ liệu thô. Chúng tôi chạy đồng thời mười hai chương trình và kết nối với năm mươi tệp riêng biệt để so sánh, hiệu chỉnh và biên dịch các điểm dữ liệu. Hệ thống cũ của chúng tôi không có đủ lõi để hỗ trợ điều này, và nó khiến nhóm của tôi khá là đau đầu ”.

Bộ vi xử lý ARM có một ưu điểm khác mà nhóm của Giáo sư Shih vẫn chưa có cơ hội sử dụng, nhưng điều đáng nói ở đây nó như một phụ bản. Tính năng này được gọi là “ARM big.LITTLE”. Nó là sự kết hợp của các lõi chậm hơn, tiết kiệm năng lượng hơn ("LITTLE") với các lõi hiệu suất cao, sử dụng nhiều năng lượng ("lớn"). Trên thực tế, cấu hình này cung cấp cho người dùng nhiều loại công cụ hơn để lựa chọn cho các tác vụ khác nhau, nhờ đó bộ xử lý ARM có thể tiết kiệm năng lượng hơn nữa mà không làm giảm hiệu suất của nó.

Learn More:
What is a Server? A Tech Guide by GIGABYTE
Setting the Record Straight: What is HPC? A Tech Guide by GIGABYTE
Lợi ích # 3: GPU mạnh mẽ và bộ nhớ băng thông cao
Trong máy tính, cũng như trong cuộc sống thực, đôi khi bạn không thể tự mình tạo ra nó. Bất kể CPU mạnh đến mức nào, một chút trợ giúp từ GPU (hoặc trong trường hợp này là GPGPU) có thể giúp bạn mang lại hiệu suất thực sự xuất sắc. May mắn thay, Arm HPC DevKits đạt tiêu chuẩn với tối đa hai thẻ GPU NVIDIA® A100 PCIe Gen4. Kiến trúc bộ nhớ 8 kênh của G242-P32, có thể hỗ trợ lên đến 512 gigabyte DDR4 SDRAM, hoàn thành quá trình thiết lập.

Glossary:
What is GPGPU?
What is PCIe?
Dữ liệu được thu thập bởi các cảm biến bên đường được gửi trở lại phòng thí nghiệm của NTU để so sánh, hiệu chuẩn và biên soạn. Nhóm của Giáo sư Shih sử dụng một phương pháp được gọi là tính toán không đồng nhất để đạt được sức mạnh tổng hợp tối ưu giữa CPU và GPU, để họ có thể phát triển "mô hình luồng lưu lượng chính xác cao" hiệu quả hơn.
Sau khi dữ liệu thực địa đã được gửi trở lại phòng máy tính trong khuôn viên trường, CPU ARM và GPU NVIDIA® sẽ được giao các nhiệm vụ phù hợp nhất với thế mạnh của chúng. Bộ xử lý ARM xử lý hiệu chuẩn và so sánh trình tự, trong khi GPU xử lý đầu vào đồ họa. Điều này được thực hiện để đảm bảo dữ liệu được thu thập bởi các cảm biến khác nhau - bao gồm cả ảnh được chụp bởi máy ảnh và các đám mây điểm do nắp đậy tạo ra - được căn chỉnh chính xác với nhau, chính xác đến từng mili giây. Sai số chỉ từ 50 đến 100 mili giây (một phần hai mươi hoặc một phần mười giây) có thể tương đương với chênh lệch nhiều cm - nói cách khác, sự khác biệt giữa một cuộc gọi cảnh báo và một vụ va chạm chết người. Không có chỗ cho loại lỗi này trong một giải pháp giao thông thông minh, đó là lý do tại sao hình ảnh đã chụp đôi khi phải được xác định lại để theo dõi chính xác quỹ đạo của từng phương tiện — một nhiệm vụ khác mà GPU vượt trội.《Glossary: What is Point Cloud?

Trước khi tiếp tục, chúng ta sơ lược về bộ nhớ DDR4 8 kênh 512G. Rất nhiều dữ liệu được chuyển qua lại giữa CPU và GPU trong quá trình so sánh. Hệ thống cũ hơn của nhóm nghiên cứu không có đủ bộ nhớ để theo kịp, vì vậy các nhà nghiên cứu phải chia dữ liệu thành các phần nhỏ hơn, điều này tốn thời gian và không hiệu quả. Có băng thông bộ nhớ để phù hợp với tốc độ tính toán của bộ xử lý là chìa khóa quan trọng: để sử dụng phép ẩn dụ liên quan đến ô tô, một nhóm các tay đua Công thức Một sẽ chỉ có thể làm được nhiều như vậy nếu tất cả những gì họ có là đường cao tốc một làn. Nâng cấp bộ nhớ là một cách khác mà Arm HPC DevKit đẩy nhanh sự phát triển của “mô hình luồng lưu lượng chính xác cao”.
Lợi ích # 4: Tuân thủ ISO 26262 Giúp các Giải pháp ARM Triển khai Dễ dàng hơn
Cuối cùng nhưng không kém phần quan trọng, cần lưu ý rằng các sản phẩm của ARM hướng đến sự an toàn về chức năng, vì vậy chúng được thiết kế có chủ đích "ngoài ngữ cảnh" để đáp ứng phạm vi ứng dụng rộng rãi nhất. Điều này có nghĩa là nhiều giải pháp ARM đáp ứng các tiêu chuẩn an toàn quốc tế. Arm Ltd., động lực chính đằng sau công nghệ ARM, đóng vai trò tích cực trong việc hỗ trợ khách hàng và nhà sản xuất trong quá trình chứng nhận các thiết bị dựa trên ARM. Vì nó liên quan đến dự án của nhóm NTU, khi mô hình máy tính hoàn chỉnh được hoàn thiện và thương mại hóa, người dùng cuối sẽ dễ dàng triển khai hơn, vì nó đã được phát triển với giải pháp ARM tuân theo ISO 26262, tiêu chuẩn quốc tế về chức năng. an toàn của các hệ thống điện và/hoặc điện tử được lắp đặt trên các phương tiện giao thông đường bộ sản xuất nối tiếp.

GIGABYTE Technology rất vui khi được đóng góp vào sự phát triển của giải pháp lưu lượng thông minh của nhóm NTU thông qua Bộ công cụ dành cho nhà phát triển Arm HPC và Máy chủ GPU G242-P32. Bộ vi xử lý ARM, vốn từ lâu đã được yêu thích trên các thiết bị di động và thiết bị tiên tiến, đang trở lại trong lĩnh vực máy chủ một cách mạnh mẽ. Ngoài những ưu điểm được liệt kê ở trên, bộ xử lý ARM còn cung cấp TCO (tổng chi phí sở hữu) tuyệt vời, quản lý nhiệt tối ưu và khả năng mở rộng đáng kinh ngạc — tất cả đều là những đặc quyền mà các trung tâm dữ liệu trên toàn thế giới có thể hưởng lợi. Điều này phù hợp với nỗ lực của GIGABYTE Technology nhằm phát triển các giải pháp sáng tạo cho các ngành dọc khác nhau, với hy vọng rằng những phát minh mới mang tính đột phá — chẳng hạn như mô hình luồng giao thông có độ chính xác cao có thể được coi là động lực thúc đẩy giao thông thông minh hơn, an toàn hơn — sẽ sớm trở thành hiện thực và giúp “Nâng cấp cuộc sống của bạn”.

Learn More:
《Glossary: What is Scalability?
How to Pick a Cooling Solution for Your Servers? A Tech Guide by GIGABYTE
Get the inside scoop on the latest tech trends, subscribe today!
Get Updates
Get the inside scoop on the latest tech trends, subscribe today!
Get Updates