정밀한 AI 훈련 가속장비 Netitest가 Napatech의 200G FPGA SmartNIC으로 고속 네트워킹을 최적화한 방법
- dc0149
- 3월 20일
- 2분 분량

도전
지능형 컴퓨팅 네트워크 테스트 분야의 선두주자인 Netitest는 AI 트레이닝 솔루션을 개발하는 동안 어려움에 직면했습니다. 테스트 솔루션에는 AI 트레이닝 환경에서 네트워크 리소스의 성능을 평가하기 위해 초고대역폭과 저지연 기능을 갖춘 SmartNIC가 필요했습니다.
해결책
이러한 요구 사항을 충족하기 위해 Netitest는 Link-Capture™ 소프트웨어를 실행하는 2 x 100G의 Napatech NT400D11 SmartNIC를 선택했습니다. 이 솔루션은 10나노초의 정확한 대기 시간 측정 정확도로 200G 전송 처리량을 보장했습니다.
이익
이 솔루션을 통해 Netitest는 고성능 트래픽 흐름을 시뮬레이션하여 RoCE v2 스위치와 RDMA 네트워크 카드 모두에 대한 대역폭과 지연 시간을 정확하게 테스트할 수 있었습니다. 이를 통해 AI 훈련 네트워크의 철저한 평가와 최적화가 가능해졌습니다.
Netitest는 Napatech의 NT400D11 2 x 100G SmartNIC과 Link-Capture™ 소프트웨어를 사용하여 AI 교육 환경을 최적화하여 패킷 손실 없, 초저지연 및 최 처리량을 달성했습니다. 이 솔루션은 정확한 200G RoCE v2 트래픽 처리 및 10나노초 지연 측정을 가능하게 했으며, 이는 AI 워크로드에서 네트워크 효율성을 테스트하고 개선하는 데 필수적입니다.
AI 훈련의 과제
모델 성능 최적화, 분산 컴퓨팅 프레임워크 평가 및 원활한 배포는 모두 AI 훈련 성공에 중요한 요인입니다. 네트워크 성능은 이러한 프로세스에서 핵심적인 역할을 하며, 효율성을 극대화하고 AI 워크로드의 병목 현상을 피하기 위해 Netitest는 10nano sec의 latency 측정 정확도를 유지하면서 200G RoCE v2 트래픽을 처리할 수 있는 SmartNIC이 필요했습니다.
구체적인 요구 사항은 다음과 같습니다.
고성능 네트워크 스위치의 대역폭과 지연 시간을 평가하기 위해 RoCE v2(RDMA over Converged Ethernet 버전 2) 트래픽의 송수신을 시뮬레이션합니다.
RDMA(Remote Direct Memory Access) 네트워크의 송신단을 시뮬레이션하고 수신단과 연결을 설정합니다. 이를 통해 읽기/쓰기 작업을 통해 RDMA 네트워크 카드의 처리량과 대기 시간 성능을 테스트할 수 있습니다.
Solution
이러한 과제를 해결하기 위해 Netitest는 Napatech NT400D11 2 x 100G SmartNIC with Link-Capture™ 소프트웨어를 Supernova Physical Tester에 통합했습니다. 이 솔루션은 AI 훈련에서 네트워크 환경 테스트에 필요한 엄격한 국제 표준을 충족하며 다음과 같은 사항을 보장했습니다.
No Packet Loss
Ultra Low Latency
High Throughput

Benefits
2포트 100G 솔루션: SmartNIC은 네트워크 트래픽의 원활한 처리를 보장하여 매우 높은 데이터 속도에서도 신뢰할 수 있는 테스트 결과를 제공합니다.
균일한 패킷 전송: 10나노초 이내의 정확한 타임 스탬프를 통해 이 솔루션은 전송/수신 시간을 정확하게 측정할 수 있는데, 이는 AI 학습 네트워크의 효율성을 평가하는 데 중요합니다.
이러한 파트너십을 통해 Netitest는 AI 학습 환경을 테스트하고, 네트워크 리소스를 최적화하고, AI 워크로드에서 최고 수준의 성능을 보장하기 위한 최첨단 솔루션을 개발했습니다.
Comentarii