◆ GPU서버 / 서버(DELL,HPE,ASUS 신품 및 중고) / 워크스테이션 / 스토리지 / 네트워크 하드웨어 견적 문의 ◆
담당자 : 정지훈 부장 (영업부) / 010-9500-3099 / hoon@einsis.com
안녕하세요. ^^
주식회사 아인시스 아이엔씨 정지훈 부장 입니다.
이번에 저희 아인시스에 #NVIDIA #DGX A100 (320GB) 제품이 새롭게 입고 되어서 제품을 자세히 알아 보고자 입고기를 작성해 보게 되었습니다.
신품이 아닌 중고 제품으로 입고 되었으며, 가격이 어마어마한 제품이어서 쉽게 만나볼 수 없는 제품을 이번에 접할 수 있게 되어 좋은 경험이 된 것 같습니다.
NVIDIA DGX A100의 대응 제품으로는 DELL Technologies와, SUPERMICRO 등 여러 밴더에서도 출시가 되고 있지만 엔비디아 레퍼런스 제품 답게 제품의 완성도와 재질의 마감 퀄리티는 훨씬 뛰어나다고 개인적으로 생각 합니다.
제품 모습
입고된 DGX A100 제품의 모습 입니다.
타사 제품에 비해 훨씬 전면 베젤이 퀄리티 있는 멋진 모습으로 되어 있어서 딱 봐도 고가의 장비라는 느낌이 물씬 나네요.
전면 베젤을 제거하면 하기와 같이 전면에 큼지막한 펜과 NVMe U.2 SSD 슬롯이 보입니다.
또한 전면에서 D-SUB 단자와 USB 포트를 배치 함으로써 번거롭게 후면에 연결해야 하는 수고스러움을 덜어 줍니다.
전면 펜은 하기와 같이 상단의 누르는 부분을 누른 후 당기면 뺄 수 있는 구조로 되어 있으며, 시스템이 켜져 있는 상태에서도 탈부탁이 가능한 핫플러그를 지원 합니다.
전면의 NVMe 슬롯로 레치를 누르면서 앞으로 뺄 수 있는 핫스왑을 지원 합니다.
KIOXIA 사의 3.84TB U.2 NVMe 제품이 장착 되어 있습니다.
시스템의 우측에는 전원 버튼과 인포 버튼이 보입니다.
맨 하단에는 시스템 이상시 LED 색상으로 이상 상태를 알아 볼 수 있게끔 LED 상태 확인할 수 있게 하고 있습니다.
제품의 후면을 보면 고사양의 #A100 SXM 타입의 GPU와 Dual CPU 가 탑재된 고사양의 서버 제품임으로 개당 3000W 급의 고용량 파워가 6개 장착되어 있습니다.
당연하게 파워는 Redundant 방식으로 작동하며, 최소 작동 수량은 3개 입니다.
운용중 파워에 이상이 생겨도 3개 까지는 문제 없이 안정적인 사용이 가능 합니다.
파워서플라이는 운용중에 문제가 생겨도 쉽게 교체가 가능하게 핫스왑을 지원 하고 있습니다.
또한, Mellanox ConnectX-6 200GB HDR Card가 10개 지원하여 최대 500GB/s 의 양방향 대역폭을 지원 합니다.
우측에는 1G/10G를 지원하는 랜포트와, USB 포트, 그리고 BMC 포트를 제공 하고 있습니다.
BMC 설정을 하게 되면 크롬등의 웹브라우저에서 시스템의 상태를 면밀하게 관찰 할 수 있고, 원격 콘솔 기능을 지원해서 원격지에서도 서버를 바로 앞에 있는 것처럼 운용 할 수 있습니다.
서버는 크게 보았을때 3가지 섹션으로 구성되어 있습니다.
가장 상단은 GPU 노드, 중간은, CPU와 램 등이 장착된 일반 서버 노드, 맨 하단은 파워서플라이등이 장착 되는 전원 노드로 구분 됩니다.
각 노드들은 렛지를 당겨서 쉽게 분리가 가능하게 설계되어 있습니다.
하기와 같이 완전히 분리가 된 모습을 볼 수 있습니다.
GPU 노드쪽 후면을 보면 내부의 부품을 볼 수 있는데, 큼지막한 GPU 히트싱크와 여러 커넥터들이 보이네요.
노드를 재 장착시에는 커넥터에 손상이 가지 않도록 매우 유의를 기울여야 합니다.
GPU 노드의 상판을 제거해서 내부의 모습을 살펴 봤습니다.
역시 엔비디아 정품 모델이니 만큼 타사대비 매우 깔끔한 설계와 높은 퀄리티를 볼 수 있습니다.
GPU 부분을 가까이서 본 모습 입니다.
GPU는 아래에 숨겨져 있으며, 보이는 부분은 히트싱크 부분 입니다.
뒤집어서 보면 아래와 같은 모습을 하고 있습니다.
하기의 모습은 GPU에서 빠르게 생성되는 데이터를 GPU간에 초고속으로 처리 할 수 있게 해주는 NVLink Switch 부분 입니다.
PCI 카드 타입의 A100 에서는 NVLink Bridge 라는 파트가 별도로 사용 되지만, 해당 모델에서는 보드에 내장된 타입으로 되어 있습니다.
높은 발열로 인하여 히트싱크 높이도 어마어마한 것을 알 수 있습니다.
사진상 맨 앞 부분은 커넥터 부위이며, 바로 뒤에 솟아 있는 부분이 NVLink Switch 입니다.
서버쪽 노드도 레지를 당겨서 쉽게 열 수 있는 구조로 되어 있습니다.
당연하지만, 핫스왑은 지원되지 않으며 파워를 모두 제거하고 작업을 해야 합니다.
상판에는 각 슬롯들에 대해서 그림으로 설명 하고 있네요~
상판 덥개를 제거한 모습 입니다.
CPU와 메모리,PCI 슬롯에 장착된 Mellanox 200GB 카드가 보입니다.
상기 이미지 하단에 보시면 은색으로 된 PCI 슬롯에 꼽힌 파트가 보이는데, OS 설치용으로 기본 제공되는 2TB 정도 용량의 M.2 NVMe 슬롯입니다. 하기와 같이 2개가 기본 장착 되어 있습니다.
시스템 구동
시스템을 다시 조립 하고 전원을 인가하여 보았습니다.
엔비디아 정품 제품임으로 bios 화면에 멋진 엔비디아 로고가 보입니다.
해당 시스템은 AMD EPYC 7742 DUAL CPU가 장착되어 있으며, 시스템 메모리는 총 1TB 를 기본 제공 합니다.
바이오스는 익히 타 브랜드에서도 많이 사용 하는 AMI 바이오스가 사용되고 있네요.
BIOS 에 진입해서 NVME SSD의 모델을 확인해 보았는데 하기와 같이 삼성과, KIOXIA 제품이 사용 된 것 같습니다.
KIOXIA 3.84 TB U.2 NVMe SSD의 정보 이구요~
삼성 2TB M.2 NVMe SSD (OS 설치용) 디스크의 정보 입니다.
하기는 CPU와 RAM의 정보 입니다.
BMC 설정
본 장비도 슈퍼마이크로나, ASUS 서버들과 같이 BMC 설정을 통하여 시스템을 관리 할 수 있습니다.
바이오스 상의 하기 메뉴에서 BMC 네트워크 설정을 하면 WEB 관리 화면으로 접근이 가능 합니다.
BMC의 IP 설정을 하고 웹브라우저를 통하여 BMC 에 접속 하는 모습 입니다.
화면 구성이 참 깔끔하게 되어 있네요.
창찬할 만한 부분 입니다.
로그인을 하면 하기와 같이 매우 자세한 시스템의 상태를 확인 하며 관리 할 수 있습니다.
본 화면에 표출되는 정보는 IPMI 센서값을 통하여 반영해 준다고 보시면 될 것 같습니다.
(DELL이나 HPE 에서도 BMC와 같은 걸 ILO와 IDRAC 이라고 부르며 제공하고 있는 부분 참고 부탁 드립니다.)
A100 (40GB) 제품을 BMC 에서 확인 가능 합니다.
웹 콘솔을 통하여 원격지에서 하기와 같이 시스템에 접속해 볼 수 있습니다.
네트워크에 연결되어 있다면, 전세계 어디에서도 원격지에서 서버에 직접 오지 않아도 OS 설치부터 서버 리부팅등 전부 가능 합니다.
참 편리한 기능이라고 할 수 있습니다.
(DELL이나 HPE의 경우에는 라이선스를 구매를 통하여 가능한 부분인데 해당 장비의 경우 고가의 장비이다 보니 기본 무료로 원격 콘솔을 지원 하는 것 같았습니다.)
포스팅을 마치며..
이번에 NVIDIA DGX A100 서버를 만져볼 수 있는 좋은 기회가 생겨서 이렇게 하드웨어 리뷰를 작성해 볼 수 있었습니다.
개인적으로 느낀점은 타사의 제품에 비해 NVIDIA 제품은 케이블이 거의 없는 일체형 구조여서 사람의 실수에 의한 문제 발생 소지가 매우 낮고, 유지보수가 참 편리하게 설계된 제품이라는 느낌을 강하게 받았습니다.
역시 설계의 엔비디아 입니다!
앞으로도 다양한 IT 제품에 대해서 알아보는 시간을 자주 갖도록 하겠습니다.
본 장비는 저희 아인시스를 통하여 구매가 가능하며, 제품이나 견적관련 문의는 하기로 연락 주시면 감사 하겠습니다.
이상, 아인시스의 정지훈 부장 이었습니다.
감사 합니다.
◆ GPU서버 / 서버(DELL,HPE,ASUS 신품 및 중고) / 워크스테이션 / 스토리지 / 네트워크 하드웨어 견적 문의 ◆
담당자 : 정지훈 부장 (영업부) / 010-9500-3099 / hoon@einsis.com
EINSIS/아인시스/einsis/아인시스아이엔씨/아인시스기술지원/스위치/스위치 기술지원비(비용)/스위치 설치비/방화벽/방화벽 기술지원비(비용)/방화벽 설치비/랙/랙(RACK) 기술지원비(비용)/랙(RACK) 설치비/KVM/KVM 기술지원비(비용)/KVM 설치비/스토리지/스토리지 기술지원비(비용)/스토리지 설치비/스토리지 랙마운트비용/스토리지 장애조치비용/서버/서버 기술지원비(비용)/서버 설치비/서버 랙마운트비용/서버 장애조치비용/윈도우서버/윈도우즈 기술지원비(비용)/윈도우즈 설치비/리눅스/Linux/리눅스 기술지원비(비용)/리눅스 설치비/DB/데이터베이스/MySQL 기술지원비(비용)/MySQL 설치비/MSSQL 기술지원비(비용)/MSSQL 설치비/백업 기술지원비(비용)/HPE서버비용/HPE/DL20/DL20GEN10/ML30/ML30GEN10/ML360/ML350GEN10/DL360/DL360Gen10/DL380/DL380Gen10/LENOVO서버/레노보서버/델서버/델서버비용/DELLR540/DELLR750/HP서버/서버엔지니어/서버기술지원/서버디스크장애처리/방화벽/방화벽엔지니어/APC UPS/UPS/UPS설치/UPS기술지원/UPS납품/서버렉마운트/HPE Service Pack for Proliant/HPE SPP/SPP/Intelligent Provisioning/시놀로지나스/나스기술지원/SYNOLOGY/SYNOLOGY나스/시놀로지DS918/시놀로지하이퍼백업/HYPER BACKUP/시놀로지HyperBackup/시놀로지나스백업/서버백업/서버트러블슈팅/리눅스트러블슈팅/보안솔루션/시큐어디스크/인터넷디스크/이스트소프트/알약/카스퍼스키/ESTSOFT/V3/안랩/소포스/SOPHOS/카보나이트/더블테이크/이중화솔루션/HA솔루션/Windows서버설치/왼도우서버설치/윈도우서버2019/윈도우서버2016/MSSQL/MYSQL/디포그랙/DEFOG랙/디포그랙가격/EDFOG랙가격/RMS랙/서버납품/랙납품설치/랙설치/나스설치지원/스토리지납품설치/윈도우서버트러블슈팅/리눅스서버트러블슈팅/HPE서버펌웨어/HP서버펌웨어/HPE서버/FIRMWARE/DELL서버펌웨어/델서버펌웨어업데이트/레노보서버펌웨어/LENOVO펌웨어업데이트/HPE서버드라이버설치/HPE서버구매/DELL서버구매/LENOVO서버구매/보안솔루션구매/이중화솔루션구매/보안솔루션설치/이중화솔루션설치/HPE서버가격비교/DELL서버가격비교/LENOVO서버가격비교/HPE서버가격비교견적/DELL서버가격비교견적/LENOVO서버가격비교견적/HPE서버견적/DELL서버견적/LENOVO서버견적/HPE서버디스크교체/DELL서버디스크교체/LENOVO서버디스크교체/HPE서버RAID컨트롤러/HPE서버RAID컨트롤러/DELL서버RAID컨트롤러/LENOVO서버RAID컨트롤러/HP서버하드디스크/HPE서버하드디스크구매/DELL서버하드디스크구매/LENOVO서버하드디스크구매/HPE서버SAS하드디스크/DELL서버SAS하드디스크/LENONO서버SAS하드디스크/HPE서버메모리/DELL서버메모리/LENOVO서버메모리/HP서버메모리/HPE서버CPU/DELL서버CPU/LENOVO서버CPU/서버CPU/서버메모리/서버MEMORY/ECC메모리/서버용메모리/서버용하드디스크/서버용그래픽카드/쿼드로P400/QUADRO그래픽카드/QUADRO/우분투설치/서버보안/네트워크장비/네트워크스위치/L2스위치/L3스위치/OS설치/서버OS설치/리눅스서버설치/우분투설치/페도라설치/레드헷설치/RHEL설치/워크스테이션/서버/hp워크스테이션/서버컴퓨터/델워크스테이션/hp서버/미니서버랙/중고서버/hpz4/dell워크스테이션/서버pc/hpz4g4/중고워크스테이션/hpz440/레노버p620/서버용컴퓨터/델서버/레노버워크스테이션/hpz420/dell서버/인스퍼/INSPURE/인스퍼서버/R760/R750//R250/R350/R750xs/GPU서버/AI서버/HPPC구매/델서버견적/델워크스테이션견적/A100/L40S/H00/A6000/A5000/A4000/A2000/T400/델서버쇼핑몰/중고서버/HP중고서버/7920T/7960T/5860T/7960T/델워크스테이션/einmall/아인몰/dgxa100/DGXA100
'기술자료 > GPU & AI & ML & DL' 카테고리의 다른 글
[NPU] NPU (Neural Processing Unit) 란? NPU 전문 기업 모빌린트(Mobilint)에 대한 소개 (0) | 2025.01.20 |
---|---|
[GPU] NVIDIA L40S - LLM(Large Language Model)에 특화된 GPU (0) | 2024.12.27 |
[GPU] A100 과 H100의 차세대 GPU인 H200에 대하여 알아보자! (0) | 2024.12.13 |