96GB GDDR7 탑재, GB202 GPU 사용, CUDA 코어 24,064개 RTX 5090엔 32GB GDDR7, CUDA 코어 21,760개
엔비디아 RTX50 이미지. (출처=엔비디아)
[애플경제 이윤순 기자]
엔비디아가 보급형 RTX 50 카드에 충분한 VRAM(VM, 휘발성메모리)을 제공하지 않는다는 불만이 나돌고 있지만, 고사양 제품에서는 그런 문제가 없는 것으로 보인다.
최근 테크스토리, 더블시시에프테크 등에 따르면 엔비디아는 주력 소비자용 RTX 5090에 32GB GDDR7을 탑재하는 한편, 96GB의 초고속 오류 정정 코드(ECC) 비디오 메모리를 탑재한 전문가용 카드를 출시했다.
또한 엔비디아 ‘RTX Pro 6000 블랙웰 워크스테이션’ 에디션은 GB202 GPU를 거의 모두 사용하며, 무려 24,064개의 CUDA 코어를 자랑한다. 이에 비하면 RTX 5090의 21,760개는 비교적 ‘평범’해 보일 정도다.
여기서 끝이 아니다. Pro 6000은 RT 및 텐서 코어도 더 많다. 엔비디아는 정확한 수치를 공개하지 않았지만, ‘TFLOPS’ 등급을 통해 대략 추정할 수는 있다. 엔비디아는 해당 카드의 레이 트레이싱 성능이 ‘380 TFLOPS’라고 주장한다. 이는 RTX 5090보다 ‘68 TFLOPS’나 더 높은 수치다.
그렇다면 RTX 5090가 RT 코어 170개인 점을 감안할 경우, RTX Pro 6000의 RT 코어 수는 약 210개에 달하는 것으로 추정된다. RTX 5090은 5세대 텐서 코어 680개를 탑재한 반면, RTX Pro 6000은 약 810개를 탑재했다.
‘PCGamer’는 또한 “부스트 클럭은 2.6GHz로 RTX 5090보다 200MHz 더 높다”면서도 “이렇게 추가된 하드웨어와 전력으로 인해 TDP는 최대 600W로 증가할 뿐”이라고 했다.
하지만 VRAM에서 바로 게임을 구동한다는 장점에도 불구, RTX Pro 6000은 비싸다는게 문제다.
이는 AI 교육, 3D 모델링, 과학 연구를 수행하는 전문가를 위해 설계되었기 때문에 가격이 미화로 무려 8,500달러(한화 약 1200만원)에 달한다.
이 정도면 권장 소비자가 기준으로 RTX 5090를 4대, 또는 출시 후 가격이 인상된 경우라도 최소 2대는 살 수 있다.
드라이버 문제도 있다. RTX 5090은 부분적으로는 게임을 염두에 두고 설계되었다. 그러나 게임 성능 향상을 위해 특별히 설계된 드라이버가 탑재되어 있다.
반면 RTX Pro 6000은 다른 작업에 맞춰 설계되었기 때문에 이러한 워크로드에 최적화된 드라이버가 탑재되어 있다. 이런 워크로드 특성상 게임에선 기대에 미치지 못할 가능성이 높다.
만약 표준 5090 드라이버를 RTX Pro 6000과 호환되게만 하면, 그야말로 최고의 벤치마크 카드로 평가할 만하다.
한편, 엔비디아는 향상된 3GB GDDR7 모듈을 사용하는 RTX 50 시리즈 카드의 슈퍼 버전을 개발 중이라는 소문이 있다.
RTX 5080 슈퍼는 최대 24GB, RTX 5070 슈퍼는 최대 18GB까지 지원될 수 있다.
이는 저가형 RTX 5060 Ti와, RTX 5060에 탑재된 8GB보다 훨씬 뛰어난 성능이다.
최근 출시된 #NVIDIA #RTX #PRO 시리즈의 GPU로 인해 다시한번 시장의 뜨거운 주목을 받고 있습니다.
무엇보다 이번 NVIDIA RTX PRO 시리즈는 다양한 라인업으로 제대로 칼을 갈고온 모습 인데요~
각 모델별 어떤 업무에 적합한지 알아 보는 시간을 갖도록 하겠습니다.
NVIDIA RTX PRO 6000 Blackwell 사양 및 벤치 정보
먼저 가장 최상위 등급 제품인 NVIDIA RTX PRO 6000 Blackwell 제품의 사양 및 벤치 사이트에서의 정보를 확인해 보겠습니다. TSMC의 최신 4나노 공정과 GDDR7 등 최신 기술이 들어간 제품인 만큼 기존 제품에 비해 매우 뛰어난 성능을 보여 줍니다.
물론 단순 성능 수치만으로 보았을 때는 해당 제품보다 기존 제품이 더 뛰어난 제품들이 존재하나,
가성비는 최고라고 생각 합니다.
하기의 표를 보시면 아시겠지만, 현존 최강의 그래픽 카드로 불리는 GeForce RTX 5090보다 더욱 뛰어난 성능 수치를 보여주고 있습니다.
가히 끝판왕이 등장 한 것 같습니다.
물론 일반 소비자용 제품인 RTX 4090에 가격으로는 비할 바가 AI 딥러닝 용도로 사용되는 서버 & 워크스테이션 용도로 나온 GPU 중에서는 L40S 의 뒤를 이를 가성비 최고의 제품이 될 것이라고 생각 합니다.
물론 출시된지 얼마 안된지라 각 밴더사별 가격이 정확히 나와봐야 알겠지만 대략적으로 예상되는 온라인 시장에서의 노출 가격은 원화기준 1300~1600만원 정도 될 것으로 예상 됩니다. (정확한 금액은 아니니 참고만 하시기 바랍니다.)
NVIDIA RTX PRO 6000 Blackwell 과 기존 출시 GPU의 단순 성능 수치 자료
NVIDIA RTX PRO GPU 시리즈별 주요 사양 요약표
RTX PRO 6000 모델은 아래의 표에서와 같이 AI , 딥러닝 뿐만 아니아 고해상도 렌더링에도 사용이 될 것 같습니다.
그 이유는 모델명에서 알 수 있듯이 NVIDIA 는 RTX 명칭을 쓸 때 Ray Tracing 기능에 특화된 들어간 모델에 사용 하는데
기존 A100 에는 없고, L40S 에는 RT Core가 탑재 되어 있지만 훨씬 더 스펙이 향상 된 기능이 들어가 있기 때문 입니다.
따라서 AI/ML/DL 등에서 뿐만 아니라 고성능 그래픽 작업 등에서도 사용이 가능할 것으로 예상이 됩니다.
MODEL
Architecture
VRAM Size
FormFactor
Key Features
RTX PRO 2000
Blackwell GB202
16GB GDDR7 ECC
LP or Standard
Entry GPU, 전력효율 특화
RTX PRO 4000 SFF
Blackwell GB202
20GB GDDR7 ECC
SFF(Small)
협소한 공간에서의 고성능
RTX PRO 4000
Blackwell GB203
24GB GDDR7 ECC
FULL Size
전문그래픽, 콘텐츠 제작
RTX PRO 4500
Blackwell GB203
32GB GDDR7 ECC
FULL Size
시뮬레이션, 디자인 작업
RTX PRO 5000
Blackwell GB203
48GB GDDR7 ECC
FULL Size
고성능 시각화, 과학 연산
RTX PRO 6000
Blackwell GB206
96GB GDDR7 ECC
FULL Size
고해상도 렌더링, AI, 딥러닝
NVIDIA RTX PRO Blackwell 시리즈의 주요 특징
- GDDR7 ECC 메모리 체택하여 안정성 및 대역폭(전송속도)의 비약적인 향상 - Tensor & CUDA 코어의 강화
- 전력 효율 개선으로 인한 발열 및 소음의 최소화
- 서버/워크스테이션/랩탑 전용 모델의 출시로 인한 작업별 용도에 맞는 모델 선택 다양화
특히 가장 최상위 라인업인 RTX PRO 6000모델은 그 쓰임새가 매우 다양해서 L40S 이후로 가장 주목을 받는 모델이 될 것으로 예상 됩니다.
NVIDIA RTX PRO GPU 시리즈별 추천 용도
MODEL
추천 용도
비고
RTX PRO 2000
엔트리급 AI, 기업용 그래픽 업무
낮은 전력 소비, 효율성 중시
RTX PRO 4000 SFF
공간 제한이 있는 설비에서의 고성능
ITX/소형 워크스테이션
RTX PRO 4000
비쥬얼 콘텐츠 제작
전문가급 그래픽 연산
RTX PRO 4500
3D 애니메이션, 디자인 시뮬레이션
가격대비 뛰어난 성능
RTX PRO 5000
CAD, 과학 연산, 시각화
하이엔드 워크스테이션
RTX PRO 6000
AI훈련, VFX, HPC 연구
최고의 VRAM과 안정성
L40S를 이을 차세대 GPU - NVIDIA RTX PRO 시리즈 GPU
이번에 새롭게 출시된 NVIDIA RTX PRO 시리즈의 GPU들은 하기의 핵심적인 경쟁랙을 지니고 있으며,
매우 기대가 되는 모델 입니다.
1. 전문 애플리케이션 인증 및 최적화 (ISV Certification)
Autodesk, Adobe, Dassault Systèmes, Siemens, ANSYS, SolidWorks, Avid 등 주요 ISV(Independent Software Vendor)의 공식 인증을 받아, CAD, 3D 모델링, VFX, 시뮬레이션, 데이터 시각화 등의 전문 소프트웨어에서 최적의 호환성과 안정성제공.
예: GeForce에서는 발생할 수 있는 드라이버 호환 문제, 시각적 오류 등을 최소화.
2. ECC 메모리 및 안정성 중심 설계
일부 RTX A 시리즈(예: RTX A6000 등)는 ECC(Error Correction Code) 메모리를 지원하여 메모리 오류를 자동으로 수정함으로써 데이터 무결성과 시스템 안정성강화.
NVIDIA 최신 아키텍쳐인 블랙웰 (Blackwell)이 사용 되었으며, 기존에 많이 사용 되었던 #L40S GPU 대비 LLM 추론 처리량은 최대 5대, 유전체 염기서열 분석 약 7배, 텍스트-비디오 생성은 3.3배, 랜더링 속도 2배 이상이 각각 향상 되었다고 엔비디아는 밝히고 있습니다.
기존에 A100의 수급 문제로 인하여 가성비 좋은 L40S가 시장에서 큰 인기를 얻었고, 현재도 많은 고객사에서 찾고 있는 상황 입니다.
L40S도 이제 출시된지 좀 된 모델이어서 더욱 가격대 성능비가 좋은 뛰어난 모델로서 새롭게 출시된 RTX PRO 6000이 바톤을 넘겨 받을 수 있을지 본 포스팅을 통해 알아 보도록 하겠습니다.
NVIDIA RTX PRO 시리즈 라인업
참고용으로 이번에 출시된 RTX PRO 시리즈의 라인업을 안내해 드리오니 참고 하시기 바랍니다.
RTX PRO 6000은 블랙웰 서버 에디션 / 블랙웰 워크스테이션 에디션 / 맥스큐 워크스테이션 이렇게 총 3가지 버젼으로 출시 되었습니다.
* NVIDIA RTX Pro 시리즈 라인업
- 데이터 센터용 GPU : RTX PRO 6000 블랙웰 서버 에디션
- 데스크탑(워크스테이션)용 GPU : RTX PRO 6000 블랙웰 워크스테이션 에디션,