96GB GDDR7 탑재, GB202 GPU 사용, CUDA 코어 24,064개 RTX 5090엔 32GB GDDR7, CUDA 코어 21,760개
엔비디아 RTX50 이미지. (출처=엔비디아)
[애플경제 이윤순 기자]
엔비디아가 보급형 RTX 50 카드에 충분한 VRAM(VM, 휘발성메모리)을 제공하지 않는다는 불만이 나돌고 있지만, 고사양 제품에서는 그런 문제가 없는 것으로 보인다.
최근 테크스토리, 더블시시에프테크 등에 따르면 엔비디아는 주력 소비자용 RTX 5090에 32GB GDDR7을 탑재하는 한편, 96GB의 초고속 오류 정정 코드(ECC) 비디오 메모리를 탑재한 전문가용 카드를 출시했다.
또한 엔비디아 ‘RTX Pro 6000 블랙웰 워크스테이션’ 에디션은 GB202 GPU를 거의 모두 사용하며, 무려 24,064개의 CUDA 코어를 자랑한다. 이에 비하면 RTX 5090의 21,760개는 비교적 ‘평범’해 보일 정도다.
여기서 끝이 아니다. Pro 6000은 RT 및 텐서 코어도 더 많다. 엔비디아는 정확한 수치를 공개하지 않았지만, ‘TFLOPS’ 등급을 통해 대략 추정할 수는 있다. 엔비디아는 해당 카드의 레이 트레이싱 성능이 ‘380 TFLOPS’라고 주장한다. 이는 RTX 5090보다 ‘68 TFLOPS’나 더 높은 수치다.
그렇다면 RTX 5090가 RT 코어 170개인 점을 감안할 경우, RTX Pro 6000의 RT 코어 수는 약 210개에 달하는 것으로 추정된다. RTX 5090은 5세대 텐서 코어 680개를 탑재한 반면, RTX Pro 6000은 약 810개를 탑재했다.
‘PCGamer’는 또한 “부스트 클럭은 2.6GHz로 RTX 5090보다 200MHz 더 높다”면서도 “이렇게 추가된 하드웨어와 전력으로 인해 TDP는 최대 600W로 증가할 뿐”이라고 했다.
하지만 VRAM에서 바로 게임을 구동한다는 장점에도 불구, RTX Pro 6000은 비싸다는게 문제다.
이는 AI 교육, 3D 모델링, 과학 연구를 수행하는 전문가를 위해 설계되었기 때문에 가격이 미화로 무려 8,500달러(한화 약 1200만원)에 달한다.
이 정도면 권장 소비자가 기준으로 RTX 5090를 4대, 또는 출시 후 가격이 인상된 경우라도 최소 2대는 살 수 있다.
드라이버 문제도 있다. RTX 5090은 부분적으로는 게임을 염두에 두고 설계되었다. 그러나 게임 성능 향상을 위해 특별히 설계된 드라이버가 탑재되어 있다.
반면 RTX Pro 6000은 다른 작업에 맞춰 설계되었기 때문에 이러한 워크로드에 최적화된 드라이버가 탑재되어 있다. 이런 워크로드 특성상 게임에선 기대에 미치지 못할 가능성이 높다.
만약 표준 5090 드라이버를 RTX Pro 6000과 호환되게만 하면, 그야말로 최고의 벤치마크 카드로 평가할 만하다.
한편, 엔비디아는 향상된 3GB GDDR7 모듈을 사용하는 RTX 50 시리즈 카드의 슈퍼 버전을 개발 중이라는 소문이 있다.
RTX 5080 슈퍼는 최대 24GB, RTX 5070 슈퍼는 최대 18GB까지 지원될 수 있다.
이는 저가형 RTX 5060 Ti와, RTX 5060에 탑재된 8GB보다 훨씬 뛰어난 성능이다.
NVIDIA RTX PRO 6000 Blackwell 서버 에디션은 비주얼 컴퓨팅과 엔터프라이즈 AI를 위해 구축된 최초의 NVIDIA Blackwell 기반 데이터센터 GPU입니다. 모든 산업에서 가장 높은 성능을 요구하는 AI, 그래픽 애플리케이션을 신속하게 처리할 수 있도록 설계됐습니다.
이전 세대 NVIDIA Ada Lovelace 아키텍처 L40S GPU에 비해 RTX PRO 6000 Blackwell 서버 에디션 GPU는 다양한 엔터프라이즈 워크로드에서 성능이 크게 향상됐습니다.
예를 들어,에이전틱 AI(Agentic AI)애플리케이션을 위한거대 언어 모델(LLM)추론 처리량은 최대 5배 증가되고, 유전체 염기서열 분석은 약 7배로 가속화되며, 텍스트-비디오 생성은 3.3배, 렌더링 속도는 2배 이상 빨라졌습니다.
이번NVIDIA GTC에서 발표된 RTX PRO 라인업은 여러 산업의 AI와 창의적인 워크로드를 지원하는 데스크톱, 랩톱, 데이터센터 GPU로 구성됩니다.
여러 분야의 기업들은 RTX PRO 6000 Blackwell 서버 에디션을 통해 데이터 분석, 엔지니어링 시뮬레이션, 생성형 AI, 비주얼 컴퓨팅과 같은 워크로드에서 획기적인 성능을 구현할 수 있습니다.
여기에는 건축, 자동차, 클라우드 서비스, 금융 서비스, 게임 개발, 의료, 제조, 미디어, 엔터테인먼트, 소매업 등의 산업이 포함됩니다.
콘텐츠 제작, 반도체 제조, 유전체 분석 기업들은 이미 컴퓨팅 집약적인 AI 지원 워크플로우를 가속화하기 위해 RTX PRO 6000 Blackwell 서버 에디션의 기능을 활용하고 있습니다.
AI와 그래픽에 강력한 기능을 제공하는 범용 GPU
RTX PRO 6000 Blackwell 서버 에디션은 데이터센터 환경에서 연중무휴 24시간 운영할 수 있게 설계된 수동 냉각 장치 형태로 강력한 RTX AI와 그래픽 기능을 제공합니다.
96GB의 초고속 GDDR7 메모리와멀티 인스턴스 GPU(Multi-Instance GPU, MIG)를 갖춘 RTX PRO 6000은 최대 4개의 완전히 격리된 인스턴스로 분할될 수 있는데요. 각 인스턴스는 24GB의 메모리를 사용할 수 있어, AI 워크로드와 그래픽 워크로드를 동시에 실행할 수 있습니다.
이를 통해 이미지와 비디오 생성, LLM 추론,추천 시스템, 컴퓨터 비전, 디지털 트윈, 로보틱스 시뮬레이션 등의 에이전틱 AI, 물리 AI 애플리케이션 개발과 배포를 더욱 원활하게 진행할 수 있습니다.
모든 산업을 위한 가속 AI 추론과 비주얼 컴퓨팅
블랙 포레스트 랩스(Black Forest Labs)는 인기 이미지 생성 AI인 플럭스(FLUX)를 개발했습니다.
이들은 RTX PRO 6000 서버 에디션 GPU를 사용해 최첨단 텍스트-이미지 모델을 개발하고 최적화할 계획입니다.
블랙 포레스트 랩스의 CEO인 로빈 롬바흐(Robin Rombach)는 “RTX PRO 6000 서버 에디션의 강력한 멀티모달 추론 기능을 통해 고객은 이미지 생성 워크플로우의 지연 시간을 크게 줄일 수 있습니다.
서버 에디션 GPU의 FP4 정밀도 지원으로 플럭스 모델 실행 속도가 빨라져, 인터랙티브한 AI 가속 콘텐츠 제작이 가능해질 것으로 기대합니다”고 말했습니다.
클라우드 그래픽 회사인 오토이(OTOY)는 자사 옥테인렌더(OctaneRender) 실시간 렌더링 애플리케이션을 NVIDIA RTX PRO 6000 Blackwell 서버 에디션 GPU에 최적화할 예정입니다.
오토이 CEO 겸 렌더 네트워크(Render Network) 창립자인 줄스 어백(Jules Urbach)은 “새로운 NVIDIA RTX PRO 6000 Blackwell 서버 에디션 GPU는 이전까지 3D 콘텐츠 크리에이터가 접근할 수 없었던 새로운 워크플로우를 엽니다.
96GB의 VRAM을 갖춘 새로운 서버 에디션 GPU는 옥테인렌더의 GPU 패스 트레이서 내에서 복잡한 신경 렌더링 모델을 실행할 수 있죠. 따라서 아티스트는 기존 CGI의 정밀도와 최첨단 생성형 AI 기술을 결합한 놀라운 새 기능과 도구를 활용할 수 있습니다”고 설명했습니다.
반도체 장비 제조업체인 KLA 역시 RTX PRO 6000 Blackwell 서버 에디션을 사용할 계획입니다.
이를 통해 반도체 재료의 얇은 디스크를 만들어 집적 회로의 핵심이 되는 웨이퍼 제조 공정의 추론 워크로드를 가속화할 계획입니다.
NVIDIA와 KLA는 2008년부터 협력해 최적화된 고성능 컴퓨팅 솔루션으로 KLA의 물리 기반 AI를 발전시켜 왔습니다.
업계 최고인 KLA의 검사, 계측 시스템은 복잡한 AI 알고리즘을 초고속으로 실행해 이미지를 캡처하고 처리하며 가장 중요한 반도체 결함을 찾아내죠.
KLA 선임 연구원 겸 AI 이니셔티브 담당 부사장인 크리스 바스카(Kris Bhaskar)는 “초기 결과에 비추어 봤을 때, RTX PRO 6000 Blackwell 서버 에디션의 뛰어난 성능이 기대됩니다.
확대된 메모리 용량, FP4를 통해 감소된 정밀도, NVIDIA Blackwell의 새로운 연산 기능은 KLA와 고객들에게 특히 유용할 것”이라고 말했습니다.
유전체, 신약 개발 워크로드 가속화
RTX PRO 6000 Blackwell 서버 에디션은 새로운 종류의 동적 계획법 명령어를 통해 유전체 분석과 신약 개발 추론 워크로드를 획기적으로 빠르게 수행하도록 지원합니다.
생식세포 분석을 위한 NVIDIA Parabricks 플랫폼의 구성 요소인 패스트q2밤(Fastq2bam)이나 딥베리언트(DeepVariant)를 하나의 RTX PRO 6000 Blackwell 서버 에디션 GPU에서 수행하면, L40S GPU 대비 최대 1.5배, NVIDIA H100 GPU 대비 최대 1.75배 빠르게 실행됩니다.
염기서열 정렬과 변이 검출 애플리케이션에서 많이 사용되는 알고리즘인 스미스-워터맨(Smith-Waterman)의 경우, RTX PRO 6000 Blackwell 서버 에디션 GPU에서 실행될 때 L40S GPU 대비 처리량이 최대 6.8배까지 가속화됩니다.
또한, 신약 개발 연구에 있어 단백질 구조를 예측하는 AI 모델인 OpenFold2의 경우, RTX PRO 6000 Blackwell 서버 에디션 GPU에서 실행될 때 L40S GPU 대비 추론 성능이 최대 4.8배까지 향상됩니다.
유전체학 회사인 옥스퍼드 나노포어 테크놀로지스(Oxford Nanopore Technologies)는 NVIDIA와 협력해 자사 염기서열 분석 시스템에 최신 AI와 가속 컴퓨팅 기술을 도입하고 있습니다.
옥스퍼드 나노포어 테크놀로지스 고급 플랫폼 개발 담당 부사장인 크리스 시모어(Chris Seymour)는 “NVIDIA Blackwell 아키텍처는 누구나 어디서나 실시간 염기서열 분석을 수행할 수 있도록 도와줄 것”이며, “RTX PRO 6000 Blackwell 서버 에디션을 통해 도라도(Dorado) 플랫폼 전반에서 염기 베이스 결정 속도가 최대 2배까지 향상되는 것을 경험했습니다”고 말했습니다.
전 세계 시스템 파트너와 클라우드 제공업체 네트워크를 통해 출시
RTX PRO 6000 Blackwell 서버 에디션이 탑재된 플랫폼은 5월부터 전 세계 파트너들을 통해 출시될 예정입니다.
클라우드 서비스 제공업체와 GPU 클라우드 제공업체 중에서는 아마존 웹 서비스(Amazon Web Services, AWS), 구글 클라우드(Google Cloud), 마이크로소프트 애저(Microsoft Azure), IBM 클라우드(IBM Cloud), 코어위브(CoreWeave), 크루소(Crusoe), 람다(Lambda), 네비우스(Nebius), 벌처(Vultr)가 최초로 RTX PRO 6000 Blackwell 서버 에디션을 탑재한 인스턴스를 제공할 계획입니다.
시스코(Cisco), 델 테크놀로지스(Dell Technologies), 휴렛팩커드 엔터프라이즈(Hewlett Packard Enterprise, HPE),레노버(Lenovo), 슈퍼마이크로(Supermicro)는 RTX PRO 6000 Blackwell 서버 에디션을 탑재한 서버를 제공할 예정입니다.
그 외에도어드밴텍(Advantech), 애티나(Aetina),에이브레스(Aivres), 애즈락랙(ASRockRack),에이수스(ASUS), 컴팔(Compal), 폭스콘(Foxconn), 기가바이트(GIGABYTE), 인벤텍(Inventec), MSI,페가트론(Pegatron), 퀀타 클라우드 테크놀로지(Quanta Cloud Technology, QCT), 미텍 컴퓨팅(MiTAC Computing), 네이션게이트(NationGate), 위스트론(Wistron), 위윈(Wiwynn) 등의 기업들도 이 서버를 제공할 계획이죠.
하기의 NVIDIA GTC 키노트를 시청해 보다 자세한 정보를 확인해 보세요.
포스팅을 마치면서
이번에 NVIDIA RTX PRO 6000 이라는 GPU가 출시 되면서 시장에 큰 주목을 받고 있는 상황 입니다.
출시된지 얼마 안된 소비자용 게이밍 그래픽 카드의 최고 상위 제품인 RTX 5090 보다 오히려 VRAM / RT Core / CUDA Core 등 모든 부분을 앞서는 뛰어난 성능으로 출시되어 소비자용 그래픽 카드는 엔비디아가 외면하고 있는것이 아닌가 하는 오해도 불러 일으키고 있는 상황입니다.
물론 소비자용 그래픽 카드에 비해 단가는 훨씬 높겠지만, 용도 자체가 틀린 카드인만큼 출시 후에 시장에서 어느정도의 인기를 얻을지 무척 기대가 되는 제품 입니다.
오늘은 NVIDIA RTX PRO 6000 제품에 대해 포스팅을 진행해 보았는데요, 앞으로로 새로운 소식이 나오는대로 더 좋은 내용으로 찾아 뵙도록 하겠습니다.
제품에 관한 견적 및 문의는 하기에 나와있는 연락처로 부탁 드립니다. ^^
이상. 아인시스의 정지훈 부장 이었습니다.
감사 합니다.
◆ GPU서버 / 서버(DELL,HPE,ASUS 신품 및 중고) / 워크스테이션 / 스토리지 / 네트워크 하드웨어 견적 문의 ◆ 담당자 : 정지훈 부장 (영업부) / 010-9500-3099 / hoon@einsis.com