현재 위치:홈페이지 > 종합

엔비디아 GTC 2024 개최, ‘블랙웰’과 ‘NIMS’로 인공지능 생태계 강화 나선다

엔비디아 GTC 2024 개최, ‘블랙웰’과 ‘NIMS’로 인공지능 생태계 강화 나선다

GTC 2024 기조연설에 나선 젠슨 황 엔비디아 CEO. / 출처=엔비디아


2024년 3월 18일, 세너제이 SAP 센터(미국 캘리포니아 소재)에서 젠슨 황(Jensen Huang) 엔비디아 CEO의 기조연설을 시작으로 GTC 2024가 막을 올렸다. GTC는 엔비디아가 매년 진행하는 컨퍼런스로 그래픽 처리 관련 기술을 포함해 인공지능, 가속 컴퓨팅, 데이터 과학, 데이터 센터 등 다양한 분야를 다룬다. 특히 엔터프라이즈 시장을 겨냥한 신제품과 기술을 공개하는 자리여서 시장의 관심도가 높다.

GTC 2024는 투자자 입장에서도 주목도가 높은 행사로 꼽힌다. 2022년 10월 이후 꾸준히 우상향해 온 엔비디아가 그 모멘텀을 이끌어갈 수 있는지가 이번 행사를 통해 결정될 가능성이 높다고 봤기 때문. 현재 엔비디아 주가는 지난 3월 8일, 974 달러를 기록한 이후 특별한 가격 움직임이 없는 상태다.

젠슨 황 CEO는 그의 상징과도 같은 검은 가죽 재킷을 입고 등장했다. 그는 “놀라운 일이 벌어지고 있다. 컴퓨팅의 근본적인 변화가 산업에 영향을 주고 있다”면서 2006년에 엔비디아가 제안한 쿠다(CUDA – Compute Unified Device Architecture)를 언급했다.

쿠다는 엔비디아가 그래픽 처리 과정의 효율화와 성능 향상을 고려해 개발한 명령어로 당시 페르미(Fermi) 설계에 기반한 지포스 GTX 400 시리즈 이상 그래픽카드에 적용되기 시작했다. 칩 안에 다수의 쿠다코어를 구성하고 데이터를 병렬로 처리해 성능을 높일 수 있었다. 이후 이 구조가 대규모 데이터 처리에 능하다는 것이 알려졌고 현재 인공지능 처리에 쓰일 정도로 발전했다.

쿠다와 컴퓨팅 산업 발전에 대해 언급한 젠슨 황 CEO는 컴퓨팅의 다음을 언급했다. 그리고 차세대 인공지능 가속장치이자 그래픽 처리장치(GPU)인 블랙웰(Blackwell)을 공개했다.

차세대 인공지능 가속장치 ‘블랙웰’ 공개

젠슨 황 CEO는 “사람들은 우리가 GPU를 만든다고 생각하고 실제 만들고 있지만, 이제 GPU를 과거처럼 보지 않는다. 호퍼는 세상을 바꿨지만, 지속 가능한 컴퓨팅을 위해서는 더 큰 칩이 필요하다”라며 차세대 인공지능 연산장치 코드명 블랙웰을 공개했다.

블랙웰은 수학자 데이비드 블랙웰(David Harold Blackwell)에서 따왔다. 통계, 게임 이론 및 정보 이론을 전문으로 다룬 미국의 통계학자이자 수학자로 알려져 있다. 엔비디아는 그간 자사의 칩 코드명을 수학자, 물리학자 등의 이름에서 채택해 왔다. H100의 코드명인 호퍼도 코볼의 어머니이자 컴퓨터 과학자였던 미 해군 제독 그레이스 호퍼(Grace Hopper)에서 유래한 것이다.

젠슨 황 엔비디아 CEO가 블랙웰(좌)을 공개했다. / 출처=엔비디아


블랙웰의 제품명은 B200이다. 엔비디아는 이번 칩을 독특하게 구성했다. 2개의 칩을 하나로 구성한 것이다. 덕분에 칩은 호퍼의 2배 가량으로 거대해졌으나 처리 속도는 크게 높일 수 있었다. 칩 옆에는 데이터를 빠르게 주고받을 수 있도록 192GB 용량의 HBM3e 메모리를 배치했다. 엔비디아는 H100 대비 최대 30배 성능 향상을 이뤘다고 설명한다.

블랙웰은 호퍼 대비 큰 폭의 성능 향상이 이뤄졌음을 강조한다. 특히 B200에는 2세대 트랜스포머 엔진이 적용됐는데 FP4, FP6 단위의 부동소수점 연산 기능이 새로 추가됐다. 기존에는 반정밀도(FP16) 이하의 부동소수점 연산을 FP16 처리 코어에서 직접 처리했기에 효율이 떨어지는 부분이 있었지만, 이번에는 코어 1개가 점유하는 구조를 어느 정도 개선했을 것으로 예상된다.

2세대 트랜스포머 엔진을 통해 블랙웰은 호퍼 대비 부동소수점 연산 능력을 5배 이상 높였다. FP8, FP6 연산은 20 페타플롭스(PFLOPS), FP4 연산은 40 페타플롭스에 달하는 성능을

블랙웰은 호퍼 대비 칩이 2배 가량 커졌지만, 성능 향상은 매우 크다. / 출처=엔비디아


젠슨 황 CEO는 “두 칩을 하나로 구성했지만, 우려하는 성능 저하는 없을 것”이라고 강조했다. 두 칩 사이를 초당 10 테라바이트(TB/s)의 대역폭으로 이동하며 메모리와 캐시 사용에도 문제가 없다고 덧붙였다.

GB200은 2개의 B200 칩과 그레이스(Grace) 설계 구조의 중앙처리장치가 하나로 구성된 형태다. 그레이스 처리장치는 ARM 설계를 바탕으로 전력소모는 낮추면서 최적의 성능을 내는데 초점이 맞춰져 있다. 무엇보다 구조를 단순하게 만들어 크기를 대폭 줄인 것이 인상적이다. 제한적인 데이터센터 내 공간에 많은 장치를 구성, 성능과 효율을 높이는 방향으로 설계가 이뤄졌음을 알 수 있다.

하드웨어와 소프트웨어로 엔비디아 AI 생태계 구축 강조

젠슨 황 CEO는 기조연설에서 차세대 인공지능 가속처리장치 공개 외에도 디지털 트윈에 대한 사례와 로보틱스, 인공지능 발전 등에 대해 언급했다. 그는 “우리는 많은 것을 디지털화하고 있다. 구조가 있는 한 모든 것을 디지털화할 수 있다. 생성형 인공지능 혁명은 지금부터”라고 말했다.

엔비디아는 인공지능을 적극 활용해 데이터 과학, 헬스케어 등 광범위한 분야에 적용되도록 준비했고 동시에 엔비디아 추론 마이크로서비스(NVIDIA Inference Microservice)를 제안했다. 오픈 소스로 사전 훈련된 인공지능 모델을 패키지로 제공, 최적의 결과를 도출하는 방식이다. 자사가 개발한 컴퓨터 언어 쿠다(CUDA) 기반으로 작동한다.

엔비디아 추론 마이크로서비스는 엔비디아의 생태계 장악력을 높이는데 큰 역할을 할 전망이다. 개발자들이 주로 사용하는 라이브러리와 호환성을 최대한 제공하고, 선호하는 대규모 언어 모델 프로그래밍 프레임워크를 사용해 작업도 가능하다. 몇 줄의 코드만 입력하는 것으로 해당 서비스를 이용할 준비가 완료된다. 젠슨 황 CEO는 “NIMS(엔비디아 추론 마이크로서비스)가 모든 것을 실행한다”고 말했다.

옴니버스 플랫폼을 활용한 디지털 트윈 사례는 점점 강화되고 있다. / 출처=엔비디아


디지털과 물리적 환경을 연결, 산업의 디지털 전환을 지원하는 옴니버스(Omniverse) 플랫폼은 사례가 더욱 늘었다. 옴니버스는 실제 결과물을 내기 전에 가상 환경 내에서 미리 확인하고 현실에서의 문제를 최소화하는 과정을 지원한다. 예로 실제 공장을 건설하기 전에 가상의 공장을 만들어 실제 운용에 문제가 없는지 시험하거나 창고를 가상으로 만들어 효율을 예상해 볼 수 있다. 엔비디아는 옴니버스 클라우드와 애플리케이션이 더욱 단순하게 결합되는 것을 목표로 한다.

로보틱스 기술은 더욱 강력하게 진화했다. 트랜스포머 엔진이 적용된 엔비디아 젯슨 플랫폼과 아이작 시뮬레이션(Issac Sim) 패키지 등을 조합해 인간에 가까운 로봇 움직임을 구현해 나가는 중이다.

GTC 2024가 엔비디아 기업 가치 상승의 모멘텀이 될지는 지켜봐야 할 듯하다. / 출처=핀비즈


엔비디아는 새로운 산업 혁명을 다수 제안했다. 가속 컴퓨팅을 활용한 생성형 인공지능, 블랙웰 플랫폼, 엔비디아 추론 마이크로서비스, 엔비디아 인공지능 파운드리, 옴니버스와 아이작 로보틱스 등이다. 하지만 아직 시장의 호응은 없는 상황이다. 미국 기준 3월 18일, 엔비디아 주가는 이전 대비 0.7% 상승한 884.55 달러에 마감했다.

IT동아 강형석 기자 ([email protected])

다음으로 공유: