검색창 열기 인더뉴스 부·울·경

Electronics 전기/전자 Global 글로벌

엔비디아, AWS에 ‘블랙웰’ 제공…“전례 없는 슈퍼컴퓨터 만들 것”

URL복사

Thursday, March 21, 2024, 13:03:59

슈퍼컴퓨터 구축 프로젝트 '세이바'에 활용
대규모 생성형 AI 훈련과 추론 가속화
블랙웰 암호화와 통합해 AI 애플리케이션 보안 강화

 

인더뉴스 이종현 기자ㅣ엔비디아가 GTC 2024에서 공개한 자사의 블랙웰(Blackwell) GPU 플랫폼을 아마존닷컴의 자회사인 아마존웹서비스(이하 AWS)에 제공한다고 21일 발표했습니다.

 

AWS는 5세대 엔비디아 NV링크로 상호 연결된 72개의 블랙웰 GPU와 36개의 그레이스 CPU로 구성된 GB200 NVL72를 갖춘 엔비디아 블랙웰 플랫폼을 제공할 예정입니다. 또한, 대규모 생성형 AI 훈련과 추론을 가속화하는 EC2 울트라클러스터에 배치된 새로운 B100 GPU를 탑재한 EC2 인스턴스도 제공할 계획입니다.

 

엔비디아와 AWS의 협력은 엔비디아 NIM 추론 마이크로서비스와 아마존 세이지메이커(SageMaker)를 통합함으로써 고성능, 저비용의 생성형 AI를 위한 추론 서비스를 제공합니다. 사용자는 이 서비스를 사용해 미리 컴파일되고 엔비디아 GPU에서 실행되도록 최적화된 기능모듈을 세이지메이커에 신속하게 배포해 생성형AI 애플리케이션의 출시 기간을 단축할 수 있습니다.

 

AWS 리인벤트(re:Invent) 2023에서 발표된 프로젝트 세이바(Project Ceiba)는 세계에서 가장 빠른 AI 슈퍼컴퓨터를 구축하기 위해 엔비디아와 AWS가 협력하는 프로젝트입니다. 20736개의 B200 GPU를 사용하는 해당 프로젝트의 슈퍼컴퓨터는 새로운 엔비디아 GB200 NVL72시스템을 기반으로 구축되며 엔비디아의 자체 연구 개발에 사용됩니다.

 

세이바는 4세대 EFA 네트워킹을 통해 확장되고 슈퍼칩당 최대 800Gbps의 저지연, 고대역폭 네트워킹 처리량을 제공해 414 엑사플롭의 대규모 AI를 처리할 수 있습니다. 엔비디아의 이전 세대 GPU 아키텍처인 호퍼(Hopper) 아키텍처를 기반으로 구축하려고 했던 초기 계획에 비해 6배나 향상된 성능을 제공하게 됩니다.

 

보안 기능 역시 확보될 예정입니다. AWS AI 인프라와 서비스에는 고객이 데이터를 제어하고 제3자 모델 제공업체와 공유되지 않게 만드는 보안 기능이 마련돼 있습니다. AWS 니트로 시스템과 엔비디아 GB200의 결합은 권한이 없는 개인이 모델 가중치에 액세스하는 것을 방지함으로써 AI 보안을 한층 더 강화합니다.

 

젠슨 황(Jensen Huang) 엔비디아 CEO는 "AI는 전례 없는 속도로 혁신을 주도하며 산업 전반에 걸쳐 새로운 애플리케이션, 비즈니스 모델 및 혁신을 이끌고 있다. AWS와의 협력을 통해 새로운 세대의 AI 기능을 가속화하고 고객에게 전례 없는 컴퓨팅 성능을 제공해 가능성의 범위를 넓혀가고 있다"고 말했습니다.

English(中文·日本語) news is the result of applying Google Translate. <iN THE NEWS> is not responsible for the content of English(中文·日本語) news.

배너

이종현 기자 flopig2001@inthenews.co.kr

배너

삼성전자, ‘AI 포럼 2025’ 개최…글로벌 석학과 미래 AI 전략 논의

삼성전자, ‘AI 포럼 2025’ 개최…글로벌 석학과 미래 AI 전략 논의

2025.09.15 13:55:11

인더뉴스 이종현 기자ㅣ삼성전자[005930]가 15일부터 16일까지 양일간 '삼성 AI 포럼 2025'를 개최한다고 15일 밝혔습니다. 올해로 9회째를 맞는 '삼성 AI 포럼'은 매년 학계와 업계 전문가들이 한자리에 모여 AI 분야의 최신 연구 성과를 공유하고, 향후 연구 방향을 모색하는 기술 교류의 장입니다. 이번 포럼에는 ▲딥러닝 분야의 세계적 석학인 요슈아 벤지오 캐나다 몬트리올대 교수 ▲언어모델과 AI 에이전트 연구의 권위자인 조셉 곤잘레스 UC 버클리 교수 등 글로벌 AI 전문가들이 기조 강연에 나섭니다. 전영현 삼성전자 대표이사 부회장은 개회사를 통해 "삼성전자는 다양한 업무영역에 AI 기술을 적용해 언제 어디서나 쉽고 빠르게 AI를 활용할 수 있는 기반 기술을 개발하고 있다"라며 "올해 삼성 AI 포럼은 산업계와 학계를 대표하는 전문가들을 모시고 AI가 사회와 산업을 어떻게 변화시키는지 논의하고 함께 지혜를 나누는 의미 있는 시간이 될 것"이라고 말했습니다. 삼성전자 DS부문이 주관하는 1일차 포럼은 경기도 용인에 위치한 삼성전자 The UniverSE에서 진행됐습니다. 이날 포럼에는 사전 초청자 200여명이 참석해 '반도체 산업의 버티컬 AI 전략과 비전'을 주제로 논의했습니다. 기조 강연에 나선 벤지오 캐나다 몬트리올대 교수는 기존 AI 모델에서 발생할 수 있는 '인간 통제 회피', '악의적 사용' 등 잠재적 위험 요소를 설명하고 안전장치 역할을 할 새로운 모델 '과학자 AI'를 소개했습니다. 그는 "과학자 AI 모델은 인간을 모방하거나 기쁘게 하려는 의도 없이 검증된 사실과 데이터를 근거로 정직한 답변을 제공한다"라며 "안전성과 과학적 발견의 가속화 측면에서 과학자 AI 기술이 중요하다"라고 강조했습니다. 반도체 설계 자동화 회사인 지멘스 EDA의 아밋 굽타 부사장은 'AI 기반 전자 설계의 미래'를 주제로 강연을 진행했습니다. 그는 "반도체 전자 설계 자동화 도구에 AI를 통합하는 것이 무엇보다 중요하다"라며 "특히 AI의 잠재력을 완전하게 활용하기 위해서는 전체 워크플로우에서 작동하는 엔드투엔드(End-to-End) 시스템이 필요하다"라고 설명했습니다. 송용호 삼성전자 DS부문 AI센터장 부사장과 강석형 포항공대(POSTECH) 교수, 문일철 한국과학기술원(KAIST) 교수가 진행한 기술 세션에서는 반도체 설계 및 제조 분야의 최신 AI 응용 연구 성과와 미래 전망이 논의됐습니다. 송 부사장은 "AI는 칩 설계나 소프트웨어 개발에 필수적인 도구가 됐으며 제조 분야에서도 제조 복잡성의 기술적 한계를 극복하는 데 AI가 크게 기여할 것"이라고 강조했습니다. 한편 이날 진행된 '삼성 AI 연구자상' 시상에는 ▲니콜라스 파프르노 캐나다 토론토대 교수 ▲로즈 유 UC 샌디에이고 교수 ▲르렐 핀토 뉴욕대 교수 등 3명이 선정됐으며 수상자들의 현장 강연도 진행됐습니다. 16일에 진행하는 2일차 포럼은 삼성전자 DX부문이 주관하며 '생성형 AI를 넘어, 에이전틱 AI로'를 주제로 온라인 운영됩니다. 전경훈 삼성전자 DX부문 최고기술책임자(CTO) 겸 삼성리서치장 사장은 "생성형 AI는 이미 일상과 산업 전반에서 필수 도구로 자리 잡았다"라며 "삼성전자는 본격화되는 에이전틱 AI 시대에 맞춰 사용자에게 실질적으로 도움이 되는 AI 기술을 준비할 것"이라고 말했습니다. 둘째 날 기조 강연에는 ▲언어모델과 AI 에이전트 연구의 권위자인 조셉 곤잘레스 UC 버클리 교수 ▲AI의 자율적 계획 수립과 의사결정 분야 전문가 수바라오 캄밤파티 애리조나 주립대 교수 ▲확산 방식 언어모델(DLM) 기술을 공개한 스타트업 인셉션의 공동창립자 겸 스탠퍼드대 교수 스테파노 에르몬 등이 나섭니다. UC 버클리 곤잘레스 교수는 거대언어모델(LLM) 기반의 에이전트 능력 고도화 연구 사례를 발표합니다. 또 사용자와 에이전트 간 상호작용 사이에 발생하는 공백 시간을 활용해 에이전트가 추론·학습·계획을 수행하는 '슬립타임 컴퓨트' 패러다임도 소개합니다. 캄밤파티 애리조나 주립대 교수는 기존 거대언어모델의 한계를 보완하기 위한 '대규모 추론 모델(LRM)' 연구 결과를 공유합니다. 그는 언어 모델에서 해결돼야 할 주요 과제로 ▲정확성 보장 ▲상황 적응형 계산 ▲중간 추론 해석 제공 등을 제시할 예정입니다. 에르몬 스탠퍼드대 교수는 이미지·영상·오디오 생성에 활용되던 확산 모델을 언어에 적용한 '확산 언어 모델(DLM)'을 발표합니다. 이 기술은 순차적 텍스트 생성 방식의 한계를 극복하고 보다 효율적인 언어 모델의 패러다임을 제시할 전망입니다. 기술 세션에서는 삼성리서치 연구원들이 ▲카메라 색온도 자동 조절 AI 기술 ▲지식 증류를 활용한 효율적인 거대언어모델 학습 기법과 적용 사례 ▲스마트폰, TV 등 전자제품에 거대언어모델을 탑재하기 위한 온디바이스 기술 ▲실제 목소리로 더빙 음성을 자동 생성하는 AI 기술 등 최신 연구개발 성과를 공유합니다. 또 ▲멀티 에이전트 시스템으로 다양한 보고서를 분석하고 자동 생성하는 '딥 다이브' 기술 ▲다양한 형식의 문서를 거대언어모델이 이해할 수 있는 구조로 자동 변환시켜 주는 '문서 AI' 기술 ▲제품에 탑재되는 생성형 AI 모델들의 개발 주기를 단축하는 '온디바이스 AI 스튜디오' 등 사내 생산성 향상을 위한 기술과 적용 사례도 공개됩니다. 2일차 '삼성 AI 포럼 2025'는 삼성전자 개발자 유튜브 채널에서 시청 가능합니다.




배너