[경향신문] 게임용 GPU로 AI 연구하는 카이스트 박사들
페이지 정보
본문
| AI 도구 | Gemini |
|---|---|
| 프롬프트 | https://www.khan.co.kr/article/202511160800011/amp 자세하게 내용 정리 |
카이스트 박사들의 AI 연구 현실과 '깐부 이후' 한국 AI의 과제 요약
제공해주신 기사 내용을 자세히 정리했습니다. 이 기사는 카이스트 연구자들이 겪는 AI 연구용 GPU 부족 현실과, 엔비디아와의 협력 이후 한국 AI 산업이 나아가야 할 방향에 대해 심층적으로 다루고 있습니다.
1. 카이스트 연구실의 GPU 부족 현실
게임용 GPU로 연구하는 박사들
* 연구 현황: 카이스트 전산학과 연구실에서는 차세대 AI 모델을 연구 중입니다.
* 사용 GPU: AI 훈련/추론을 위해 수천만 원대인 엔비디아의 전문 GPU('H100', 'A100') 대신, 200만 원대 게임용 GPU인 'RTX-4090' 40여 장을 사용하고 있습니다.
* 연구 한계:
* 메모리 용량 부족: 요즘 AI 모델은 크기가 커서, RTX-4090의 메모리 용량으로는 연구가 중단(메모리 초과)되는 경우가 빈번합니다.
* 자원 경쟁: NeurIPS, ICML 등 탑 학회 일정에 맞춰 연구원들이 동시에 GPU를 사용하려다 보니 자원 부족이 심각하여, 논문을 포기하거나 GPU를 양보받기 위해 부탁해야 하는 상황입니다.
???? 해외 대학과의 협력과 그 어려움
* 협력 방식: 많은 H100 GPU를 보유한 뉴욕대, 로잔공대 등 해외 연구팀과 협력합니다.
* 연구 문제: 카이스트(RTX-4090)에서 만든 모델이 뉴욕대(H100)에서 검증되는 과정에서 수일이 소요되며, 예상치 못한 문제가 발생해도 H100 자원이 없어 국내에서 주도적인 개선이 불가능했습니다. 한 연구는 결국 중도에 마무리되기도 했습니다.
* 연구 방향 전환: 대형언어모델(LLM) 연구를 포기하고, 보유 GPU로 가능한 **삼성몬트리올연구소의 'TRM'**과 같이 작은 규모로도 LLM이 풀지 못하는 문제를 해결하는 모델 연구로 방향을 전환했습니다.
2. 정부 지원과 '깐부 회동' 이후의 정책 과제
???? 정부 지원의 숨통
* 연구실은 정부의 **'AI 컴퓨팅 자원 활용 기반 강화 사업'**에 선정되어 H100 4장을 클라우드 방식으로 지원받게 되었습니다.
???? GPU 효율적 활용에 대한 정책적 고민
* 연구실을 이끄는 안성진 교수는 "일단 GPU 확보가 급선무지만, 앞으로는 GPU를 어떻게 효과적으로 사용할지에 대한 정책적 고민이 필요하다"고 강조했습니다.
* 자원 관리 시스템 부재 지적: 현재는 연구실에 GPU를 나누어주는 데 그치지만, 사용하지 않는 유휴 시간을 다른 연구에 활용할 수 있도록 하는 효율적인 GPU 운영 시스템이 필요하다고 제안했습니다.
???? '깐부 회동' 이후 공급 계획
* 젠슨 황 엔비디아 CEO는 이재용 삼성전자 회장, 정의선 현대차그룹 회장과의 '깐부 회동' 후, 2030년까지 최신 GPU 26만 장을 한국에 우선 공급하겠다고 발표했습니다.
* 이 중 21만 장은 삼성, 현대차, SK·네이버 등 기업에, 5만 장은 정부 몫으로 대학/스타트업 등에 공급될 예정입니다.
* 연구원들은 연구 선택의 폭이 넓어질 것으로 기대하고 있습니다.
3. AI 인재 유출과 국내 기업 환경
* 인재 유출 우려: 국내 AI 고급 인력들은 연구 환경, 연봉 등을 이유로 해외 취업을 선호합니다. 한 연구원은 '세계 최고의 리그'인 유럽(미국)에서 경험을 쌓고 싶다고 언급했습니다.
* 국내 기업의 역할: 해외로 나간 인재들이 다시 돌아올 수 있도록 국내에 AI로 돈을 버는 기업이 많아져야 하며, 특히 로봇과 AI를 접목한 분야에서 생겨나기 시작하는 것 같다고 분석했습니다.
4. 다음 세대 AI, 피지컬 AI와 데이터 주권
???? 로봇 파운데이션 모델(RFM) 개발
* 피지컬 AI: AI 로봇, 자율주행차 등 현실 세계에서 복잡한 행동을 수행하는 AI를 뜻하며, 엔비디아 GPU 공급 물량의 상당수가 이 분야 개발을 위해 할당됩니다.
* RFM: 인간의 언어로 로봇에게 명령하고 동작을 학습시키는 모델(예: 서울대 AI연구원과 투모로 로보틱스의 CLIP-RT)입니다.
* 핵심은 데이터: RFM 개발에는 로봇 팔 운동 궤적이 담긴 대량의 사전 학습 데이터세트가 중요하며, 국내외 연구실의 데이터를 모은 오픈X 임바디먼트 데이터세트를 활용하고 있습니다. 중국은 데이터 수집 공장을 세워 데이터를 확보하고 있습니다.
???? 플랫폼 의존과 데이터 주권 확보
* 엔비디아 의존 심화 우려: 전문가들은 국내 업체들이 GPU뿐 아니라 로봇 학습을 돕는 엔비디아의 AI 플랫폼에 의존할 가능성을 지적하며, 일부 제조 데이터가 플랫폼 개발에 활용될 위험을 경고합니다.
* 국내 AI 주권 설계의 중요성: 이원태 국민대 특임교수는 젠슨 황 CEO가 한국과의 협력에 적극적인 것은 '제조 데이터' 때문이라고 분석하며, 다음과 같은 원칙을 제시했습니다.
* 알고리즘 및 모델은 국내 기업이 직접 개발해야 합니다.
* 데이터 주권 수호: 원본 제조 데이터는 국내 서버에 고정하고 외국 기업의 직접 접근을 금지해야 합니다.
* 전략적 공개: 표준 벤치마크 데이터는 국제 협력을 위해 공개하되, 핵심 제조 데이터는 비공개하는 전략이 필요합니다.
결론적으로, 기사는 게임용 GPU로 고군분투하는 국내 AI 연구의 현실을 보여주면서, 엔비디아와의 협력 확대라는 기회를 발판 삼아 GPU 자원의 효율적 운영 시스템 구축과 핵심 데이터 및 알고리즘의 주권 확보라는 두 가지 큰 과제를 해결해야 함을 강조합니다.