스위스, 오픈소스 AI 모델 아페르투스 출시

xtalfi

09.05 13:27

125

(퍼플렉시티가 정리한 기사)

스위스는 자국 최초의 완전 오픈소스 다국어 대형 언어 모델인 Apertus를 공개하며, 프라이버시를 중시하고 투명성과 규제 준수를 위해 구축된 대안을 통해 알프스 국가가 미국과 중국의 AI 지배에 도전하는 입지를 다졌습니다. 9월 2일 발표는 전 세계 AI 경쟁에서 중요한 이정표로, 스위스가 독립적인 AI 인프라를 추구하는 세계적 움직임에 동참했음을 의미합니다.

Apertus는 스위스 로잔연방공과대학교(EPFL), 취리히연방공과대학교(ETH Zurich), 그리고 스위스국립슈퍼컴퓨팅센터(CSCS) 간의 협력을 통해 개발되었으며, 자체 개발 과정 전체를 대중에게 공개함으로써 ChatGPT나 Claude와 같은 독점 시스템과 차별화됩니다. 모델의 이름은 라틴어 '오픈(open)'에서 유래했으며, 구조, 학습 데이터, 모델 가중치, 그리고 중간 체크포인트까지 투명성을 강조하는 의지를 반영합니다.

기술 사양 및 다국어 중심

Apertus는 두 가지 버전—80억 매개변수와 700억 매개변수—로 제공되며, 1,000개 이상의 언어에서 15조 개의 토큰으로 학습되었습니다. 특히, 학습 데이터의 40%는 비영어권 언어로, 소외된 언어인 스위스 독일어와 스위스의 4대 공용어 중 하나인 로만슈어 등이 포함되어 있습니다. 이러한 다국어 접근 방식은 보통 영어 콘텐츠에 우선순위를 두는 주요 상업용 모델과 Apertus를 차별화시키는 요소입니다.

이 모델은 루가노에 위치한 알프스 슈퍼컴퓨터에서 1천만 시간 이상의 GPU를 사용하여, 탄소 중립 전기로 학습되었습니다. 독점 대안들과 달리 Apertus는 연구자와 기관이 자체 서버로 모델을 다운로드하여 데이터에 대한 통제권을 유지할 수 있게 해주며, 이는 개인정보 보호를 중시하는 기관에 중요한 고려 사항입니다.

프라이버시 우선 설계 및 규제 준수

스위스 연구진은 Apertus가 스위스 데이터 보호법과 유럽연합 AI 법의 요구사항을 충족하도록 처음부터 설계되었다고 강조했다. 학습 데이터는 공개적으로 이용 가능한 데이터만 사용하며, 웹사이트의 기계 판독 opt-out 요청을 존중하고 개인정보를 제거할 수 있도록 필터링된다. 이러한 접근 방식은 다른 AI 시스템에서 문제가 되었던 저작권 침해와 무단 데이터 스크래핑에 대한 우려를 해소한다.

"신뢰할 수 있고 자주적이며 포용적인 AI 모델이 어떻게 개발될 수 있는지에 대한 청사진을 제공하는 것이 우리의 목표입니다."라고 EPFL의 머신 러닝 교수이자 Swiss AI Initiative의 운영위원회 위원인 Martin Jaggi가 말했다. 투명성에 대한 강조는 대중의 신뢰를 고취하고 AI 기술의 잠재적 위험에 대한 우려를 해소하려는 목적이다.

업계 반응 및 경쟁

스위스 은행업계는 아페르투스(Apertus)에 대해 신중한 낙관론을 나타냈으며, 스위스 은행가 협회는 특히 엄격한 데이터 보호 및 은행 비밀 준수 요건을 감안할 때 금융 산업에 "장기적으로 큰 잠재력"이 있다고 평가했습니다. 하지만 UBS와 같은 주요 스위스 금융기관들은 이미 다른 플랫폼을 활용하여 AI 솔루션을 도입하고 있습니다. 예를 들어, UBS는 최근 마이크로소프트와 협력하여 자사 자산관리 업무에 Azure AI 서비스와 OpenAI 기술을 도입했습니다.

AI 플랫폼 허깅페이스(Hugging Face) 연구 책임자인 레안드로 폰 베라(Leandro von Werra)는 아페르투스를 "지금까지 가장 야심찬 오픈소스 모델 중 하나"라고 평했으며, 그 규모와 연산 요구사항으로 볼 때 "오픈 모델에서 확실히 새로운 이정표"라고 평가했습니다. 이 모델은 허깅페이스와 스위스콤(Swisscom)의 독립적인 스위스 AI 플랫폼 등 다양한 채널을 통해 제공됩니다.

기술적 성취에도 불구하고 아페르투스는 상당한 상업적 도전에 직면해 있습니다. 스위스 산업 그룹 스위스멤(Swissmem)은 자국 내 LLM이 유럽 데이터 규제 준수를 통해 현지 기업에 더 적합할 수 있지만, "경험상 모든 요구에 부합하는 단일 솔루션은 없다"고 인정했으며, 일부 기업들은 국제 대안을 계속 사용할 가능성이 높다고 덧붙였습니다.

이 출시는 개발자들이 모델의 기능을 테스트하고 향후 개선을 위한 피드백을 제공하는 스위스 AI 위크 해커톤(Swiss AI Weeks hackathons)과 시기적으로 맞물려 진행되고 있습니다. 연구진은 프로젝트의 핵심 원칙인 투명성과 공공 접근성을 유지하면서, 의료, 법률, 기후 과학, 교육 등 특화 분야별 버전을 개발할 계획입니다.