AI 뉴스

SKT 에이닷 엑스 4.0 오픈소스 공개 (보도자료)

페이지 정보

작성자 JeromePark
작성일 2025.07.07 13:16
958 조회
0 추천
0 비추천

본문

SK텔레콤, 에이닷 엑스 4.0 지식형 모델 오픈소스로 공개

SK텔레콤(대표이사 CEO 유영상, www.sktelecom.com)은 세계 최고 수준의 한국어 처리 능력을 가진 한국어 특화 LLM인 A.X(에이닷 엑스) 4.0을 오픈소스로 공개했다고 3일 밝혔다.

SKT는 이날 오전 세계적인 오픈소스 커뮤니티 허깅페이스(Hugging Face)를 통해 A.X 4.0의 표준 모델과 경량 모델 2종을 공개했다.

83ee0fb08007b1aa040baf70c4d47ca1baa7c5c7q4b8.jpg

이번에 공개한 A.X 4.0은 현존 대규모 언어 모델(LLM) 중에서도 최상급의 한국어 처리 효율성은 물론 데이터 보안을 고려한 설계, 그리고 로컬 환경에서의 운영 가능성 등이 강점이다. 오픈소스 모델인 Qwen2.5에 방대한 한국어 데이터를 추가로 학습시켜 국내 비즈니스 환경에 최적화된 성능을 발휘한다.

SKT는 A.X 4.0의 토크나이저1)를 자체 설계, 적용해 높은 수준의 한국어 처리 역량을 구현했다. 자체 테스트 결과 같은 한국어 문장을 입력했을 때 GPT-4o보다 A.X 4.0이 약 33%가량 높은 토큰 효율을 기록하며, 다른 LLM 대비 높은 정보 처리용량에 비용 절감까지 가능한 경제성을 갖췄다.
1) 토크나이저(Tokenizer): 문장의 구조를 분석해 토큰으로 분할하는 작업 도구

또한 A.X 4.0은 대표적인 한국어 능력 평가 벤치마크인 KMMLU2)에서 78.3점을 기록하여, GPT-4o(72.5점)보다 우수한 성능을 보였으며, 한국어 및 한국 문화 벤치마크인 CLIcK3)에서도 83.5점을 획득해, GPT-4o(80.2점)보다 더 높은 한국 문화 이해도를 입증했다.
2) KMMLU(Measuring Massive Multitask Language Understanding in Korean): 한국어 대규모 다중과제 언어 이해 평가
3) CLIcK(Cultural and Linguistic Intelligence in Korea): 한국어 특유의 문화적 맥락과 언어적 요소를 반영하여, 기존 영어 기반 번역 데이터셋으로는 부족했던 한국 문화·언어 이해 능력을 평가

이와 함께 SKT는 A.X 4.0를 기업 내부 서버에 직접 설치해 사용할 수 있는 온프레미스4) 방식으로 제공해 기업들이 데이터 보안에 대한 걱정을 덜 수 있도록 서비스할 계획이다. 특히 A.X 4.0 개발 과정에서도 대규모 학습(CPT, Continual Pre-Training)의 전 과정을 외부와 연동없이 자체 데이터로 학습해 데이터의 주권도 확보한 바 있다.
4) 온프레미스(On-premises): 클라우드가 아닌 자체 전산 서버에 직접 설치하고 운영하는 방식

또한 표준 모델은 720억 개(72B), 경량 모델은 70억 개(7B)의 매개변수를 갖추고 있어, 이용자들이 목적에 맞춰 선택적으로 이용할 수 있도록 했다.

SKT는 이미 A.X4.0을 지난 5월 에이닷 통화 요약에 적용, 성공적으로 활용하고 있으며, 추후 자사는 물론 SK그룹 내 다양한 서비스에 적용할 계획이다.

SKT가 이번에 선보인 모델로 기업들은 파생형 모델을 개발할 수 있고, 연구 분야에서도 활용할 수 있다. 이를 통해 국내 기업들이 자체 환경에서 AI 기술을 보다 쉽게 활용할 수 있는 새로운 선택지를 제공해 나갈 예정이다.

SKT는 이번 A.X 4.0 지식형 모델의 오픈소스 공개와 동시에 추론형 모델의 발표도 앞두고 있다. SKT는 이달 중으로 수학 문제 해결과 코드 개발 능력이 강화된 추론(Reasoning)형 모델을 공개하고, 이미지와 텍스트를 동시에 이해하고 처리할 수 있는 수준까지 모델을 업데이트할 계획이다.

또한 소버린 AI 관점에서 A.X 3.0에 적용한 프롬 스크래치(From Scratch)5) 방식도 병행하여 개발을 진행하고 있으며, 후속 모델도 순차적으로 공개할 예정이다.
5) 프롬 스크래치(From Scratch): 모델의 맨 처음 단계부터 모두 직접 구축

김지원 SK텔레콤 AI Model Lab장은 “SK텔레콤의 다양한 서비스를 고도화하고, 기업 시장에서 한국어 특화 LLM으로 국내 비즈니스 환경에 최적화된 모델이 될 수 있도록 지속적인 기술 개발을 추진할 계획”이라고 밝혔다.

댓글 0
전체 343 / 65 페이지
AI 영상 편집이 어느 정도까지 되는지 소개하는 유튜브 입니다.
550 조회
0 추천
2025.08.16 등록
Genspark에서 세계 최초의 Apple Watch용 AI 회의 노트 도구인 'Genspark AI Meeting Notes'를 출시했습니다. 이 도구는 iOS 및 Android 앱에서도 사용할 수 있으며, Super Agent와의 긴밀한 통합을 통해 Apple Watch에서 더블 탭 한 번 또는 휴대폰에서 한 번의 클릭만으로 모든 회의를 포괄적이고 전문적인 회의록으로 변환할 수 있습니다.이 도구의 가장 뛰어난 점은 즉시 우수한 회의록을 생성할 수 있다는 것입니다. Apple Watch에서는 더블 탭으로 녹음을 시작하면 백그라운드에서 자동으로 지속됩니다. Google이나 Outlook 캘린더와 통합하여 회의를 탭하면 바로 녹음이 시작되며, Genspark Super Agent와 원활하게 작동하여 향상된 처리 능력을 제공합니다. 고급 AI가 대화를 분석하고 핵심 정보를 추출하여 몇 분 내에 모든 참가자에게 전문적인 노트를 전달합니다.Genspark AI Meeting Notes는 '바이브 워킹(vibe working)'의 미래를 대표합니다. 이는 AI가 일상적인 업무를 처리하여 인간이 창의적 사고, 전략적 협업, 의미 있는 연결에 집중할 수 있게 하는 작업 방식입니다. AI가 문서화의 마찰을 제거함으로써 사람들이 회의에 완전히 집중하고 함께 획기적인 솔루션을 만들 수 있도록 도와줍니다.전체 프로세스는 자동으로 완료되며, 사용자는 완전하고 전문적인 수준의 회의 문서화를 받을 수 있습니다. 이 혁신적인 도구를 통해 회의 생산성의 혁명을 경험하고 회의 관리의 새로운 가능성을 발견할 수 있습니다.
687 조회
0 추천
2025.08.13 등록
Anthropic 은 100만 토큰 컨텍스를 처리하는 클로드4 를 발표했다. 이는 기존 처리량의 5배 규모이다.이를 통해 7.5만 줄 이상의 코드를 한번에 처리하거나 수십개의 연구논문을 분석하는 것이 가능해졌다고 발표했다.현재 Anthropic API 및 아마존 Bedrock 에서 퍼블릭으로 사용 가능하며, 조만간 구글 클라우드 Vertex AI에서도 사용이 가능할 예정이라고 한다.클로드 브래드 에이브럼스는 "이전에는 문제를 작은 조각으로 나눠야 했지만, 100만 토큰 컨텍스트 윈도우로 모델이 전체 맥락을 파악할 수 있게 됐다"라며 "2500페이지 분량의 텍스트도 쉽게 처리할 수 있다"고 밝혔다.이번 발표는 오픈AI가 최근 발표한 ChatGPT-5에 대항하기 위한 것으로 보인다.
716 조회
0 추천
2025.08.13 등록
퍼플렉시티가 구글에게 크롬을 사겠다고 제안했다.는 보도가 월스트리저널을 통해 나왔다.https://www.wsj.com/tech/perplexity-ai-google-chrome-offer-5ddb7a22퍼플렉시티는 345억달러(47조8000억원)에 크롬을 인수하겠다고 구글에 제안했다고 12일(현지시간) 보도했다.퍼플렉시티는 구글 에게 보낸 서한에서 크롬 인수 제안이 “크롬을 유능하고 독립적인 운영자에게 맡김으로써 최고 수준의 공익에 부합하는 반독점 구제책을 만족시키기 위한 것”이라고 재언했다.퍼플렉시티의 이번 제안은 미 법원이 온라인 검색 시장 경쟁 회복을 위한 방안을 제시할 예정인 가운데 나왔다.워싱턴 D.C. 연방법원 판사는 지난해 8월 미 법무부가 제기한 검색 시장 반독점 소송에서 구글의 시장 지위를 불법적인 독점이라고 판결했다. 이어 지난 4월부터 독점 해소 방안에 대한 재판이 진행됐으며, 법무부는 방안 중 하나로 구글 크롬 매각을 제안한 바 있다.물론 구글이 이에 응할지는 회의적이다.
736 조회
0 추천
2025.08.13 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입