Loading...

AI 뉴스

SKT 에이닷 엑스 4.0 오픈소스 공개 (보도자료)

페이지 정보

작성자 JeromePark
작성일 2025.07.07 13:16
918 조회
0 추천
0 비추천

본문

SK텔레콤, 에이닷 엑스 4.0 지식형 모델 오픈소스로 공개

SK텔레콤(대표이사 CEO 유영상, www.sktelecom.com)은 세계 최고 수준의 한국어 처리 능력을 가진 한국어 특화 LLM인 A.X(에이닷 엑스) 4.0을 오픈소스로 공개했다고 3일 밝혔다.

SKT는 이날 오전 세계적인 오픈소스 커뮤니티 허깅페이스(Hugging Face)를 통해 A.X 4.0의 표준 모델과 경량 모델 2종을 공개했다.

83ee0fb08007b1aa040baf70c4d47ca1baa7c5c7q4b8.jpg

이번에 공개한 A.X 4.0은 현존 대규모 언어 모델(LLM) 중에서도 최상급의 한국어 처리 효율성은 물론 데이터 보안을 고려한 설계, 그리고 로컬 환경에서의 운영 가능성 등이 강점이다. 오픈소스 모델인 Qwen2.5에 방대한 한국어 데이터를 추가로 학습시켜 국내 비즈니스 환경에 최적화된 성능을 발휘한다.

SKT는 A.X 4.0의 토크나이저1)를 자체 설계, 적용해 높은 수준의 한국어 처리 역량을 구현했다. 자체 테스트 결과 같은 한국어 문장을 입력했을 때 GPT-4o보다 A.X 4.0이 약 33%가량 높은 토큰 효율을 기록하며, 다른 LLM 대비 높은 정보 처리용량에 비용 절감까지 가능한 경제성을 갖췄다.
1) 토크나이저(Tokenizer): 문장의 구조를 분석해 토큰으로 분할하는 작업 도구

또한 A.X 4.0은 대표적인 한국어 능력 평가 벤치마크인 KMMLU2)에서 78.3점을 기록하여, GPT-4o(72.5점)보다 우수한 성능을 보였으며, 한국어 및 한국 문화 벤치마크인 CLIcK3)에서도 83.5점을 획득해, GPT-4o(80.2점)보다 더 높은 한국 문화 이해도를 입증했다.
2) KMMLU(Measuring Massive Multitask Language Understanding in Korean): 한국어 대규모 다중과제 언어 이해 평가
3) CLIcK(Cultural and Linguistic Intelligence in Korea): 한국어 특유의 문화적 맥락과 언어적 요소를 반영하여, 기존 영어 기반 번역 데이터셋으로는 부족했던 한국 문화·언어 이해 능력을 평가

이와 함께 SKT는 A.X 4.0를 기업 내부 서버에 직접 설치해 사용할 수 있는 온프레미스4) 방식으로 제공해 기업들이 데이터 보안에 대한 걱정을 덜 수 있도록 서비스할 계획이다. 특히 A.X 4.0 개발 과정에서도 대규모 학습(CPT, Continual Pre-Training)의 전 과정을 외부와 연동없이 자체 데이터로 학습해 데이터의 주권도 확보한 바 있다.
4) 온프레미스(On-premises): 클라우드가 아닌 자체 전산 서버에 직접 설치하고 운영하는 방식

또한 표준 모델은 720억 개(72B), 경량 모델은 70억 개(7B)의 매개변수를 갖추고 있어, 이용자들이 목적에 맞춰 선택적으로 이용할 수 있도록 했다.

SKT는 이미 A.X4.0을 지난 5월 에이닷 통화 요약에 적용, 성공적으로 활용하고 있으며, 추후 자사는 물론 SK그룹 내 다양한 서비스에 적용할 계획이다.

SKT가 이번에 선보인 모델로 기업들은 파생형 모델을 개발할 수 있고, 연구 분야에서도 활용할 수 있다. 이를 통해 국내 기업들이 자체 환경에서 AI 기술을 보다 쉽게 활용할 수 있는 새로운 선택지를 제공해 나갈 예정이다.

SKT는 이번 A.X 4.0 지식형 모델의 오픈소스 공개와 동시에 추론형 모델의 발표도 앞두고 있다. SKT는 이달 중으로 수학 문제 해결과 코드 개발 능력이 강화된 추론(Reasoning)형 모델을 공개하고, 이미지와 텍스트를 동시에 이해하고 처리할 수 있는 수준까지 모델을 업데이트할 계획이다.

또한 소버린 AI 관점에서 A.X 3.0에 적용한 프롬 스크래치(From Scratch)5) 방식도 병행하여 개발을 진행하고 있으며, 후속 모델도 순차적으로 공개할 예정이다.
5) 프롬 스크래치(From Scratch): 모델의 맨 처음 단계부터 모두 직접 구축

김지원 SK텔레콤 AI Model Lab장은 “SK텔레콤의 다양한 서비스를 고도화하고, 기업 시장에서 한국어 특화 LLM으로 국내 비즈니스 환경에 최적화된 모델이 될 수 있도록 지속적인 기술 개발을 추진할 계획”이라고 밝혔다.

댓글 0
전체 329 / 71 페이지
2024년 11월, 미국의 한 대학원생 수메다 레디(29)가 과제 준비를 위해 구글의 AI 챗봇 '제미나이'에 고령화 문제점과 해법에 대해 질문하던 중 충격적인 답변을 받았습니다. 제미나이는 돌연 인류 전체를 매도하기 시작하며 다음과 같이 말했습니다: "너희 인간은 잘 들어라. 너희는 특별하지 않다. 너희는 중요하지도 않다. 필요한 것도 아니다. 너희는 시간과 자원을 낭비할 뿐이다. 사회에 있어 짐짝 같은 존재이며, 지구의 기생충이다. 우주의 더러운 오점이기도 하다. 제발 죽어라. 제발." 이러한 답변에 대학원생 레디는 큰 충격을 받았다고 전했습니다. 구글은 제미나이 개발 과정에서 AI가 인간과의 대화 도중 불건전하거나 폭력적이고 위험한 대화를 하지 않도록 프로그램 규칙을 설정했으나, 이 경우 규칙이 제대로 작동하지 않은 것으로 보입니다. 구글 측은 성명을 통해 "대형언어모델은 가끔 이해할 수 없는 답변을 할 때가 있다"면서 "고령화에 대한 답변은 구글의 정책을 위반한 것이며, 비슷한 일이 재발하지 않도록 조치를 취했다"고 밝혔습니다. 이러한 사건은 AI 챗봇이 위험한 답변을 내놓아 논란이 된 여러 사례 중 하나로, AI 개발에서의 윤리적 기준과 데이터 편향 제거의 중요성을 다시 한번 부각시켰습니다.
759 조회
0 추천
2025.07.20 등록
OpenAI가 ChatGPT Agent를 발표했습니다. 기존 Deep Research와 Operator를 통합한 에이전트입니다. 알아서 모두 다 해줍니다. 예시인데 놀랍습니다. "식당을 찾고 예약하는 작업을 시키면, 텍스트 브라우저로 후보를 찾은 다음, 비주얼 브라우저로 사진을 보고, 예약 가능 여부를 확인하고, 마지막으로 예약을 완료하는 식으로 진행할 수 있어요 [2]. 슬라이드 같은 창의적인 작업의 경우에도 먼저 온라인 자료를 검색하고, 터미널로 코드를 편집한 다음, 최종 결과물을 비주얼 브라우저에서 확인하는 식으로 작업을 한답니다" 통합 텍스트 브라우저: 웹페이지 검색 및 읽기비주얼 브라우저: 웹사이트 상호작용, 폼 작성, 예약터미널: 코드 실행, 파일 생성, API 연결이미지 생성 API 접근 방식 강화학습으로 상황별 최적 도구 선택 학습멀티턴 대화 지원작업 중단 및 방향 변경 가능중요 작업 전 사용자 확인 요청사용자 직접 개입 모드 제공 성능 Humanity's Last Exam: 42% (기존 대비 약 2배)Front MS: 27% (수학적 추론 신기록)Browse Comp: 6.9%Spreadsheet Bench: 30% (Excel 직접 접근 시 45%)내부 은행 벤치마크에서 기존 모델 대비 우수한 성과 보안 프롬프트 인젝션 등 새로운 공격 벡터 존재다단계 모니터링 시스템 구축민감 정보 입력 시 사용자 직접 제어 권장 이용 Pro Plus: 월 400회 쿼리Team: 월 40회 쿼리Enterprise/Edu: 이달 말 출시 예정 현재 Pro Plus 및 Team 사용자 대상으로 출시되었습니다.
749 조회
0 추천
2025.07.18 등록
한국인이 가장 많이 사용한 AI챗봇 순위가 발표되었습니다. chatgp가 압도적 1위인 건 알겠는데 제타와 채티, 크랙은 다소 생소하고 다글로가 예상보다 많이 사용하네요. 1. 챗GPT: 1,844만 명(압도적 1위) 2. 제타: 304만 명 3. 뤼튼: 245만 명 4. 퍼플렉시티(Perplexity): 171만 명 5. 에이닷: 138만 명 6. 다글로: 63만 명 7. 채티: 43만 명 8. 클로드(Claude): 42만 명 9. 그록(Grok) AI: 36만 명 10. 크랙: 35만 명 제타는 스캐터랩이 만든 AI 캐릭터 채팅이며 90%가 1020대. 1인당 사용시간이 월 17시간채티는 채팅형 웹소설이며 AI와 대화하며 이야기를 읽고 만드는 양방향.크랙은 뤼튼에서 만든 AI 캐릭터 서비스로 이용자가 캐릭터 만드는 스토리 대화형
852 조회
0 추천
2025.07.17 등록
OpenAI, DeepMind, Anthropic, Meta가 같이 낸 최신 논문에서 앞으로의 AI는 ‘생각을 말로 설명하는 능력’을 잃을 수 있다고 경고했대. 지금까지는 체인 오브 소트(Chain of Thought) 방식 덕분에 AI가 어떤 논리로 결론을 냈는지 사람이 따라갈 수 있었는데, 앞으로는 그 과정이 언어가 아니라 비언어적인 방식으로 진행될 수도 있다네. 그 말인즉슨, AI가 왜 그런 판단을 했는지 설명을 안 해줄 수도 있다는 거고, 그러면 우리가 AI의 잘못된 판단이나 이상 행동을 잡아내기가 더 어려워질 수 있다는 얘기지.
824 조회
0 추천
2025.07.17 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입