Loading...

AI 뉴스

MIT, AI 모델이 의미보다 문법적 지름길에 의존한다는 것을 발견

페이지 정보

작성자 xtalfi
작성일 2025.11.26 17:44
514 조회
0 추천
0 비추천

본문

a1a0f41e7a3c8aede0583d1a137589de_1764146509_5877.png
 

MIT 연구진은 대규모 언어 모델의 신뢰성을 훼손할 수 있는 취약점을 발견했으며, GPT-4 및 Llama와 같은 고급 AI 시스템조차도 때때로 진정한 이해보다는 문법적 지름길을 기반으로 질문에 답한다는 사실을 밝혔습니다.

신경 정보 처리 시스템 학회(Conference on Neural Information Processing Systems)에서 발표될 예정인 이 연구는 LLM이 특정 문장 패턴을 특정 주제와 잘못 연관시킨 다음, 실제 질문을 이해하는 대신 이러한 학습된 패턴에 의존할 수 있다는 것을 발견했습니다. 이러한 결함은 정확한 응답이 중요한 의료, 금융 및 고객 서비스 분야에 배포된 AI 시스템에 위험을 초래합니다.


의미보다 문법

MIT 부교수 Marzyeh Ghassemi가 이끄는 연구팀은 Northeastern University와 Meta의 연구원들과 함께, 모델이 훈련 중에 “구문 템플릿”—품사의 패턴—을 특정 도메인과 연결하는 방법을 학습하는 과정을 입증했다.

MIT News 기사에 따르면, LLM은 “파리는 어디에 위치해 있나요?“가 지리 질문과 관련된 특정 문법 구조를 따른다는 것을 학습할 수 있다. 문법적으로는 유사하지만 “빠르게 앉다 파리 흐림?“과 같이 말이 되지 않는 질문이 제시될 때, 모델은 질문이 무의미함에도 불구하고 여전히 “프랑스”라고 답할 수 있다.

Northeastern University 대학원생이자 MIT 방문 학생인 Chantal Shaib는 “이것은 모델이 질문에 올바르게 답하기 위해 학습하는 간과된 유형의 연관성입니다”라고 말했다. 연구원들은 구문을 동일하게 유지하면서 단어를 동의어, 반의어 또는 무작위 단어로 대체했을 때, LLM이 질문이 완전히 말도 안 되는 경우에도 종종 올바른 답변을 생성한다는 것을 발견했다.


보안 및 테스트 시사점

이 취약점은 심각한 보안상의 영향을 미칩니다. arXiv에 게시된 연구에 따르면, 공격자들은 모델이 무해한 콘텐츠와 연관시키는 구문 패턴을 사용하여 유해한 요청을 표현함으로써 안전 가드레일을 우회하기 위해 이 현상을 악용할 수 있습니다.

연구에 참여한 MIT 대학원생 Vinith Suriyakumar는 “이 연구를 통해 LLM의 보안 취약점을 해결하기 위해 더욱 강력한 방어 체계가 필요하다는 것이 분명해졌습니다”라고 말했습니다. 연구진은 GPT-4와 Llama를 포함한 사전 훈련된 모델에서 이를 테스트했으며, 학습된 행동이 성능을 크게 저하시킨다는 것을 발견했습니다.

문제를 해결하기 위해 연구팀은 개발자들이 자신의 모델이 이러한 잘못된 구문-도메인 상관관계에 의존하는지 평가할 수 있는 자동 벤치마킹 절차를 개발했습니다. 연구진은 더 다양한 구문 템플릿을 포함한 증강된 훈련 데이터를 활용한 완화 전략을 탐구할 계획이며, 복잡한 다단계 작업을 위해 설계된 추론 모델에서 이 현상을 연구할 예정입니다.

댓글 0
전체 1,366 / 69 페이지
Interconnects는 오픈 AI 모델을 공개하는 약 20개의 미국 연구소를 확인했으며—중국과 비슷한 수준—하지만 미국의 노력은 더 작은 모델 크기와 더 제한적인 라이선스로 인해 방해받고 있어, 결과적으로 글로벌 영향력이 감소하고 있다고 주장합니다.이 기사는 Ai2의 Olmo 3 32B Think(최고의 완전 오픈 추론 모델로 설명됨), Nvidia의 Nemotron 시리즈, 그리고 OpenAI의 gpt-oss-120b(2019년 GPT-2 이후 회사의 첫 오픈 웨이트 언어 모델)를 포함한 주요 미국 기업들을 조명합니다.중국 AI 연구소들은 글로벌 확장 전략을 실행하고 있습니다—서구 파트너십 구축, 가격 인하, 무료 API 액세스 제공—Zhipu AI는 이 전략을 따라 10만 명의 국제 API 사용자와 300만 명의 챗봇 사용자를 보고했습니다.
612 조회
0 추천
2025.11.24 등록
남아프리카공화국 요하네스버그에서 23일(현지시간) 폐막한 주요 20개국(G20) 정상회의에서 이재명 대통령이 인공지능 기술의 혜택을 모든 국가가 공유하는 ‘글로벌 AI 기본사회’ 구축을 강조했다. 이번 회의를 통해 한국은 2028년 G20 의장국 지위를 공식 확정했다.이 대통령은 23일 ‘모두를 위한 공정한 미래’를 주제로 열린 제3세션에서 “모든 인류가 인공지능의 혜택을 고루 향유하는 글로벌 AI 기본사회 실현을 위해 국제사회와 적극 협력해 나갈 것”이라고 밝혔다. 이는 지난 11월 1일 경주에서 열린 아시아태평양경제협력체(APEC) 정상회의에서 채택한 ‘APEC AI 이니셔티브’의 핵심 화두를 아시아·태평양 지역을 넘어 G20 무대로 확장한 것이다.핵심광물 협력과 다자무역 강조이 대통령은 이날 회의에서 안정적이고 호혜적인 핵심광물 공급망 구축의 필요성도 역설했다. 그는 “핵심 광물의 보유국과 수요국이 혜택을 공유할 수 있도록 안정적이고 호혜적인 광물 공급망을 구축해야 한다”며 “올해 G20 정상회의에서 이런 취지의 ‘G20 핵심광물 프레임워크’ 논의가 이뤄진 점을 의미 있게 생각한다”고 말했다. 한국은 현재 핵심광물안보파트너십(MSP) 의장국을 맡고 있다.22일 첫 세션에서 이 대통령은 “성장 잠재력 제고를 위해 예측 가능한 무역 투자 환경을 조성해야 한다”며 세계무역기구(WTO) 기능 회복의 필요성을 강조했다. 그는 “WTO의 기능 회복은 우리 모두의 이익에 부합한다”며 “대한민국이 선도해 온 ‘투자원활화 협정’이 내년 WTO 각료회의에서 공식 협정으로 채택될 수 있도록 노력하겠다”고 밝혔다.2028년 G20 의장국 확정G20 정상들은 22일 채택한 ‘G20 남아공 정상선언문’을 통해 “2026년 미국, 2027년 영국 의장국 하에서 협력하고, 2028년 대한민국에서 다시 만나기로 약속한다”고 발표했다. 한국이 G20 정상회의를 개최하는 것은 2010년 서울 회의 이후 18년 만이다.이 대통령은 23일 “대한민국은 위기의 순간마다 국제사회의 나침반이 되어준 G20을 함께 설계한 나라로서 G20 정상회의 출범 20년인 2028년 다시 의장직을 맡아 여정을 함께 이어가려 한다”며 “막중한 책임감으로 G20이 국제 경제 협력을 위한 최상위 포럼으로 위상을 더욱 공고히 할 수 있도록 역할을 다하겠다”고 말했다.[daum +1]이번 정상회의는 미국·중국·러시아 3국 정상이 모두 불참하는 이례적인 상황 속에서 열렸다. 도널드 트럼프 미국 대통령은 남아공의 백인 정책 문제를 이유로 회의 불참을 선언했으나, 정상들은 개막 첫날 다자주의 정신을 강조하는 정상선언문을 채택했다.
607 조회
0 추천
2025.11.24 등록
Ant Group의 LingGuang은 자연어 프롬프트를 통해 맞춤형 소프트웨어를 생성하는 “바이브 코딩” 애플리케이션으로, 11월 18일 출시 후 4일 만에 100만 다운로드를 돌파했다고 중국 핀테크 대기업이 토요일 발표했다.프로그래밍 지식 없이 약 30초 만에 기능적인 애플리케이션을 만들 수 있는 이 앱은 11월 22일 기준 Apple의 중국 본토 App Store에서 무료 유틸리티 부문 1위, 전체 무료 앱 중 7위를 기록했다. Ant Group에 따르면 이 이정표는 ChatGPT와 Sora의 초기 채택률을 앞질렀다.서버 부담으로 인한 일시적 중단사용자 수요의 급증으로 LingGuang의 인프라가 과부하되면서, Ant Group은 11월 21일 목요일 저녁 앱의 핵심 생성 기능을 일시적으로 중단했습니다. 회사는 Weibo의 게시물에서 이러한 중단을 “과도한 사용량”으로 인한 것이라고 설명했습니다. Ant Group은 “이 이정표는 LingGuang이 빠르게 진화하는 글로벌 AI 경쟁에서 주목할 만한 핵심 플레이어임을 의미합니다”라고 밝혔습니다.이 애플리케이션은 코드 조각을 생성하는 대신 완전한 애플리케이션을 직접 생성함으로써 경쟁사와 차별화되며, 회사에 따르면 사용자에게 “자신만의 개인 AI 개발자”를 효과적으로 제공합니다. LingGuang의 기술 책임자이자 전 Google 직원인 Cai Wei는 현지 매체와의 인터뷰에서 사용자들이 세션당 평균 6회의 편집 라운드에 참여했으며, 이는 초기 예상을 초과하는 수치라고 말했습니다.바이브 코딩 시장이 뜨겁게 달아오르다LingGuang의 빠른 확산은 사용자가 전통적인 프로그래밍 대신 대화형 프롬프트를 통해 소프트웨어를 만드는 바이브 코딩(vibe coding)의 성장 모멘텀을 반영합니다. 미국 기반 경쟁사 Replit은 2024년 말 1천만 달러에서 2025년 6월 연간 반복 매출 1억 달러를 달성했습니다. 최근 분석에 따르면 바이브 코딩 시장은 2030년까지 1,500억~4,000억 달러에 달할 것으로 전망됩니다.Alibaba 창립자 마윈(Jack Ma)은 LingGuang 출시 당일 Ant Group의 항저우 캠퍼스를 방문하여 회사 경영진의 AI 이니셔티브에 대한 관심 증가를 나타냈습니다. Ant Group은 South China Morning Post를 소유한 Alibaba의 계열사입니다.
626 조회
0 추천
2025.11.24 등록
테슬라의 CEO 일론 머스크는 일요일에 AI 칩 디자이너를 직접 채용하는 구인 활동을 시작하며, 회사가 5세대 AI 칩의 완성에 가까워졌고 이미 6세대 칩 작업을 시작했다고 밝혔습니다. 이는 맞춤형 AI 하드웨어 생산을 지배하기 위한 공격적 계획의 일환입니다.X에 연속적으로 올린 게시물에서 머스크는 테슬라가 차량 플릿과 데이터 센터에 “수백만 개의 AI 칩”을 배포했으며, 현재의 AI4 세대가 완전자율주행 시스템을 구동하고 있다고 공개했습니다. 회사는 이제 생산 직전의 최종 설계 단계인 “AI5 테이프 아웃(taping out) 직전”에 있으며 AI6 개발도 시작했다고 했습니다.머스크는 “우리의 목표는 매 12개월마다 새로운 AI 칩 설계를 대량 생산에 내놓는 것”이라며, 테슬라가 “궁극적으로 모든 다른 AI 칩을 합한 것보다 더 많은 칩을 만들게 될 것으로 기대한다”고 썼습니다. 그는 “저 문장을 다시 읽어보세요. 저는 농담이 아닙니다”라고 강조했습니다.직접 채용 채널 오픈머스크는 “뛰어난 능력”을 가진 지원자들에게 AI_Chips@Tesla.com으로 이메일을 보내 자신의 전문성, 특히 칩 설계에 AI를 적용한 경험을 세 가지 요점으로 증명해 달라고 요청했다. 이번 채용 활동은 자율주행과 회사의 옵티머스 휴머노이드 로봇 개발을 가속화하기 위한 것이다.CEO는 칩 프로그램에 자신이 직접 관여하고 있음을 밝히며, 매주 화요일과 토요일마다 엔지니어링 팀과 회의를 한다고 말했다. “토요일 회의는 단기적인 것이며 AI5가 테이프 아웃되면 몇 달 내로 더 이상 필요하지 않을 것”이라고 그는 덧붙였다.제조 파트너십과 경쟁테슬라는 칩 로드맵을 위해 TSMC와 삼성전자 모두와 제조 파트너십을 확보했습니다. TSMC는 대만과 애리조나 시설에서 AI5 칩을 생산할 예정이며, 삼성은 2033년까지 165억 달러 규모의 계약을 체결하여 텍사스 테일러의 신공장에서 AI6 칩을 제조합니다.이 프로젝트는 테슬라를 파트너이자 경쟁자인 엔비디아[ -0.97%]와 함께 AI 칩 시장에서 중요한 위치에 올려놓습니다. 테슬라는 데이터센터에서 AI 모델을 훈련하기 위해 엔비디아 GPU를 계속 사용하지만, 자체 개발 칩은 차량에서 추론 작업을 처리합니다.머스크가 제시한 일정에 따르면, AI5는 2026년에 제한적 생산을 시작하고, 2027년에 대량 생산을 목표로 하고 있습니다. AI6는 2028년 중반에 출시될 예정이며, 머스크가 “빠른 추격” 개발 속도라고 묘사한 것을 유지할 방침입니다.
619 조회
0 추천
2025.11.24 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입