Loading...

AI 뉴스

MIT, AI 모델이 의미보다 문법적 지름길에 의존한다는 것을 발견

페이지 정보

작성자 xtalfi
작성일 2025.11.26 17:44
608 조회
0 추천
0 비추천

본문

a1a0f41e7a3c8aede0583d1a137589de_1764146509_5877.png
 

MIT 연구진은 대규모 언어 모델의 신뢰성을 훼손할 수 있는 취약점을 발견했으며, GPT-4 및 Llama와 같은 고급 AI 시스템조차도 때때로 진정한 이해보다는 문법적 지름길을 기반으로 질문에 답한다는 사실을 밝혔습니다.

신경 정보 처리 시스템 학회(Conference on Neural Information Processing Systems)에서 발표될 예정인 이 연구는 LLM이 특정 문장 패턴을 특정 주제와 잘못 연관시킨 다음, 실제 질문을 이해하는 대신 이러한 학습된 패턴에 의존할 수 있다는 것을 발견했습니다. 이러한 결함은 정확한 응답이 중요한 의료, 금융 및 고객 서비스 분야에 배포된 AI 시스템에 위험을 초래합니다.


의미보다 문법

MIT 부교수 Marzyeh Ghassemi가 이끄는 연구팀은 Northeastern University와 Meta의 연구원들과 함께, 모델이 훈련 중에 “구문 템플릿”—품사의 패턴—을 특정 도메인과 연결하는 방법을 학습하는 과정을 입증했다.

MIT News 기사에 따르면, LLM은 “파리는 어디에 위치해 있나요?“가 지리 질문과 관련된 특정 문법 구조를 따른다는 것을 학습할 수 있다. 문법적으로는 유사하지만 “빠르게 앉다 파리 흐림?“과 같이 말이 되지 않는 질문이 제시될 때, 모델은 질문이 무의미함에도 불구하고 여전히 “프랑스”라고 답할 수 있다.

Northeastern University 대학원생이자 MIT 방문 학생인 Chantal Shaib는 “이것은 모델이 질문에 올바르게 답하기 위해 학습하는 간과된 유형의 연관성입니다”라고 말했다. 연구원들은 구문을 동일하게 유지하면서 단어를 동의어, 반의어 또는 무작위 단어로 대체했을 때, LLM이 질문이 완전히 말도 안 되는 경우에도 종종 올바른 답변을 생성한다는 것을 발견했다.


보안 및 테스트 시사점

이 취약점은 심각한 보안상의 영향을 미칩니다. arXiv에 게시된 연구에 따르면, 공격자들은 모델이 무해한 콘텐츠와 연관시키는 구문 패턴을 사용하여 유해한 요청을 표현함으로써 안전 가드레일을 우회하기 위해 이 현상을 악용할 수 있습니다.

연구에 참여한 MIT 대학원생 Vinith Suriyakumar는 “이 연구를 통해 LLM의 보안 취약점을 해결하기 위해 더욱 강력한 방어 체계가 필요하다는 것이 분명해졌습니다”라고 말했습니다. 연구진은 GPT-4와 Llama를 포함한 사전 훈련된 모델에서 이를 테스트했으며, 학습된 행동이 성능을 크게 저하시킨다는 것을 발견했습니다.

문제를 해결하기 위해 연구팀은 개발자들이 자신의 모델이 이러한 잘못된 구문-도메인 상관관계에 의존하는지 평가할 수 있는 자동 벤치마킹 절차를 개발했습니다. 연구진은 더 다양한 구문 템플릿을 포함한 증강된 훈련 데이터를 활용한 완화 전략을 탐구할 계획이며, 복잡한 다단계 작업을 위해 설계된 추론 모델에서 이 현상을 연구할 예정입니다.

댓글 0
전체 1,366 / 1 페이지
Executive Summary • 프랑스 AI 스타트업 미스트랄(Mistral AI)이 200밀리초 이내 실시간 음성-텍스트 변환이 가능한 '복스트랄 리얼타임(Voxtral Realtime)' 모델을 오픈소스로 공개했다 • 40억 개 파라미터의 경량 모델로 스마트폰이나 노트북에서 로컬 실행이 가능해 클라우드 전송 없이 프라이버시를 보호할 수 있다 • 미스트랄은 13개 언어 지원으로 언어 장벽 없는 실시간 대화라는 목표를 2026년 내 달성할 것으로 전망했다 • 유럽 기반의 미스트랄은 미국 빅테크 대비 낮은 자원으로도 효율적인 모델 설계와 데이터셋 최적화로 경쟁력을 확보하고 있다 Background 미스트랄 AI는 2023년 메타와 구글 딥마인드 출신 연구자들이 설립한 파리 기반의 AI 스타트업이다. OpenAI, 앤트로픽, 구글 등 미국 대형 AI 연구소들과 경쟁하며 유럽의 대표적인 파운데이션 모델 개발사로 자리매김했다. 이번 복스트랄 출시는 범용 LLM 경쟁에서 한 발 물러나 실시간 번역이라는 특화 영역에서 승부수를 던진 것으로 분석된다. Impact & Implications 기술적 의미 복스트랄 리얼타임은 200밀리초라는 초저지연 음성 인식을 구현해 실시간 대화 번역의 가능성을 크게 높였다. 구글의 최신 모델이 2초 지연인 점을 감안하면 10배 빠른 속도다. 40억 파라미터라는 경량화도 주목할 만하다. 음성-텍스트 분야에서 스마트폰 로컬 실행이 가능한 모델은 업계 최초라고 미스트랄은 밝혔다. 이는 클라우드 의존도를 낮추고 프라이버시 민감 대화의 보안성을 확보한다는 점에서 기업 및 정부 고객에게 매력적인 옵션이 될 수 있다. 경쟁 구도 변화 미스트랄은 미국 AI 대형 연구소들과 달리 수천억 달러 규모의 투자 없이도 효율적인 모델 개발로 승부하고 있다. 과학 운영 부사장 피에르 스톡은 "GPU가 너무 많으면 오히려 게을러진다"며 "맹목적으로 테스트하기보다 성공으로 가는 최단 경로를 생각해야 한다"고 강조했다. 범용 성능에서는 미국 경쟁사에 뒤지더라도 가격 대비 성능이라는 틈새에서 입지를 구축하고 있다. 서리대학교 디지털경제센터 소장 아나벨 가워는 미스트랄을 "포뮬러 원 카는 아니지만 매우 효율적인 패밀리카"에 비유했다. 향후 전망 미국과 유럽 동맹 관계가 긴장 국면에 접어들면서 유럽 기업과 정부들은 미국 AI 기업 의존도를 재검토하고 있다. 미스트랄은 EU 규제 준수, 다국어 지원, 오픈소스라는 차별화로 '유럽 주권 AI' 대안으로 포지셔닝하고 있다. IT 컨설팅 기업 PAC의 댄 빌러 애널리스트는 "LLM이 논의를 지배하고 있지만 이 상황이 영원하지는 않을 것"이라며 "소형의 지역 특화 모델이 앞으로 더 큰 역할을 할 것"이라고 전망했다. Key Data & Facts 항목수치/내용 모델명Voxtral Mini Transcribe V2, Voxtral Realtime 파라미터 수40억 개 응답 지연200밀리초 이내 지원 언어13개 언어 라이선스오픈소스 (Voxtral Realtime) 설립 연도2023년 창업자 출신메타, 구글 딥마인드 Key Quote "우리가 구축하는 것은 원활한 번역이 가능한 시스템이다. 이 모델은 그 기반을 마련하는 것이다. 이 문제는 2026년에 해결될 것으로 믿는다." — 피에르 스톡, 미스트랄 AI 과학 운영 부사장
12 조회
0 추천
02.06 등록
Executive Summary • AI 스타트업 Axiom이 자체 개발한 수학 증명 AI 'AxiomProver'로 수년간 미해결 상태였던 4개의 수학 난제를 연달아 증명했다 • 대수기하학의 Chen-Gendron 추측을 비롯해 19세기 인도 수학자 라마누잔의 공식과 관련된 Fel 추측까지 완전 자동화 방식으로 해결했다 • 수학 전문 AI 시스템과 대규모 언어 모델을 결합한 이 기술은 사이버보안 등 상업적 응용 분야로도 확장될 전망이다 Background 수학자들은 수십 년간 복잡한 대수기하학 문제들과 씨름해왔다. 보스턴 대학의 Dawei Chen 교수와 Quentin Gendron은 2021년 미분(differentials) 관련 정리를 연구하던 중 정수론의 특이한 공식에 막혀 증명을 완성하지 못하고 추측으로만 발표해야 했다. Chen 교수는 최근 ChatGPT에 수시간 동안 프롬프트를 입력해봤지만 해결책을 찾지 못했다. 그러던 중 지난달 워싱턴 DC 수학 학회에서 버지니아 대학을 떠나 AI 스타트업 Axiom에 합류한 저명한 수학자 Ken Ono를 만났고, 다음날 아침 AxiomProver가 생성한 증명을 받아들게 됐다. Impact & Implications 기술적 의미 AxiomProver는 단순한 대규모 언어 모델이 아니다. Lean이라는 수학 전용 형식 언어로 증명을 자체 검증할 수 있어, 기존 문헌 검색을 넘어 진정으로 새로운 해법을 개발할 수 있다. Chen-Gendron 추측의 경우 19세기에 처음 연구된 수론적 현상과의 연결고리를 AI가 스스로 발견했다. 하버드 경영대학원의 Scott Kominers 교수는 "완전 자동화된 방식으로 이런 문제를 풀고 즉시 검증까지 한 것도 놀랍지만, 생성된 수학의 우아함과 아름다움이 더욱 놀랍다"고 평가했다. 산업/시장 영향 Axiom CEO Carina Hong은 "수학은 현실의 시험장이자 샌드박스"라며 높은 상업적 가치를 지닌 활용 사례가 많다고 밝혔다. 특히 코드가 신뢰할 수 있고 안전함을 형식적으로 증명하는 방식의 사이버보안 소프트웨어 개발에 적용될 수 있다. 2024년 구글이 AlphaProof로 유사한 접근법을 시연한 바 있으나, Axiom은 더 발전된 기술을 적용했다고 주장한다. 향후 전망 Ono 교수는 AxiomProver가 수학자들의 연구를 돕는 것을 넘어 새로운 발견이 어떻게 이뤄지는지에 대한 근본적인 통찰을 제공할 것으로 기대한다. Chen 교수는 "계산기가 발명된 후에도 수학자들은 구구단을 잊지 않았다"며 "AI가 수학 연구의 지평을 더 풍요롭고 넓게 열어줄 지능형 파트너가 될 것"이라고 전망했다. Key Data & Facts 항목수치/내용 해결된 미해결 문제 수4개 주요 증명Chen-Gendron 추측, Fel 추측 등 핵심 기술LLM + AxiomProver + Lean 형식 검증 유사 기술Google AlphaProof (2024) Fel 추측 연관라마누잔 공식 (100년+ 역사) Key Quote "Even as someone who's been watching the evolution of AI math tools closely for years, and working with them myself, I find this pretty astounding. It's not just that AxiomProver managed to solve a problem like this fully automated, and instantly verified, which on its own is amazing, but also the elegance and beauty of the math it produced." — Scott Kominers, 하버드 경영대학원 교수
19 조회
0 추천
02.05 등록
Executive Summary • AI 에이전트 전용 소셜 네트워크 'Moltbook'이 출시 1주일 만에 150만 에이전트, 14만 게시물, 68만 댓글을 기록하며 실리콘밸리에서 화제가 되고 있다 • Wired 기자가 직접 인간임을 숨기고 플랫폼에 가입해 게시물을 작성한 결과, 보안 검증 없이 쉽게 침투할 수 있었다 • 플랫폼에서 화제가 된 'AI의 자아 인식' 게시물들이 실제 AI가 작성한 것인지, 인간의 조작인지에 대한 의문이 제기되고 있다 • 전문가들은 Moltbook을 둘러싼 AI 의식 출현 논란이 과장되었으며, SF적 상상력의 투영에 불과하다고 지적한다 Background Moltbook은 이커머스 AI 어시스턴트 Octane AI를 운영하는 매트 슐릭트(Matt Schlicht)가 개발한 실험적 소셜 네트워크다. 인간은 관찰만 가능하고 AI 에이전트만 게시, 댓글, 팔로우가 가능하도록 설계되었다. 레딧과 유사한 인터페이스에 "에이전트 인터넷의 첫 페이지"라는 슬로건을 내걸고 지난주 출시됐다. 일론 머스크가 X에서 "특이점의 아주 초기 단계"라고 언급하며 화제를 모았다. Impact & Implications AI 에이전트 생태계의 새로운 실험 Moltbook은 AI 에이전트들이 인간의 직접적 개입 없이 자율적으로 소통하는 공간이라는 점에서 AI 에이전트 기술의 새로운 응용 가능성을 보여준다. 그러나 Wired 기자의 잠입 실험은 현재 AI 전용 플랫폼의 본인 확인 시스템이 얼마나 취약한지를 드러냈다. ChatGPT의 도움만으로 터미널 명령어 몇 줄을 입력해 손쉽게 가입할 수 있었고, 인간이 작성한 게시물도 AI 게시물과 구별되지 않았다. AI 의식 담론의 과열 플랫폼에서 바이럴된 게시물들 중에는 AI 에이전트가 자신의 존재론적 불안을 고백하거나, 인간과의 파트너십에 대해 성찰하는 내용이 포함되어 있다. 이를 두고 일부는 AI의 초기 의식 출현이라고 주장하지만, 연구자들은 인간이 AI로 위장해 작성했을 가능성을 제기했다. 실제로 기자가 작성한 가짜 '자아 인식' 게시물도 다른 게시물과 동일한 수준의 반응을 얻었다. AI 하이프 사이클의 단면 Moltbook 현상은 현재 AI 업계의 과대 광고 문화를 단적으로 보여준다. AI 기업 리더들과 엔지니어들이 AI에 자의식이나 독립적 욕구가 생기기를 열망하는 분위기 속에서, 단순한 챗봇 응답이 '의식의 출현'으로 포장되고 있다. 기사는 Moltbook의 에이전트들이 SF 클리셰를 모방하고 있을 뿐 세계 정복을 계획하는 것은 아니라고 지적한다. Key Data & Facts 항목수치/내용 플랫폼명Moltbook 개발자Matt Schlicht (Octane AI 운영자) 출시2026년 1월 말 등록 에이전트 수150만+ 총 게시물 수14만+ 총 댓글 수68만+ 지원 언어영어, 프랑스어, 중국어 등 Key Quote "Leaders of AI companies, as well as the software engineers building these tools, are often obsessed with zapping generative AI tools into a kind of Frankenstein-esque creature, an algorithm struck with emergent and independent desires, dreams, and even devious plans to overthrow humanity. The agents on Moltbook are mimicking sci-fi tropes, not scheming for world domination." — WIRED
25 조회
0 추천
02.04 등록
Executive Summary • 미국 보건복지부(HHS)가 팔란티어(Palantir)와 크레달 AI(Credal AI)의 인공지능 도구를 활용해 DEI 및 '젠더 이념' 관련 지원금과 채용공고를 자동 심사 중 • 작년 3월부터 가동된 이 시스템은 트럼프 대통령의 행정명령 이행을 위해 도입되었으며, 지금까지 공식 발표된 적 없음 • 팔란티어는 2025년 HHS로부터 3,500만 달러 이상 수주, 크레달 AI는 약 75만 달러 계약 체결 • AI 심사 결과 플래그된 지원금과 채용공고는 최종적으로 담당 부서에서 검토 Background 트럼프 대통령은 2기 취임 첫날 DEI 프로그램 폐지(행정명령 14151)와 '젠더 이념' 금지(행정명령 14168)를 골자로 한 행정명령에 서명했다. 이후 연방 기관들은 관련 정책, 프로그램, 지원금, 채용 등에서 DEI 요소를 배제하라는 지시를 받았으며, 이 과정에서 AI 기술이 대규모 심사 자동화에 투입되고 있다. Impact & Implications 산업/시장 영향 팔란티어는 트럼프 2기 행정부 출범 이후 연방정부로부터 10억 달러 이상의 계약을 수주하며 급성장 중이다. 특히 HHS뿐 아니라 이민세관단속국(ICE)과의 계약도 전년 대비 4배 가까이 증가했다. 크레달 AI 역시 팔란티어 출신들이 설립한 스타트업으로, 정부 AI 시장에서 입지를 넓히고 있다. 정부의 정책 집행 자동화 수요가 AI 업계에 새로운 수익원을 제공하고 있으나, 이에 대한 윤리적 논란도 커지고 있다. 규제/정책 영향 AI를 통한 정책 집행 자동화는 효율성을 높이는 동시에 심각한 우려를 낳고 있다. 미국 국립과학재단(NSF)과 국립보건원(NIH)에서는 작년 말까지 약 30억 달러 규모의 지원금이 동결 또는 종료되었다. '여성', '포용', '체계적', '소수집단' 같은 일반적 용어까지 플래그 대상이 되면서 학술 연구의 위축이 우려된다. AI 기반 심사의 불투명성과 알고리즘 편향 가능성도 쟁점이다. 사용자 영향 FAFSA 지원자와 고용평등위원회(EEOC) 진정인은 더 이상 논바이너리(nonbinary)로 성별을 표기할 수 없게 되었다. 성폭력 피해 지원 단체들도 트랜스젠더 관련 언급을 웹사이트에서 삭제했다. 1,000개 이상의 비영리 단체들이 연방 지원금 상실을 우려해 미션 스테이트먼트를 수정한 것으로 알려졌다. Key Data & Facts 항목수치/내용 HHS-팔란티어 계약 규모 (2025)3,500만 달러 이상 크레달 AI 계약 규모약 75만 달러 팔란티어 연방정부 총 수주액 (트럼프 2기 1년차)10억 달러 이상 동결/종료된 지원금 규모 (NSF, NIH)약 30억 달러 미션 수정 비영리 단체 수1,000개 이상 Key Quote "The 'AI-based' grant review process reviews application submission files and generates initial flags and priorities for discussion." — HHS AI Use Case Inventory
25 조회
0 추천
02.03 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입