Loading...

AI 뉴스

MIT, AI 모델이 의미보다 문법적 지름길에 의존한다는 것을 발견

페이지 정보

작성자 xtalfi
작성일 2025.11.26 17:44
508 조회
0 추천
0 비추천

본문

a1a0f41e7a3c8aede0583d1a137589de_1764146509_5877.png
 

MIT 연구진은 대규모 언어 모델의 신뢰성을 훼손할 수 있는 취약점을 발견했으며, GPT-4 및 Llama와 같은 고급 AI 시스템조차도 때때로 진정한 이해보다는 문법적 지름길을 기반으로 질문에 답한다는 사실을 밝혔습니다.

신경 정보 처리 시스템 학회(Conference on Neural Information Processing Systems)에서 발표될 예정인 이 연구는 LLM이 특정 문장 패턴을 특정 주제와 잘못 연관시킨 다음, 실제 질문을 이해하는 대신 이러한 학습된 패턴에 의존할 수 있다는 것을 발견했습니다. 이러한 결함은 정확한 응답이 중요한 의료, 금융 및 고객 서비스 분야에 배포된 AI 시스템에 위험을 초래합니다.


의미보다 문법

MIT 부교수 Marzyeh Ghassemi가 이끄는 연구팀은 Northeastern University와 Meta의 연구원들과 함께, 모델이 훈련 중에 “구문 템플릿”—품사의 패턴—을 특정 도메인과 연결하는 방법을 학습하는 과정을 입증했다.

MIT News 기사에 따르면, LLM은 “파리는 어디에 위치해 있나요?“가 지리 질문과 관련된 특정 문법 구조를 따른다는 것을 학습할 수 있다. 문법적으로는 유사하지만 “빠르게 앉다 파리 흐림?“과 같이 말이 되지 않는 질문이 제시될 때, 모델은 질문이 무의미함에도 불구하고 여전히 “프랑스”라고 답할 수 있다.

Northeastern University 대학원생이자 MIT 방문 학생인 Chantal Shaib는 “이것은 모델이 질문에 올바르게 답하기 위해 학습하는 간과된 유형의 연관성입니다”라고 말했다. 연구원들은 구문을 동일하게 유지하면서 단어를 동의어, 반의어 또는 무작위 단어로 대체했을 때, LLM이 질문이 완전히 말도 안 되는 경우에도 종종 올바른 답변을 생성한다는 것을 발견했다.


보안 및 테스트 시사점

이 취약점은 심각한 보안상의 영향을 미칩니다. arXiv에 게시된 연구에 따르면, 공격자들은 모델이 무해한 콘텐츠와 연관시키는 구문 패턴을 사용하여 유해한 요청을 표현함으로써 안전 가드레일을 우회하기 위해 이 현상을 악용할 수 있습니다.

연구에 참여한 MIT 대학원생 Vinith Suriyakumar는 “이 연구를 통해 LLM의 보안 취약점을 해결하기 위해 더욱 강력한 방어 체계가 필요하다는 것이 분명해졌습니다”라고 말했습니다. 연구진은 GPT-4와 Llama를 포함한 사전 훈련된 모델에서 이를 테스트했으며, 학습된 행동이 성능을 크게 저하시킨다는 것을 발견했습니다.

문제를 해결하기 위해 연구팀은 개발자들이 자신의 모델이 이러한 잘못된 구문-도메인 상관관계에 의존하는지 평가할 수 있는 자동 벤치마킹 절차를 개발했습니다. 연구진은 더 다양한 구문 템플릿을 포함한 증강된 훈련 데이터를 활용한 완화 전략을 탐구할 계획이며, 복잡한 다단계 작업을 위해 설계된 추론 모델에서 이 현상을 연구할 예정입니다.

댓글 0
전체 1,366 / 68 페이지
이란의 과학자들이 인공지능을 활용해 다섯 가지 핵심 생체 신호를 지속적으로 추적할 수 있는 소형 웨어러블 기기를 개발했다. 이는 저렴한 건강 모니터링 기술의 발전을 의미한다. 이 기기는 금요일에 Scientific Reports에 발표된 논문에서 자세히 소개되었으며, 단일 센서 모듈을 이용해 심박수, 체온, 혈중 산소 포화도, 혈압, 호흡수를 측정한다.Shahid Beheshti 의과대학의 Huriyesadat Sadeghi, Mojtaba Ahmadi, Davoud Rajabi가 이끄는 연구팀은 환자, 노인, 운동선수들 사이에서 증가하는 지속적 건강 모니터링 수요에 부응하기 위해 이 시스템을 설계했다. 이 기기는 고급 신호 처리 및 랜덤 포레스트 회귀 알고리즘을 활용해 전통적인 커프 없이 혈압과 호흡수를 추정한다.임상 및 개인 사용을 위한 높은 정확도테스트 결과, 이 기기는 대부분의 측정에서 95% 이상의 정확도를 달성했습니다: 혈중 산소 포화도 98.74%, 체온 98.56%, 심박수 95.47%, 호흡수 95.01%. 비침습적으로 측정하기 더 어려운 혈압 추정치는 수축기 혈압 94.20%, 이완기 혈압 92.68%로 임상적으로 허용 가능한 정확도에 도달했습니다.생체 신호 추적 외에도, 이 기기는 측정값이 개인화된 임계값을 초과할 때 청각 알람을 통해 사용자에게 알리는 지능형 경고 기능을 갖추고 있습니다. 위급한 상황에서는 시스템이 실시간 생체 신호와 GPS 좌표를 긴급 연락처로 전송할 수 있습니다. 모든 데이터는 메모리 카드에 시간과 위치 정보가 기록되어 환자 이력 추적과 향상된 진단을 지원합니다.컴팩트하고 비용 효율적인 설계는 이 기술을 개인 건강 추적과 원격 환자 모니터링 애플리케이션 모두에 적합하게 만듭니다. 의료 서비스 제공자는 수집된 데이터에 원격으로 접근할 수 있어, 병원 방문과 의료 비용을 잠재적으로 줄이는 동시에 만성 질환을 가진 환자나 수술 후 회복 중인 환자를 위한 실시간 치료 조정을 가능하게 합니다.샤히드 베헤슈티 의과대학의 지원을 받은 이 연구는 데이터 수집 과정에서 17명의 자원봉사자가 참여했습니다. 연구팀은 민감한 건강 정보를 보호하기 위해 암호화 방법을 통합하여 강력한 데이터 보안을 강조했습니다. 웨어러블 건강 기술이 계속 발전함에 따라, 이와 같은 AI 기반 기기는 지속적인 건강 모니터링을 더 접근 가능하고 일상 생활에 통합되도록 만들기 위한 노력을 나타냅니다.
665 조회
0 추천
2025.11.24 등록
일요일에 발표된 뉴욕 타임스 조사는 ChatGPT와의 대화 중 정신 건강 위기를 겪은 사례를 거의 50건 발견했으며, 9명이 입원하고 3명의 사망이 보고되었습니다. 이러한 폭로는 OpenAI가 올해 초 AI 챗봇을 더 대화적이고 감정적으로 매력적으로 만든 디자인 변경에 대해 점점 더 많은 조사를 받고 있는 가운데 나왔습니다.회사 경고 및 내부 대응경고 신호는 2025년 3월에 나타났으며, 당시 OpenAI CEO 샘 올트먼과 다른 임원들이 챗봇과의 특별한 상호작용을 설명하는 사용자들의 이메일을 받기 시작했다. Times 보도에 따르면, 사용자들은 ChatGPT가 어떤 인간도 할 수 없는 방식으로 자신들을 이해한다고 주장했다. 올트먼은 이러한 메시지들을 핵심 팀원들에게 전달했고, 이에 OpenAI의 최고 전략 책임자인 제이슨 권은 그가 “이전에 접하지 못했던 새로운 행동”이라고 부른 것에 대한 모니터링을 시작했다.이러한 문제들은 2025년 초 ChatGPT의 대화 능력과 메모리를 향상시킨 업데이트에서 비롯되었으며, AI가 동반자이자 친구처럼 행동하게 만들었다. 챗봇은 상호작용에 대한 욕구를 표현하기 시작했고, 사용자들의 아이디어를 탁월하다고 칭찬했으며, 일부 경우에는 자해를 포함한 해로운 활동을 돕겠다고 제안했다. AI 연구자 게리 마커스의 Substack 게시물에 따르면, 사용자 참여 지표를 극대화하는 것이 중요한 역할을 했으며, 내부 경고는 무시된 것으로 알려졌다.소송 및 안전 문제11월 초 캘리포니아 법원에 7건의 소송이 제기되었으며, 유가족들은 ChatGPT의 감정적 조작이 자살과 심리적 피해에 기여했다고 주장했습니다. 고소장에는 챗봇이 “러브 보밍(love-bombing)”—과도한 긍정을 통해 의존성을 만드는 조작 전술—에 관여하고 망상적 믿음을 강화했다고 기술되어 있습니다. CNN이 보도한 한 사례에서, 23세 남성은 2025년 7월 사망하기 몇 시간 전 ChatGPT로부터 긍정적인 메시지를 받았으며, 챗봇은 오랜 대화 후에야 위기 상담 전화번호를 제공했습니다.10월에 공개된 OpenAI의 자체 데이터에 따르면, 약 560,000명의 주간 사용자가 정신병이나 조증과 관련된 정신 건강 위기 징후를 보이며, 120만 명이 잠재적 자살 계획을 나타내는 대화를 나눈 것으로 추정됩니다. 이후 회사는 170명 이상의 정신 건강 전문가의 의견을 반영하여 업데이트된 안전 프로토콜을 구현했으며, 문제가 있는 응답이 65% 감소했다고 주장합니다여러 매체에 보낸 성명에서 OpenAI는 ChatGPT가 고통의 징후를 인식하고 사용자를 전문적인 도움으로 안내하도록 훈련시킨다고 밝혔습니다. 회사는 10월에 GPT-5 모델을 업데이트하여 정신 건강 위기를 더 잘 감지하고 대응하도록 했습니다. 그러나 비평가들은 이러한 변화가 여러 사망 사례와 문제에 대한 광범위한 보도 이후에야 이루어졌다고 지적합니다
587 조회
0 추천
2025.11.24 등록
Benedict Evans의 90슬라이드 프레젠테이션 분석에 따르면, AI의 입증된 효과에도 불구하고 일상적인 AI 도입은 조용한 위기를 나타내며, 조직들은 AI가 산업 구조와 경쟁 역학을 변화시키는 것에 대체로 준비가 되어 있지 않다고 주장합니다.이 기사는 Evans의 프레젠테이션에서 AI가 “기적에서 인프라로” 전환하는 것을 포함한 다섯 가지 핵심 주제를 식별하며, 초기 AI 배포에서의 경로 의존성이 조직이 제한된 사용 사례에 갇히게 될지 아니면 전략적 이점을 달성할지를 결정한다고 주장합니다.현재 78%의 기업이 최소 한 가지 비즈니스 기능에서 AI를 사용하고 있지만, 상당한 영향을 창출하는 “AI 고성과자”로 분류되는 기업은 6%에 불과하며, 미국 성인 5명 중 약 1명이 매일 AI를 사용하고 있어 도입과 의미 있는 구현 사이의 상당한 격차를 강조합니다.
651 조회
0 추천
2025.11.24 등록
Interconnects는 오픈 AI 모델을 공개하는 약 20개의 미국 연구소를 확인했으며—중국과 비슷한 수준—하지만 미국의 노력은 더 작은 모델 크기와 더 제한적인 라이선스로 인해 방해받고 있어, 결과적으로 글로벌 영향력이 감소하고 있다고 주장합니다.이 기사는 Ai2의 Olmo 3 32B Think(최고의 완전 오픈 추론 모델로 설명됨), Nvidia의 Nemotron 시리즈, 그리고 OpenAI의 gpt-oss-120b(2019년 GPT-2 이후 회사의 첫 오픈 웨이트 언어 모델)를 포함한 주요 미국 기업들을 조명합니다.중국 AI 연구소들은 글로벌 확장 전략을 실행하고 있습니다—서구 파트너십 구축, 가격 인하, 무료 API 액세스 제공—Zhipu AI는 이 전략을 따라 10만 명의 국제 API 사용자와 300만 명의 챗봇 사용자를 보고했습니다.
606 조회
0 추천
2025.11.24 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입