Loading...

AI 뉴스

MIT, AI 모델이 의미보다 문법적 지름길에 의존한다는 것을 발견

페이지 정보

작성자 xtalfi
작성일 11.26 17:44
24 조회
0 추천
0 비추천

본문

a1a0f41e7a3c8aede0583d1a137589de_1764146509_5877.png
 

MIT 연구진은 대규모 언어 모델의 신뢰성을 훼손할 수 있는 취약점을 발견했으며, GPT-4 및 Llama와 같은 고급 AI 시스템조차도 때때로 진정한 이해보다는 문법적 지름길을 기반으로 질문에 답한다는 사실을 밝혔습니다.

신경 정보 처리 시스템 학회(Conference on Neural Information Processing Systems)에서 발표될 예정인 이 연구는 LLM이 특정 문장 패턴을 특정 주제와 잘못 연관시킨 다음, 실제 질문을 이해하는 대신 이러한 학습된 패턴에 의존할 수 있다는 것을 발견했습니다. 이러한 결함은 정확한 응답이 중요한 의료, 금융 및 고객 서비스 분야에 배포된 AI 시스템에 위험을 초래합니다.


의미보다 문법

MIT 부교수 Marzyeh Ghassemi가 이끄는 연구팀은 Northeastern University와 Meta의 연구원들과 함께, 모델이 훈련 중에 “구문 템플릿”—품사의 패턴—을 특정 도메인과 연결하는 방법을 학습하는 과정을 입증했다.

MIT News 기사에 따르면, LLM은 “파리는 어디에 위치해 있나요?“가 지리 질문과 관련된 특정 문법 구조를 따른다는 것을 학습할 수 있다. 문법적으로는 유사하지만 “빠르게 앉다 파리 흐림?“과 같이 말이 되지 않는 질문이 제시될 때, 모델은 질문이 무의미함에도 불구하고 여전히 “프랑스”라고 답할 수 있다.

Northeastern University 대학원생이자 MIT 방문 학생인 Chantal Shaib는 “이것은 모델이 질문에 올바르게 답하기 위해 학습하는 간과된 유형의 연관성입니다”라고 말했다. 연구원들은 구문을 동일하게 유지하면서 단어를 동의어, 반의어 또는 무작위 단어로 대체했을 때, LLM이 질문이 완전히 말도 안 되는 경우에도 종종 올바른 답변을 생성한다는 것을 발견했다.


보안 및 테스트 시사점

이 취약점은 심각한 보안상의 영향을 미칩니다. arXiv에 게시된 연구에 따르면, 공격자들은 모델이 무해한 콘텐츠와 연관시키는 구문 패턴을 사용하여 유해한 요청을 표현함으로써 안전 가드레일을 우회하기 위해 이 현상을 악용할 수 있습니다.

연구에 참여한 MIT 대학원생 Vinith Suriyakumar는 “이 연구를 통해 LLM의 보안 취약점을 해결하기 위해 더욱 강력한 방어 체계가 필요하다는 것이 분명해졌습니다”라고 말했습니다. 연구진은 GPT-4와 Llama를 포함한 사전 훈련된 모델에서 이를 테스트했으며, 학습된 행동이 성능을 크게 저하시킨다는 것을 발견했습니다.

문제를 해결하기 위해 연구팀은 개발자들이 자신의 모델이 이러한 잘못된 구문-도메인 상관관계에 의존하는지 평가할 수 있는 자동 벤치마킹 절차를 개발했습니다. 연구진은 더 다양한 구문 템플릿을 포함한 증강된 훈련 데이터를 활용한 완화 전략을 탐구할 계획이며, 복잡한 다단계 작업을 위해 설계된 추론 모델에서 이 현상을 연구할 예정입니다.

댓글 0
전체 1,222 / 11 페이지
Amazon은11월24일발행되고회사가확인한내부메모에따르면,엔지니어들에게제3자AI코딩도구채택을중단하고자사의독점Kiro플랫폼만을사용하도록지시했다.​Amazon의내부뉴스사이트에게시된이지침은회사가"추가적인제3자AI개발도구를지원할계획이없으며"이미사용중인기존도구는계속지원할것이라고명시했다.이메모는특히OpenAI의Codex,Anthropic의ClaudeCode,그리고스타트업Cursor의도구사용을제한하고있으며,이는Amazon이Anthropic에약80억달러를투자하고OpenAI와7년간380억달러규모의클라우드컴퓨팅계약을체결했음에도불구하고내려진조치다.​"빌더커뮤니티의일원으로서,여러분모두는이러한제품을형성하는데중요한역할을하며우리는여러분의피드백을활용하여이를적극적으로개선하고있습니다"라고메모는밝혔으며,AWS유틸리티컴퓨팅수석부사장인PeterDeSantis와eCommerceFoundation수석부사장인DaveTreadwell이서명했다."우리는Kiro를Amazon의권장AI네이티브개발도구로만들고있습니다."​AI경쟁속전략적전환내부지침은아마존이6개월간의평가후10월에OpenAI의Codex를"사용금지"로지정한결정에따른것입니다.ClaudeCode도언론문의이후해당지정이철회되기전잠시"사용금지"로분류되었습니다.​아마존은AI도구개발에서OpenAI및Google과같은경쟁사에뒤처진다는인식에대응하기위해노력해왔습니다.이러한움직임은AI코딩도구시장의경쟁이점점치열해지는가운데나온것으로,Cursor는최근11월에293억달러가치평가로23억달러규모의펀딩라운드를완료했습니다.​2025년7월에출시된Kiro는자연어명령을사용한코드생성을가능하게하며,ClaudeCode는아니지만주로Anthropic의코딩기술에의존합니다.이플랫폼은최근새로운기능과함께전세계로확장되었습니다.​광범위한시장상황이지침은올해초Amazon이AWSBedrockAI서비스에서용량제약에직면하여일부고객들이Google및Anthropic의직접플랫폼을포함한경쟁사로이동한것과일치합니다.Amazon은3분기순매출1,802억달러를보고했으며,이는전년대비13%증가한수치입니다.한편AWS수익은지난분기330억달러로증가하여2022년이후가장빠른성장을기록했습니다.​Anthropic,OpenAI및Cursor의대표들은Amazon의내부정책변경에대한논평요청에즉각응답하지않았습니다.
20 조회
0 추천
11.26 등록
Huawei Cloud는 11월 21일 AI 서밋에서 Huawei 홍콩 AI 생태계 연합을 공식 출범하여 금융, 헬스케어, 물류 부문 전반에 걸쳐 AI 도입을 가속화하기 위해 업계 리더들을 결집시켰습니다. Hong Kong Telecom(HKT), ASL, Nexify, KBQuest, EY, PwC, iFLYTEK, Deloitte China, WPS, ICO를 포함하는 이 연합은 실제 산업 요구를 해결하는 오픈 소스 협력 생태계를 구축하는 것을 목표로 합니다.사이버포트에서 열린 이번 서밋에는 200명 이상의 기업 리더, 파트너, 개발자들이 참석했으며, Huawei 개발자 경진대회 아시아-태평양 결선 시상식과 동시에 개최되었습니다. 홍콩 정부는 이 이니셔티브에 대한 강력한 지지를 표명했으며, 혁신기술산업부 차관 Ms. CHEONG Man-Lei는 행정장관의 2025년 시정방침 연설이 AI를 미래 핵심 산업으로 명시적으로 지정했다고 언급했습니다.새로운 서비스가 AI 장벽을 낮추다Huawei Cloud는 기업의 구현 과제를 줄이기 위해 설계된 여러 서비스를 공개했습니다. MaaS(Model as a Service) 플랫폼은 하루 이내에 AI 컴퓨팅 활성화를 가능하게 하여 플랫폼 준비를 간소화하고 배포를 가속화합니다. 추가 출시에는 MAF(Model Application Firewall), 에이전트 플랫폼 Versatile, 그리고 Huawei Cloud Stack 8.6이 포함되었습니다.Huawei Cloud 아시아태평양 지역 총괄 사장인 Sunny Shang은 홍콩의 전략적 위치를 “중국의 AI 생태계가 전 세계로 확장하고 국제적 혁신이 중국 본토로 진입하는 자연스러운 관문”으로 강조했습니다. 회사는 디지털 인텔리전스 이니셔티브를 지원하기 위해 홍콩에 4개의 가용 영역과 초저지연 클라우드 서비스를 배포했습니다.기존 협력 사례는 실용적인 적용을 보여주었습니다: HKT는 지능형 고객 서비스를 자동화하여 문의 시간을 60%, 운영 비용을 40% 줄였습니다. 홍콩 천문대는 Huawei의 기술을 사용하여 일기 예보를 7일에서 15일로 연장했습니다.개발자 경진대회, 지역 인재를 발굴하다이번 정상회의는 10개국 및 지역에서 약 1,000명의 개발자가 참여하여 192개의 우수한 출품작을 제출한 화웨이 개발자 경진대회 아시아-태평양 시상식으로 마무리되었습니다. 홍콩의 EvoClass Nexus 팀은 AI 교육 플랫폼으로 사회 및 지속가능성 부문에서 우승했으며, 필리핀의 Sproutshk 팀은 AI 금융 관리 애플리케이션으로 금융 부문 타이틀을 차지했습니다.이번 경진대회는 두 개의 부문으로 구성되었습니다: 금융 부문은 지능형 재무 관리, 신용 평가 및 포용적 금융에 초점을 맞췄으며, 사회 및 지속가능성 부문은 의료, 재난 대응 및 스마트 교통을 다뤘습니다. 최종 발표는 11월 19일 홍콩 폴리테크닉 대학교에서 진행되었으며, 시상식은 11월 20일에 개최되었습니다.
30 조회
0 추천
11.25 등록
2022년 11월 30일 오픈AI가 챗GPT를 공개한 지 3년이 지나면서 한국의 인공지능(AI) 경쟁력이 세계 5위권에 안착할 것으로 전망되는 가운데, AI 신뢰성과 안전성 확보가 시급한 과제로 떠올랐다. 부총리급으로 격상된 과학기술정보통신부를 중심으로 정부가 역대 최대 예산을 투입하며 ‘AI 3대 강국’ 도약을 추진하고 있지만, 딥페이크 범죄 급증 등 AI 오남용에 대한 우려도 함께 커지고 있다.글로벌 데이터 플랫폼 스타티스타에 따르면 한국의 올해 AI 시장 규모는 90억6000만 달러(약 13조원)에 달할 전망이다. 마이크로소프트가 이달 발간한 ‘AI 확산 보고서’는 LG의 엑사원 4.0 모델을 미국 오픈AI의 GPT-5, 중국 딥시크에 이어 세계 3위로 평가했다. 미국 대비 기술 격차는 5.9개월로 중국의 5.3개월과 비슷한 수준이다.젠슨 황 엔비디아 [NVDA 최고경영자는 지난달 경주에서 열린 APEC CEO 서밋에서 “한국은 소프트웨어, 과학기술, 제조 역량을 모두 갖춘 몇 안 되는 국가”라며 “한국이 가장 많은 AI 인프라를 보유한 국가가 될 것”이라고 평가했다. 샘 올트먼 오픈AI CEO도 “한국의 AI 사용자 비율이 세계 최고”라고 언급한 바 있다.딥페이크 범죄 급증, 피해자 절반이 10대AI 기술 발전의 이면에서는 안전성 문제가 심각한 사회 이슈로 부상했다. 경찰청에 따르면 지난해 11월부터 올해 10월까지 사이버성폭력 단속으로 3557명이 검거됐으며, 이 중 딥페이크 범죄 비중이 35.2%로 가장 많았다. 딥페이크 범죄 피의자 중 61.8%가 10대였으며, 여성가족부와 한국여성인권진흥원 조사에서는 합성·편집 피해 건수가 전년 대비 227.2% 급증한 것으로 나타났다.김명주 AI안전연구소장은 “AI 모델이 화학·생물·방사능·핵 관련 민감 정보를 우회적으로 학습하는 방식이 가능한지 테스트하는 연구가 일부 국가에서 진행되고 있다”며 “AI 안전 논의가 규제 차원을 넘어 국가 단위 대응 구조로 진화하고 있다”고 설명했다.내년 1월 AI기본법 시행, 생태계 구축 과제정부는 내년 1월 22일부터 시행되는 AI기본법 시행령에 따라 고영향·생성형 AI 기업에 개발 단계부터 위험을 식별·평가·완화하는 체계 구축을 의무화한다. AI 생성물 표시 의무화도 도입되며, 최소 1년 이상의 계도 기간을 거쳐 본격 규제에 나설 예정이다.최병호 고려대 인공지능연구소 교수는 “규모 경쟁에서는 한국이 미국과 중국을 이길 수 없다”며 “선박, 문화, 국방, 식품 등 ‘K-특화’ 분야에서 한국만의 AI 접근법을 만들어야 한다”고 제안했다. 이종호 서울대 교수는 “저전력 반도체, 제조업 AI 전환 등 한국이 강점을 가진 분야를 중심으로 빠르게 발전시켜야 한다”고 강조했다.과기정통부는 올해 2만장 이상의 최신 GPU를 공공·대학·스타트업에 배정했고, 2026년에는 5만장을 추가 도입할 계획이다. 하지만 전문가들은 AI 인재가 미국으로 유출되는 문제와 규제 완화, 중소기업 생태계 구축 등이 여전히 해결해야 할 과제라고 지적한다.
28 조회
0 추천
11.25 등록
수십만 종의 데이터를 분석하여 질병을 유발하는 유전자 돌연변이를 식별할 수 있는 인공지능 모델을 개발했으며, 이는 의사들이 희귀 질환을 진단하는 방식을 잠재적으로 변화시킬 수 있습니다.popEVE라고 불리는 이 모델은 11월 24일 Nature Genetics에 게재되었으며, 심각한 발달 장애가 있는 어린이들과 관련된 31,000건 이상의 사례 중 98%에서 가장 유해한 유전적 변이를 정확하게 식별했습니다. 이 도구는 DeepMind의 AlphaMissense를 포함한 경쟁 모델들을 능가했으며, 이전에 알려지지 않았던 123개의 후보 질병 유전자를 발견했고, 이 중 104개는 단 한두 명의 환자에서만 관찰되었습니다.진화와 인구 데이터의 결합PopEVE는 수십억 년의 진화 역사를 기반으로, 약 20,000개의 인간 단백질 중 생명에 필수적인 부분과 변화를 견딜 수 있는 부분을 분석합니다. 이 모델은 이러한 진화 정보를 영국 바이오뱅크(UK Biobank)와 게놈 집합 데이터베이스(gnomAD)의 데이터와 통합하며, 이들 데이터는 건강한 사람들에게 어떤 변이가 존재하는지 보여줍니다.공동 교신저자이자 유전체조절센터(Centre for Genomic Regulation) 연구원인 마팔다 디아스(Mafalda Dias) 박사는 “진료소들이 항상 부모의 DNA에 접근할 수 있는 것은 아니며 많은 환자들이 혼자 방문합니다”라고 말했습니다. “PopEVE는 이러한 의사들이 질병을 유발하는 돌연변이를 식별하는 데 도움을 줄 수 있으며, 우리는 진료소들과의 협력을 통해 이미 이를 확인하고 있습니다”.트리오 시퀀싱(trio sequencing)으로 알려진 부모 양쪽의 DNA를 필요로 하는 전통적인 유전 진단 방법과 달리, PopEVE는 환자의 유전 정보만으로 작동할 수 있습니다. 이러한 기능은 자원이 제한된 의료 시스템에 특히 유용하며, 진단을 더 빠르고 저렴하게 만듭니다.조상 편향 줄이기popEVE의 두드러진 특징 중 하나는 유전 데이터베이스에서 과소 대표되는 혈통을 가진 사람들에게 불이익을 주지 않는 능력입니다. 현재 유전 데이터베이스는 주로 유럽계 혈통 사람들에게 편향되어 있습니다. 이 모델은 특정 집단에서 한 번 발견된 돌연변이든 유럽 집단에서 수천 번 발견된 돌연변이든 모든 인간 변이를 동등하게 취급합니다.Centre for Genomic Regulation의 공동 교신저자이자 연구원인 Jonathan Frazer 박사는 “전 세계 데이터베이스에 자신의 커뮤니티가 잘 대표되지 않는다는 이유만으로 누구도 무서운 결과를 받아서는 안 됩니다”라고 말했습니다. “PopEVE는 그 불균형을 바로잡는 데 도움이 되며, 이는 이 분야에서 오랫동안 부족했던 것입니다”.[crg +2]연구진은 popEVE가 미스센스 돌연변이—단백질의 단일 아미노산을 변경하는 DNA 변화—만을 해석하며 임상 판단을 대체하지 않는다고 언급했습니다. 현재 희귀 질환을 가진 사람들 중 2명 중 1명은 명확한 진단을 받지 못하고 있습니다.
32 조회
0 추천
11.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입