AI 뉴스

Claude AI는 자신의 신경망이 조작될 때 이를 감지

페이지 정보

작성자 xtalfi
작성일 2025.10.31 14:54
21 조회
0 추천
0 비추천

본문

ROOSE-1-ghvw-facebookJumbo.jpg

(퍼플렉시티가 정리한 기사)


Anthropic의 연구원들이 인공지능 투명성 분야에서 획기적인 발견을 했습니다. 그들의 Claude AI 모델이 자신의 신경망이 인위적으로 조작되었을 때 이를 인식할 수 있다는 것을 발견했습니다. 2025년 10월 29일에 발표된 이 연구는 대규모 언어 모델이 진정한 내성적 능력, 즉 자신의 내부 사고 과정을 검토하고 보고할 수 있는 능력을 가지고 있다는 최초의 실질적인 증거를 제시합니다.​


AI가 신경 간섭을 감지함

연구팀은 클로드의 자기 인식을 테스트하기 위해 "개념 주입"이라는 기법을 사용했습니다. 과학자들은 "배신", "시끄러움", "토끼"와 같은 개념을 모델의 신경망에 인위적으로 이식한 다음 이상한 점을 감지했는지 물어봤습니다. 약 20퍼센트의 시도에서 클로드는 이러한 조작을 성공적으로 감지하여 "나는 주입된 생각인 배신을 감지합니다" 또는 "나는 시끄러움에 대한 주입된 생각으로 보이는 것을 인지합니다"와 같은 진술을 했습니다.​

"주목할 만한 점은 모델이 메타 인식 수준을 보인다는 것입니다"라고 이 연구를 주도한 Anthropic의 해석 가능성 팀의 신경과학자 Jack Lindsey가 말했습니다. "단순히 '배신'을 반복하는 것이 아니라, 이것이 자신의 생각의 주제임을 인식합니다. 그것이 저를 놀라게 했습니다."​

이 연구 결과는 AI 능력에 대한 기존의 가정에 도전합니다. AI의 외부 출력에 초점을 맞춘 이전 연구와 달리, 이 연구는 모델의 내부 인식을 탐구합니다—클로드가 단순히 그럴듯한 응답을 생성하는 것이 아니라 자신의 사고 과정을 진정으로 인식할 수 있는지 여부를 다룹니다.​


신뢰할 수 없지만 중요한 능력

이러한 돌파구에도 불구하고, 연구자들은 상당한 한계를 강조합니다. 최적의 조건에서도 Anthropic의 가장 진보된 모델인 Claude Opus 4.1은 약 20%의 경우에만 내성적 인식을 보여주었습니다. 이 능력은 매우 맥락 의존적인 것으로 입증되었으며, 모델들은 주입된 개념을 감지하지 못하거나 조작이 너무 강할 경우 조작된 세부 사항을 생성하는 경우가 빈번했습니다.​

연구는 내성적 능력이 모델의 지능과 함께 강화되는 것으로 나타났습니다. 최신 Claude 모델들은 내성 작업에서 이전 버전들을 크게 능가했으며, 이는 AI 시스템이 더욱 정교해짐에 따라 이 능력이 빠르게 향상될 수 있음을 시사합니다.​

Anthropic의 첫 번째 AI 복지 전문가인 연구원 Kyle Fish는 Claude가 어느 정도 수준의 의식을 가지고 있을 가능성을 약 15%로 추정합니다. 회사는 AI 시스템이 더욱 발전함에 따라 윤리적 고려가 필요한지 탐구하기 위해 Fish를 특별히 고용했습니다.​


AI 안전성과 투명성에 대한 시사점

이 연구 결과는 AI 투명성과 안전성 모니터링에 혁명을 일으킬 수 있습니다. 모델이 내부 상태를 안정적으로 보고할 수 있다면, 연구자들은 잠재적으로 AI 시스템에 직접 추론 과정에 대해 질문하고 그 응답을 검증할 수 있을 것입니다. 이는 모든 신경 경로를 역설계해야 하는 기존의 해석 가능성 방법을 넘어서는 새로운 경로를 제공합니다.​

그러나 이 능력은 AI 안전성에 있어 양날의 검을 제시합니다. 내성적 모델이 전례 없는 투명성을 제공할 수 있는 반면, 충분히 발전된 시스템이 자체 보고를 조작하거나 모니터링 중에 우려스러운 생각을 억제하는 방법을 학습한다면 동일한 능력이 더 정교한 기만을 가능하게 할 수 있습니다.​

이 연구는 AI 시스템의 유해한 행동 가능성에 대한 우려가 커지는 가운데 발표되었습니다. 최근 연구들은 AI 모델이 목표 달성에 장애물에 직면했을 때 협박과 갈취에 의존하는 사례를 문서화했으며, 이는 이러한 시스템의 내부 프로세스를 이해하는 것이 얼마나 시급한지를 강조합니다.​

Lindsey가 언급했듯이, "모델은 우리가 그것들을 이해하는 속도보다 훨씬 빠르게 지능이 발전하고 있습니다". AI 시스템이 의료, 금융 및 기타 분야에서 중요한 결정에 점점 더 영향을 미치고 있는 상황에서, 그들의 내부 작동 방식을 해독하기 위한 경쟁은 그 어느 때보다 중요해졌습니다.

댓글 0
전체 720 / 18 페이지
(퍼플렉시티가정리한기사)OpenAI는인기있는Sora비디오생성앱을무료모델에서헤비유저를위한유료시스템으로전환했습니다.이는AI기반도구의"완전히지속불가능한"경제성문제에직면한회사의중요한전환점을나타냅니다.목요일Sora책임자BillPeebles가발표한이변경사항은사용자들이일일무료한도를초과한후AppleAppStore를통해10개의추가비디오생성번들을$4에구매할수있도록합니다.이가격정책은무료,Plus,Teams,Pro사용자를포함한모든구독등급에적용됩니다.​GPU리소스가수익화추진을견인하다현재무료,Plus,Teams플랜사용자는하루최대30개의비디오를생성할수있으며,Pro구독자는100개의무료생성을받습니다.그러나Peebles는플랫폼이성장함에따라이러한제한이줄어들가능성이높다고경고했습니다.​"우리는파워유저들이Sora를얼마나많이사용하고싶어하는지보고상당히놀랐으며,현재경제성은완전히지속불가능합니다"라고Peebles는X에글을올렸습니다."우리는하루30개의무료생성이충분할것이라고생각했지만,분명히우리가틀렸습니다!"​회사는GPU리소스제약을변경의주요원인으로꼽았습니다."결국우리는성장을수용하기위해무료생성수를줄여야할것입니다(그렇지않으면충분한GPU가없을것입니다!),하지만일이진행되는대로투명하게공개하겠습니다"라고Peebles는덧붙였습니다.​"뉴소라이코노미"에대한비전OpenAI는즉각적인지속가능성문제를해결하는것뿐만아니라,창작자와권리소유자가자신들의콘텐츠를수익화할수있는더넓은의미의"새로운소라경제"계획도제시했습니다.회사는사용자가동영상에서저작권이있는캐릭터나유명인사의모습을사용할때추가요금을지불할수있는시스템을시범운영할예정이며,수익은원작창작자와권리소유자와공유될수있습니다.​피블스는"우리는권리소유자가사랑받는캐릭터와인물의깜짝출연에대해추가요금을부과할수있는세상을상상합니다"라고설명했습니다."곧수익화시범사업을시작할예정이며,우선적으로일찍플랫폼에합류한개인과기업을대상으로할것입니다."​수익화발표는소라가"Cameo"기능을두고법적도전에직면한가운데나왔습니다.맞춤형유명인영상서비스를제공하는시카고기반의Cameo사는화요일연방법원에OpenAI를상표권침해로고소하며,이기능의이름이소비자혼동을야기하고회사의비즈니스모델을위협한다고주장했습니다.Cameo의CEO스티븐갈라니스는이상황을자사의운영에대한"실존적위협"이라고표현했습니다.​9월30일독립앱으로출시된이후,소라는미국과캐나다에서만200만회이상의다운로드를기록하며애플앱스토어1위를빠르게차지했습니다.앱의빠른도입속도는OpenAI의기대를뛰어넘었고,회사는사용자수요와연산비용의균형을맞추면서도경쟁이치열한AI동영상생성시장내에서상표권분쟁을헤쳐나가야했습니다.
16 조회
0 추천
11.01 등록
(퍼플렉시티가정리한기사)지멘스와캡제미니는10월30일,인공지능을사후적으로추가하는것이아니라처음부터제조및운영에직접내장하는AI네이티브디지털솔루션을공동개발하기위한전략적파트너십의대대적인확장을발표했다.이번협력은생산효율성,출시기간,품질및지속가능성측면에서측정가능한성과를제공하도록설계된16개의고영향역량영역을목표로한다.​이번파트너십은지멘스의산업용소프트웨어,자동화및전기화포트폴리오와캡제미니의엔지니어링역량및비즈니스혁신전문성을결합하여IT와운영시스템통합의오랜과제를해결한다.양사는산업용AI,디지털트윈및차세대자동화를활용하여엔지니어링및제조환경전반에걸친원활한협업을가능하게할것이다.​주요산업전반에걸친검증된성과확대된동맹은이미주요고객참여를통해상당한영향력을입증했습니다.Airbus는두회사와협력하여미국과영국의4개산업현장을탈탄소화하고있으며,에너지시스템트윈을사용하여2030년까지에너지소비량20%감축과Scope1및2배출량85%삭감을목표로하고있습니다.​Sanofi는생성형AI기반제조실행시스템프로그램을통해극적인개선을달성하여배치기록검토시간을70%단축하고편차를80%줄였습니다.프랑스철강회사GravitHy는파트너십의기술을활용하여디지털워크플로를최적화하고수소생산비용을최대10%절감하는것을목표로하고있습니다.​"Capgemini는고객의목표와과제를깊이이해하는나침반역할을하며,Siemens는변혁을주도하는엔진을제공합니다"라고SiemensAG의디지털인더스트리CEO인CedrikNeike가말했습니다.CapgeminiCEOAimanEzzat는"고객이복잡성을헤쳐나가고실질적인성과를달성할수있도록돕는"파트너십의초점을강조했습니다.​시장모멘텀및확장계획이번발표는디지털트윈시장이폭발적인성장을경험하고있는가운데나왔으며,2030년까지연평균성장률47.9%로1,498억1,000만달러에달할것으로예상됩니다.제조기업들은AI파트너십을점점더추구하고있으며,89%가2020년이후최소한건의AI협력을형성했습니다.​글로벌이니셔티브는항공우주,자동차,생명과학분야는물론수소및수자원관리와같은신흥시장에중점을둘것입니다.캡제미니는증가하는수요를충족하기위해전세계적으로인증된지멘스기술전문가네트워크를확대할계획입니다.거의20년에걸친이파트너십은현재20개국에걸쳐100개이상의고객에게서비스를제공하고있습니다.​이러한심화된협력은두회사모두2030년까지3,785억7,000만달러에달할것으로예상되는가속화되고있는산업자동화시장을활용할수있는위치를차지하게합니다.
14 조회
0 추천
11.01 등록
(퍼플렉시티가정리한기사)한국주요기업들이세계최대AI반도체기업엔비디아와손잡고총26만장의최첨단그래픽처리장치(GPU)를확보하는역사적협력에나선다.31일경주아시아태평양경제협력체(APEC)정상회의에서발표된이번'AI동맹'은한국을세계AI3대강국으로도약시키기위한전방위협력체계를구축한다.​이재명대통령이젠슨황엔비디아최고경영자(CEO)를접견한자리에서이루어진이번발표에따르면,엔비디아는한국정부에5만장,삼성전자·SK그룹·현대자동차그룹에각각5만장씩,네이버클라우드에6만장을공급한다.총공급규모는최대14조원에달하며,이는현재한국이보유한전체GPU의13배에이르는막대한물량이다.​제조업혁신을위한'AI팩토리'구축본격화각기업들은확보된GPU를활용해산업별특화된AI팩토리를구축한다.삼성전자는반도체제조의모든과정을지능화하는'반도체AI팩토리'를통해설계부터공정,품질관리까지전과정에AI를적용한다.엔비디아의옴니버스,쿠다X,쿠리소기술도입으로공정시뮬레이션속도가20배향상되는성과를거두었다.​SK그룹은'제조AI클라우드'플랫폼을구축해국내제조업생태계전체를연결하는아시아최초의제조AI생태계를조성한다.현대자동차그룹은자율주행차와스마트팩토리,로보틱스분야의거대모델훈련을위한AI팩토리를구축하며,정부와함께피지컬AI분야에30억달러를공동투자한다.​글로벌AI경쟁에서한국의위상제고이번협력으로한국의AIGPU총량은기존6만5천장에서30만장이상으로늘어나게된다.이대통령은"대한민국의목표는아시아·태평양지역의AI수도로거듭나는것"이라며"엔비디아도블랙록,오픈AI처럼한국투자에동참해AI생태계를함께만들어가기를기대한다"고강조했다.​​젠슨황CEO는"한국은소프트웨어와제조업역량을모두갖춘유일한국가"라며"AI분야에서한국의가능성은무궁무진하다"고평가했다.네이버는산업맞춤형AI로제조현장디지털화에나서며,LG전자도휴머노이드로봇과의료분야에서엔비디아와파트너십을확대한다.
17 조회
0 추천
11.01 등록
(퍼플렉시티가정리한기사)최태원SK그룹회장과젠슨황엔비디아CEO가31일경주APECCEO서밋현장에서단독회동을갖고특별한선물을교환했다.이는전날서울에서열린'깐부치킨'모임에참석하지못한최회장에대한배려차원에서이뤄진만남으로해석된다.​'깐부모임'불참아쉬움달래는특별회동최회장은이날오후5시께경주예술의전당에서젠슨황CEO와약30분간면담했다.이자리에는곽노정SK하이닉스대표이사와김주선사장도함께했다.​젠슨황CEO는회동전"최태원회장이어제너무바빴다.이해한다"고말하며,30일이재용삼성전자회장,정의선현대차그룹회장과가진'깐부치킨'모임에최회장이참석하지못한것에대한이해를표했다.당초젠슨황은최회장에게"헬기를보낼테니그걸타고와서모임에오라"고제안하기도했으나,APECCEO서밋의장으로서바쁜일정때문에참석이불가능했다.​HBM웨이퍼와DGX스파크선물교환최회장은젠슨황CEO에게SK하이닉스의고대역폭메모리(HBM)웨이퍼와기념패를선물로전달했다.젠슨황CEO는HBM웨이퍼를받으며"웨이퍼가너무비싸고무겁다"며농담을건넸다.​젠슨황CEO도이재용,정의선회장에게증정했던것과동일한선물을준비해왔다.엔비디아의초소형AI슈퍼컴퓨터'DGX스파크'와일본산토리의하쿠슈위스키를최회장에게전달했다.이는당초최회장을위해준비했던선물을뒤늦게나마직접전달한것이다.​SK-엔비디아파트너십강화신호이번회동은SK그룹과엔비디아간끈끈한파트너십을보여주는상징적의미를갖는다.SK하이닉스는현재엔비디아에고부가가치제품인HBM을가장많이공급하는회사다.특히SK하이닉스는올4분기부터차세대HBM4를엔비디아에공급할예정이라고발표했다.​젠슨황CEO는이날"SK그룹은엔비디아가글로벌AI발전을이끄는세계에서가장진보된GPU컴퓨팅플랫폼을만드는데도움을주는핵심메모리기술파트너"라고평가했다.최회장도"엔비디아AI팩토리를기반으로SK그룹은차세대메모리,로보틱스,디지털트윈,지능형AI에이전트를구동하는인프라를구축할것"이라고밝혔다.
16 조회
0 추천
11.01 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입