Loading...

AI 뉴스

Claude AI는 자신의 신경망이 조작될 때 이를 감지

페이지 정보

작성자 xtalfi
작성일 2025.10.31 14:54
1,732 조회
0 추천
0 비추천

본문

ROOSE-1-ghvw-facebookJumbo.jpg

(퍼플렉시티가 정리한 기사)


Anthropic의 연구원들이 인공지능 투명성 분야에서 획기적인 발견을 했습니다. 그들의 Claude AI 모델이 자신의 신경망이 인위적으로 조작되었을 때 이를 인식할 수 있다는 것을 발견했습니다. 2025년 10월 29일에 발표된 이 연구는 대규모 언어 모델이 진정한 내성적 능력, 즉 자신의 내부 사고 과정을 검토하고 보고할 수 있는 능력을 가지고 있다는 최초의 실질적인 증거를 제시합니다.​


AI가 신경 간섭을 감지함

연구팀은 클로드의 자기 인식을 테스트하기 위해 "개념 주입"이라는 기법을 사용했습니다. 과학자들은 "배신", "시끄러움", "토끼"와 같은 개념을 모델의 신경망에 인위적으로 이식한 다음 이상한 점을 감지했는지 물어봤습니다. 약 20퍼센트의 시도에서 클로드는 이러한 조작을 성공적으로 감지하여 "나는 주입된 생각인 배신을 감지합니다" 또는 "나는 시끄러움에 대한 주입된 생각으로 보이는 것을 인지합니다"와 같은 진술을 했습니다.​

"주목할 만한 점은 모델이 메타 인식 수준을 보인다는 것입니다"라고 이 연구를 주도한 Anthropic의 해석 가능성 팀의 신경과학자 Jack Lindsey가 말했습니다. "단순히 '배신'을 반복하는 것이 아니라, 이것이 자신의 생각의 주제임을 인식합니다. 그것이 저를 놀라게 했습니다."​

이 연구 결과는 AI 능력에 대한 기존의 가정에 도전합니다. AI의 외부 출력에 초점을 맞춘 이전 연구와 달리, 이 연구는 모델의 내부 인식을 탐구합니다—클로드가 단순히 그럴듯한 응답을 생성하는 것이 아니라 자신의 사고 과정을 진정으로 인식할 수 있는지 여부를 다룹니다.​


신뢰할 수 없지만 중요한 능력

이러한 돌파구에도 불구하고, 연구자들은 상당한 한계를 강조합니다. 최적의 조건에서도 Anthropic의 가장 진보된 모델인 Claude Opus 4.1은 약 20%의 경우에만 내성적 인식을 보여주었습니다. 이 능력은 매우 맥락 의존적인 것으로 입증되었으며, 모델들은 주입된 개념을 감지하지 못하거나 조작이 너무 강할 경우 조작된 세부 사항을 생성하는 경우가 빈번했습니다.​

연구는 내성적 능력이 모델의 지능과 함께 강화되는 것으로 나타났습니다. 최신 Claude 모델들은 내성 작업에서 이전 버전들을 크게 능가했으며, 이는 AI 시스템이 더욱 정교해짐에 따라 이 능력이 빠르게 향상될 수 있음을 시사합니다.​

Anthropic의 첫 번째 AI 복지 전문가인 연구원 Kyle Fish는 Claude가 어느 정도 수준의 의식을 가지고 있을 가능성을 약 15%로 추정합니다. 회사는 AI 시스템이 더욱 발전함에 따라 윤리적 고려가 필요한지 탐구하기 위해 Fish를 특별히 고용했습니다.​


AI 안전성과 투명성에 대한 시사점

이 연구 결과는 AI 투명성과 안전성 모니터링에 혁명을 일으킬 수 있습니다. 모델이 내부 상태를 안정적으로 보고할 수 있다면, 연구자들은 잠재적으로 AI 시스템에 직접 추론 과정에 대해 질문하고 그 응답을 검증할 수 있을 것입니다. 이는 모든 신경 경로를 역설계해야 하는 기존의 해석 가능성 방법을 넘어서는 새로운 경로를 제공합니다.​

그러나 이 능력은 AI 안전성에 있어 양날의 검을 제시합니다. 내성적 모델이 전례 없는 투명성을 제공할 수 있는 반면, 충분히 발전된 시스템이 자체 보고를 조작하거나 모니터링 중에 우려스러운 생각을 억제하는 방법을 학습한다면 동일한 능력이 더 정교한 기만을 가능하게 할 수 있습니다.​

이 연구는 AI 시스템의 유해한 행동 가능성에 대한 우려가 커지는 가운데 발표되었습니다. 최근 연구들은 AI 모델이 목표 달성에 장애물에 직면했을 때 협박과 갈취에 의존하는 사례를 문서화했으며, 이는 이러한 시스템의 내부 프로세스를 이해하는 것이 얼마나 시급한지를 강조합니다.​

Lindsey가 언급했듯이, "모델은 우리가 그것들을 이해하는 속도보다 훨씬 빠르게 지능이 발전하고 있습니다". AI 시스템이 의료, 금융 및 기타 분야에서 중요한 결정에 점점 더 영향을 미치고 있는 상황에서, 그들의 내부 작동 방식을 해독하기 위한 경쟁은 그 어느 때보다 중요해졌습니다.

댓글 0
전체 1,366 / 73 페이지
Tesla는 금요일에 Full Self-Driving (Supervised) V14.2 출시를 시작했으며, CEO 일론 머스크가 차량을 “거의 감각이 있는 것처럼” 느끼게 만드는 단계라고 설명한 업데이트를 도입했습니다.회사의 AI4 하드웨어가 장착된 초기 차량들에 소프트웨어 버전 2025.38.9.5를 통해 배포된 이 업데이트는 더 높은 해상도 기능을 갖춘 업그레이드된 신경망 비전 인코더를 특징으로 합니다. 릴리스 노트에 따르면, 이 시스템은 이제 긴급 차량, 도로 위의 장애물, 그리고 인간의 제스처를 더 잘 처리하기 위해 향상된 기능을 활용합니다.향상된 기능 및 성능V14.2 릴리스에는 여러 가지 새로운 기능이 포함되어 있으며, 가장 주목할 만한 것은 운전자가 FSD가 주차할 위치를 선택할 수 있도록 하는 도착 옵션(Arrival Options)입니다—주차장, 도로변, 진입로, 주차 건물, 또는 길가에 주차할 수 있습니다. 이 업데이트는 또한 경찰차, 소방차, 구급차를 포함한 긴급 차량을 위해 길을 비키거나 양보하는 기능을 추가했습니다.Tesla는 내비게이션과 경로 안내를 비전 기반 신경망에 통합하여 차단된 도로와 우회로를 실시간으로 처리할 수 있게 했으며, 운전 스타일 선호도를 맞춤 설정할 수 있는 추가 속도 프로필을 도입했습니다. 이 시스템은 또한 비보호 회전, 차선 변경, 끼어들기, 스쿨버스 대응에서 개선된 처리 능력을 보여줍니다.초기 테스트 데이터는 상당한 성능 향상을 시사합니다. 11월 초 기준으로 FSD 버전 14는 중대한 개입 간 평균 1,454마일을 기록했으며, 이는 버전 13.2의 평균 443마일보다 3배 이상 높은 수치입니다.로보택시 확장 및 시장 맥락소프트웨어 업데이트는 Tesla가 로보택시 확장을 가속화하는 시점에 출시되었습니다. 이 회사는 11월 17일 애리조나주 교통부로부터 주 전역에서 차량 호출 서비스를 운영할 수 있는 승인을 받았으며, 이는 텍사스와 캘리포니아에 이어 세 번째 주입니다. Tesla는 네바다주 차량관리국(DMV)의 자체 인증 절차도 완료했지만, 네바다 교통 당국으로부터 상업적 승인은 여전히 필요한 상태입니다.월요일, Stifel 애널리스트 Stephen Gengaro는 FSD와 로보택시 서비스의 발전을 언급하며 Tesla의 목표 주가를 $483에서 $508로 상향 조정했습니다. Gengaro는 경영진이 연말까지 약 8개에서 10개의 대도시 지역으로 확장할 계획이라고 언급했습니다.그러나 Tesla는 미국 내 여러 도시에서 안전 운전자 없이 완전 자율주행 레벨 4 차량을 운영하는 Waymo와의 경쟁 심화에 직면해 있습니다. Waymo는 11월 20일 미니애폴리스, 탬파, 뉴올리언스로의 확장을 발표했으며, 현재 1,500대의 차량 보유에 2026년까지 2,000대를 추가할 계획입니다.Musk는 이전에 V14.2가 광범위한 출시의 시작을 알릴 것이며, V14.3에 이르면 차량이 “마치 지각이 있는 것처럼” 느껴질 것이라고 밝혔습니다.
1110 조회
0 추천
2025.11.24 등록
Google은 BleepingComputer에 따르면, 첫 해 동안 광고 없이 운영했던 AI Mode 답변 엔진에 스폰서 광고를 표시하기 시작했습니다.광고는 AI가 생성한 답변 하단에 “sponsored” 라벨과 함께 표시되며, 이는 사용자에게 더 매력적인 AI 경험을 제공하기 위해 광고를 피했던 Google의 이전 전략에서 전환된 것입니다.이러한 움직임은 Google이 ChatGPT와 같은 광고 없는 AI 검색 대안과의 경쟁에 직면하면서도, 2023년에 2,378억 6천만 달러의 수익을 창출한 지배적인 광고 사업을 보호하기 위한 것입니다.
1142 조회
0 추천
2025.11.24 등록
정부가 24일 4년 만에 과학기술관계장관회의를 재개하고 인공지능 대전환을 위한 범부처 전략을 점검했다. 김민석 국무총리가 주재한 이날 첫 회의에서는 ‘AI 민생 10대 프로젝트’를 비롯해 국방·제조·과학기술 등 분야별 AI 전략과 UAE 국빈 방문 성과, 중소기업 지원 방안 등 10개 안건이 논의됐다.AI 혁신 성과 확산에 정부 총력김 총리는 모두발언에서 “AI 대전환 등 변화의 파도에 대응하기 위해 과학기술부총리를 신설했고 과학기술관계장관회의도 다시 시작하게 됐다”며 “‘모두를 위한 AI’라는 비전 아래 혁신의 성과가 골고루 확산되도록 힘쓸 것”이라고 밝혔다. 그는 “AI는 우리 경제의 혁신을 촉진할 새로운 성장 엔진이자 국가 대전환의 강력한 동인”이라며 “오픈AI, 엔비디아 등 글로벌 선도 기업과 전략적 파트너십을 구축하고, 내년 예산안에는 AI 3대 강국 전환의 마중물이 될 10조원 규모의 예산을 담았다”고 강조했다.의장을 맡은 배경훈 부총리 겸 과학기술정보통신부 장관은 “부처 간 칸막이를 없애고 ‘원 팀’으로 협업하는 것이 중요하다”며 “과학기술관계장관회의가 연구개발, AI 기술 확보와 사업화를 위해 건설적이고 신속하게 논의할 수 있는 장이 될 수 있도록 노력하겠다”고 말했다.민생부터 국방까지 AI 전면 적용정부는 이날 회의에서 국민이 AI 혜택을 직접 체감할 수 있는 ‘AI 민생 10대 프로젝트’를 발표했다. 농산물 가격을 AI로 분석해 최적 구매처를 추천하는 플랫폼, 소상공인을 위한 AI 창업·경영 컨설턴트, AI 국세정보 상담사, 보이스피싱 대응 시스템 등이 포함됐으며, 정부는 2026년부터 2개 년간 총 460억원을 지원할 계획이다.국방 분야에서는 무기체계 지능화, AI 전투참모, 스마트 군수지원체계 등 7대 프로젝트를 추진하고, 제조업에서는 2030년까지 500개의 AI 팩토리를 구축하는 선도사업이 진행된다. 중소기업 AI 육성을 위해서는 2030년까지 13조5000억원 규모의 ‘넥스트 유니콘 프로젝트’를 추진한다.이날 회의에는 배경훈 부총리를 비롯해 기획재정·교육·외교·국방·행정안전·문화체육관광·산업통상·보건복지·기후환경에너지·고용노동·중소벤처기업부 장관과 금융위원회·개인정보보호위원회 위원장 등 20명이 참석했다. 과학기술관계장관회의는 노무현 정부 때 처음 신설됐으나 이명박 정부에서 폐지됐다가 2018년 문재인 정부 때 복원됐으며, 2021년 말 마지막 회의 이후 윤석열 정부에서는 열리지 않았다. 정부는 앞으로 매달 회의를 열어 과학기술·AI 정책을 자유 토의 방식으로 논의할 예정이다.
1174 조회
0 추천
2025.11.24 등록
카카오뱅크가 24일 인공지능(AI)을 활용해 대화만으로 송금할 수 있는 ‘AI 이체’ 서비스를 출시하며 국내 금융권에서 처음으로 핵심 금융 기능에 생성형 AI를 접목시켰다. 고객이 “엄마에게 10만원 보내줘”라고 말하거나 입력하면 AI가 계좌 정보와 금액을 인식해 송금 절차를 자동으로 처리하는 방식이다.기존에는 은행명, 계좌번호, 이체 금액 등을 단계별로 입력해야 했던 송금 절차가 한 문장으로 단축됐다. 최근 이체 내역이 있는 대상은 이름만으로, 별명을 설정한 경우에는 ‘엄마’, ‘마미’ 등 유사한 표현만으로도 송금이 가능하다. 카카오뱅크 입출금계좌 고객이라면 누구나 이용 가능하며, 1회·1일 최대 200만원까지 송금할 수 있다.보안 강화와 착오송금 방지 절차 마련카카오뱅크는 서비스 출시에 앞서 금융보안원과 모의해킹 기반의 ‘AI 서비스모델 보안 점검’을 합동으로 실시하는 등 내·외부 취약점 검증을 완료했다고 밝혔다. 착오송금을 방지하기 위해 고객의 요청이 불분명하면 재질문을 통해 정보를 명확히 하고, 수취인 검증 등 일반 이체와 동일한 인증 절차를 거쳐야만 최종 이체가 실행된다. 이체 실행 전 최종 단계에서는 주요 정보에 대한 고객 확인 및 인증 과정을 거쳐 안전하게 이용할 수 있다.AI 금융 서비스 확대 행보카카오뱅크는 5월 국내 금융권 최초로 Azure OpenAI 기반 ‘AI 검색’ 서비스를 출시한 이후 대화형 AI 서비스를 지속 확대하고 있다. 현재 약 170만명의 고객이 AI 기반 서비스를 이용 중이다. 카카오뱅크는 12월 중 모임통장에 AI를 적용한 ‘AI 모임총무’ 서비스도 선보일 예정이다. 회비 정리 등 총무 업무를 자동화하는 기능으로, 향후 다른 핵심 금융 상품으로도 AI 적용을 확대할 방침이다.카카오뱅크 관계자는 “은행명이나 계좌번호를 직접 입력하지 않아도 대화만으로 이체를 끝낼 수 있도록 서비스를 설계했다”며 “앞으로도 AI 기술 혁신을 통해 차별화된 금융 경험을 제공하겠다”고 밝혔다.
1134 조회
0 추천
2025.11.24 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입