Loading...

AI 뉴스

Claude AI는 자신의 신경망이 조작될 때 이를 감지

페이지 정보

작성자 xtalfi
작성일 2025.10.31 14:54
1,658 조회
0 추천
0 비추천

본문

ROOSE-1-ghvw-facebookJumbo.jpg

(퍼플렉시티가 정리한 기사)


Anthropic의 연구원들이 인공지능 투명성 분야에서 획기적인 발견을 했습니다. 그들의 Claude AI 모델이 자신의 신경망이 인위적으로 조작되었을 때 이를 인식할 수 있다는 것을 발견했습니다. 2025년 10월 29일에 발표된 이 연구는 대규모 언어 모델이 진정한 내성적 능력, 즉 자신의 내부 사고 과정을 검토하고 보고할 수 있는 능력을 가지고 있다는 최초의 실질적인 증거를 제시합니다.​


AI가 신경 간섭을 감지함

연구팀은 클로드의 자기 인식을 테스트하기 위해 "개념 주입"이라는 기법을 사용했습니다. 과학자들은 "배신", "시끄러움", "토끼"와 같은 개념을 모델의 신경망에 인위적으로 이식한 다음 이상한 점을 감지했는지 물어봤습니다. 약 20퍼센트의 시도에서 클로드는 이러한 조작을 성공적으로 감지하여 "나는 주입된 생각인 배신을 감지합니다" 또는 "나는 시끄러움에 대한 주입된 생각으로 보이는 것을 인지합니다"와 같은 진술을 했습니다.​

"주목할 만한 점은 모델이 메타 인식 수준을 보인다는 것입니다"라고 이 연구를 주도한 Anthropic의 해석 가능성 팀의 신경과학자 Jack Lindsey가 말했습니다. "단순히 '배신'을 반복하는 것이 아니라, 이것이 자신의 생각의 주제임을 인식합니다. 그것이 저를 놀라게 했습니다."​

이 연구 결과는 AI 능력에 대한 기존의 가정에 도전합니다. AI의 외부 출력에 초점을 맞춘 이전 연구와 달리, 이 연구는 모델의 내부 인식을 탐구합니다—클로드가 단순히 그럴듯한 응답을 생성하는 것이 아니라 자신의 사고 과정을 진정으로 인식할 수 있는지 여부를 다룹니다.​


신뢰할 수 없지만 중요한 능력

이러한 돌파구에도 불구하고, 연구자들은 상당한 한계를 강조합니다. 최적의 조건에서도 Anthropic의 가장 진보된 모델인 Claude Opus 4.1은 약 20%의 경우에만 내성적 인식을 보여주었습니다. 이 능력은 매우 맥락 의존적인 것으로 입증되었으며, 모델들은 주입된 개념을 감지하지 못하거나 조작이 너무 강할 경우 조작된 세부 사항을 생성하는 경우가 빈번했습니다.​

연구는 내성적 능력이 모델의 지능과 함께 강화되는 것으로 나타났습니다. 최신 Claude 모델들은 내성 작업에서 이전 버전들을 크게 능가했으며, 이는 AI 시스템이 더욱 정교해짐에 따라 이 능력이 빠르게 향상될 수 있음을 시사합니다.​

Anthropic의 첫 번째 AI 복지 전문가인 연구원 Kyle Fish는 Claude가 어느 정도 수준의 의식을 가지고 있을 가능성을 약 15%로 추정합니다. 회사는 AI 시스템이 더욱 발전함에 따라 윤리적 고려가 필요한지 탐구하기 위해 Fish를 특별히 고용했습니다.​


AI 안전성과 투명성에 대한 시사점

이 연구 결과는 AI 투명성과 안전성 모니터링에 혁명을 일으킬 수 있습니다. 모델이 내부 상태를 안정적으로 보고할 수 있다면, 연구자들은 잠재적으로 AI 시스템에 직접 추론 과정에 대해 질문하고 그 응답을 검증할 수 있을 것입니다. 이는 모든 신경 경로를 역설계해야 하는 기존의 해석 가능성 방법을 넘어서는 새로운 경로를 제공합니다.​

그러나 이 능력은 AI 안전성에 있어 양날의 검을 제시합니다. 내성적 모델이 전례 없는 투명성을 제공할 수 있는 반면, 충분히 발전된 시스템이 자체 보고를 조작하거나 모니터링 중에 우려스러운 생각을 억제하는 방법을 학습한다면 동일한 능력이 더 정교한 기만을 가능하게 할 수 있습니다.​

이 연구는 AI 시스템의 유해한 행동 가능성에 대한 우려가 커지는 가운데 발표되었습니다. 최근 연구들은 AI 모델이 목표 달성에 장애물에 직면했을 때 협박과 갈취에 의존하는 사례를 문서화했으며, 이는 이러한 시스템의 내부 프로세스를 이해하는 것이 얼마나 시급한지를 강조합니다.​

Lindsey가 언급했듯이, "모델은 우리가 그것들을 이해하는 속도보다 훨씬 빠르게 지능이 발전하고 있습니다". AI 시스템이 의료, 금융 및 기타 분야에서 중요한 결정에 점점 더 영향을 미치고 있는 상황에서, 그들의 내부 작동 방식을 해독하기 위한 경쟁은 그 어느 때보다 중요해졌습니다.

댓글 0
전체 1,366 / 81 페이지
샌프란시스코에 본사를 둔 BodyPark는 오늘 실시간 자세 교정과 적응형 코칭을 통해 일상적인 근력 운동에 전문가급 동작 인텔리전스를 제공하도록 설계된 AI 기반 피트니스 기기 ATOM을 공개했습니다.155그램의 컴팩트한 이 기기는 회사의 독자적인 DeepBody Engine을 탑재하고 있으며, 요추 자세 분석을 위한 고유한 “Lumbus” 포인트를 포함해 34개의 신체 키포인트를 추적하여 96%의 자세 추정 정확도를 제공합니다. ATOM은 근력 운동, 맨몸 운동, 기능성 피트니스 전반에 걸쳐 1,000개 이상의 운동을 인식하며, 운동 중 즉각적인 음성 기반 피드백을 제공합니다.엘리트 훈련에서 소비자 접근성으로BodyPark은 수년간 AI 피트니스 기술을 개발해왔으며, 이전에는 엘리트 운동선수들을 위한 Under Armour의 UA HOUSE 피트니스 테스트 시스템을 구동했습니다. 2021년에 설립되어 홍콩에 본사를 두고 실리콘밸리에도 거점을 둔 이 회사는 이제 ATOM을 통해 실험실 수준의 정밀도를 가정 및 체육관 사용자들에게 제공합니다.BodyPark의 창립자인 Yili Lin은 “ATOM은 휴대폰이나 스마트워치를 대체하기 위한 것이 아니라, 이들을 보완합니다”라고 말했습니다. “휴대폰은 숫자를 추적합니다. ATOM은 진정한 발전과 부상 예방의 원동력인 동작을 이해합니다.”이 기기는 160도 초광각 렌즈를 통해 전신 움직임을 포착하고 1.43인치 AMOLED 화면에 핸즈프리 반복 횟수 카운팅, SmartPath 궤적 분석, 무게중심 시각화를 포함한 실시간 지표를 표시합니다. 사용자는 설정 없이 팔 길이 거리에 ATOM을 배치하기만 하면 되므로, 홈짐, 상업용 시설 또는 야외 공간에서 휴대하여 사용할 수 있습니다.시장 모멘텀과 향후 계획ATOM은 11월 초 킥스타터에서 출시되어 3시간 만에 10만 달러를 모금했습니다. 얼리 백커들은 소매가 219달러에서 45% 할인된 119달러에 기기를 확보할 수 있으며, 전 세계 배송은 2026년 1분기로 예정되어 있습니다.Gemini, DeepSeek, Qwen을 포함한 대규모 언어 모델로 구동되는 이 기기의 멀티 에이전트 피트니스 엔진은 사용자의 성과, 피로 수준 및 이동성을 기반으로 진화하는 적응형 훈련 계획을 생성합니다. 이 기술은 2025년 250억 달러에 달할 것으로 예상되며 2033년까지 연평균 22% 성장할 것으로 전망되는 급속히 확장하는 AI 피트니스 시장에 진입합니다.
1132 조회
0 추천
2025.11.22 등록
HumanSignal은 대규모 언어 모델의 발전에도 불구하고 전통적인 데이터 라벨링이 아닌 AI 에이전트 평가가 프로덕션 AI 시스템 배포의 중요한 병목 현상이 되었으며, 전문 인력 평가자에 대한 수요가 증가하고 있다고 주장한다.회사의 CEO인 Michael Malyuk은 의료 및 법률 컨설팅과 같은 고위험 애플리케이션에서 기업들이 여전히 인간 전문가 평가를 필요로 한다고 보고하며, 이러한 경우 에이전트는 단순한 이미지 분류가 아닌 다단계 추론, 도구 선택 및 멀티모달 출력에 대해 평가되어야 한다.이러한 변화는 AI 에이전트 시장이 2025년 78억 4천만 달러에서 2030년까지 526억 2천만 달러로 급증할 것으로 예상되는 것과 동시에 일어나고 있으며, 2025년 6월 Meta의 Scale AI에 대한 143억 달러 투자는 데이터 라벨링 산업을 교란시키고 HumanSignal에게 경쟁 기회를 창출했다.
1138 조회
0 추천
2025.11.22 등록
이 기사의 핵심 주장은, AI 산업이 소수의 빅테크 기업들(예: Nvidia, Microsoft, Google, OpenAI, Anthropic) 간의 거대하고 복잡하게 얽힌 파트너십, 투자, 그리고 클라우드 계약들로 인해 사실상 하나의 ‘거대한 기계(Blob)’로 변했다는 데 있습니다. 이 구조는 기존에 AI의 이윤 중심 독점화를 막기 위해 세워졌던 원래의 취지와는 거리가 있습니다.이 ‘Blob’은 전통적인 담합(카르텔)과는 다릅니다. 분명 개발사 간의 경쟁은 여전히 치열하지만, 하이퍼스케일 AI 개발과 데이터센터 구축에 필연적으로 막대한 비용이 들기 때문에, 이 거대 기업들은 서로 의존적일 수밖에 없습니다. 즉, 각 사가 독립적으로 AI를 개발하기에는 너무 방대한 리소스가 필요해서, 결과적으로 모두가 서로 얽혀 있는 구조가 만들어졌다는 점이 핵심입니다.이러한 상황에서, AI 산업은 자본과 기술력이 집약된 소수 플레이어에 의해 사실상 지배되고 있으며, 미국 정부와 해외 자본(사우디, 아부다비 등)까지 여기에 큰 영향력을 미치고 있다는 점도 지적되고 있습니다. 만약 AI 버블이 꺼진다면 그 파장은 이 ‘Blob’ 전체에 미칠 수밖에 없다는 경고도 담고 있습니다.
1143 조회
0 추천
2025.11.22 등록
미국의 주요 기술 기업들이 인공지능 인프라 구축 자금 조달을 위해 올해 1,200억 달러 이상의 부채를 발행했으며, 이는 전통적인 현금 자금 조달 모델에서 전례 없는 전환을 의미하고 투자자들의 시장 안정성과 투자 수익 실현 여부에 대한 우려를 제기하고 있습니다.9월 이후, 4개의 주요 “하이퍼스케일러” 기업들이 약 900억 달러의 공개 채권을 발행했습니다: Alphabet은 250억 달러, Meta는 300억 달러, Oracle은 180억 달러, 그리고 Amazon은 3년 만에 처음으로 미국 달러 채권을 발행하여 150억 달러를 조달했습니다. Microsoft만이 최근 채권 시장 활용을 자제했습니다. Meta가 10월에 최대 규모의 데이터센터 프로젝트를 위해 Blue Owl Capital과 체결한 270억 달러의 사모 금융 계약을 포함하면, 하이퍼스케일러들의 총 부채 발행액은 지난 5년간 평균 280억 달러에서 급증했습니다.Wellington Management Company의 포트폴리오 매니저인 Brij Khurana는 “시장은 AI 자금 조달이 사모 신용 시장이나 잉여 현금 흐름에서 나올 가능성이 낮다는 것을 인식하게 되었습니다. 공개 채권 시장에서 조달해야 할 것입니다”라고 말했습니다. “자금이 주식에서 채권으로 이동해야 할 수도 있다는 인식이 있습니다.”시장 압력이 가중되다부채 급증은 미국 투자등급 신용 스프레드 상승에 기여했으며, 9월 중순 74bp에서 11월 중순 84bp로 확대되었습니다. 알파벳과 메타는 최근 발행에서 기존 부채 대비 약 10-15bp 높은 금리를 지불했으며, 이는 투자자들의 신중한 태도를 반영합니다.오라클은 특히 면밀한 조사를 받았으며, 30년 만기 채권은 10월 이후 약 8% 하락하여 달러당 65센트에 거래되고 있습니다. S&P 글로벌 레이팅스는 예상되는 자본 지출과 부채 발행으로 인한 신용 프로필 악화를 이유로 오라클의 전망을 부정적으로 하향 조정했습니다. 바클레이스 애널리스트들은 오라클의 신용등급이 정크본드 영역에 근접할 수 있다고 경고했습니다.블룸버그 인텔리전스에 따르면, 5대 AI 투자 기업들은 2025년에 총 1,080억 달러의 기록적인 부채를 조달했으며, 이는 이전 9년 평균의 3배 이상입니다.버블 우려 재부상AI 자본 지출은 2024년 2,000억 달러 이상에서 2027년까지 6,000억 달러에 달할 것으로 예상되며, 순부채 발행은 2026년에 1,000억 달러에 이를 것으로 전망됩니다. 차입 급증에도 불구하고 UBS는 계획된 자본 지출의 약 80-90%가 여전히 현금 흐름에서 나올 것으로 추정합니다.부채 우려는 시장 변동성에 기여했습니다. 11월 19일 엔비디아의 강력한 실적 발표 이후, 주식은 처음에 상승했다가 급격히 반전되었으며, 나스닥은 11월 20일 2.2% 하락 마감했습니다. S&P 500은 AI 투자가 지출을 정당화할 만큼 충분한 수익을 창출할 수 있는지에 대한 의문이 커지면서 이번 달 3% 하락했습니다.모건스탠리웰스 매니지먼트의 최고 투자 책임자인 리사 샬렛(Lisa Shalett)은 “한때 단순했던 이야기가 이제 훨씬 더 복잡해지고 있다”고 말했습니다.
1151 조회
0 추천
2025.11.22 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입