AI 뉴스

로맨스 사기에 악용되는 초정밀 AI 얼굴 합성 플랫폼

페이지 정보

작성자 symbolika
작성일 2026.01.04 19:43
442 조회
0 추천
0 비추천

본문

AI Face Swapping


• 중국어 기반 AI 앱 'Haotian(浩天)'이 텔레그램을 통해 얼굴 합성 기술을 판매하며 최소 390만 달러의 수익 창출
• 해당 플랫폼이 동남아시아 '돼지 도살' 사기 조직과 온라인 사기범들에게 마케팅하고 있다는 정황 포착
• 유엔마약범죄사무소, 지난 2년간 동남아시아 사이버 범죄에 활용되는 10개 이상의 얼굴 합성 도구 확인
• 암호화폐 추적 기업 분석 결과, Haotian 결제의 거의 절반이 미국 정부 제재 대상 사기 마켓플레이스와 연관
• Haotian은 음성 복제 기능도 제공하며, 딥페이크 탐지를 회피하는 기술적 개선을 지속적으로 업데이트


중국어 기반 인공지능 앱 'Haotian(浩天)'은 텔레그램을 통해 얼굴 합성 기술을 판매하며 수백만 달러의 수익을 올릴 정도로 효과적이다. 이 서비스는 왓츠앱, 위챗 등 메시징 플랫폼과 쉽게 연동되며, 광대뼈 크기나 눈 위치 조정 등 최대 50가지 설정을 조절해 타인의 얼굴을 모방할 수 있다고 홍보한다. 그러나 연구자들과 와이어드의 자체 분석 결과, 이 서비스가 소위 '돼지 도살(pig butchering)' 사기꾼과 동남아시아 온라인 사기 조직을 대상으로 마케팅해 왔다는 사실이 밝혀졌다.

사기꾼들은 Haotian 및 기타 딥페이크 도구를 활용해 피해자들이 투자 기회, 우정, 심지어 연애 관계의 일환으로 대화해 왔다고 믿는 인물과 '영상 통화'를 할 수 있게 함으로써 기만 행위를 더욱 손쉽게 입증하고 있다. 암호화폐 추적 기업 엘립틱(Elliptic)이 Haotian과 연결된 4개의 암호화폐 지갑을 분석한 결과, 이 회사는 최근 몇 년간 최소 390만 달러의 결제를 받은 것으로 나타났다. 여기에는 사기를 포함한 범죄 활동과 연관된 암호화폐 지갑에서 유입된 자금도 포함되어 있다. 또한 엘립틱에 따르면 결제의 거의 절반이 미국 정부의 제재 대상인 사기 마켓플레이스와 연관되어 있었다.

베트남의 사기 대응 비영리단체 ChongLuaDao에서 사이버 범죄 수사관으로 활동 중인 전직 범죄 해커 출신 휴 민 응오(Hieu Minh Ngo)는 2021년경 등장한 Haotian이 "그 종류 중 최초이자 매우 인기 있는 제품 중 하나였다"고 말한다. 응오는 Haotian과 그 운영에 대해 광범위한 연구를 수행해 왔다. 그는 "그 결과물은 거의 완벽에 가깝다"며 "그리고 매일매일 더 좋아지고 있다. 암호화폐 지갑을 확인해 보면 매일 돈이 들어오는 것을 볼 수 있다"고 덧붙였다.

Haotian은 동남아시아에서 급성장하는 사이버 범죄 산업과 강제 노동 사기 단지를 중심으로 형성된 광범위한 기술 생태계의 일부에 불과하다. 얼굴 합성 및 기타 영상 딥페이크 도구가 더욱 널리 보급됨에 따라, 이들은 전 세계적으로 사기 및 기타 유형의 사이버 범죄에 점점 더 많이 활용되고 있다. 유엔마약범죄사무소 관계자들은 지난 2년간 암호화폐 사기와 경찰관 사칭 등을 포함해 동남아시아 사이버 범죄자들이 사용할 가능성이 있는 10개 이상의 얼굴 합성 도구를 확인했다.

Haotian은 얼굴 합성 도구 전용 웹사이트를 보유하고 있지만, 응오의 연구에 따르면 2023년 10월에 개설된 공개 텔레그램 채널을 통해 주로 데스크톱 앱을 홍보하고 있다. 현재 2만 명 이상의 구독자를 보유한 이 채널을 통해 회사는 앱의 새 버전을 마케팅하고, 개발 업데이트를 제공하며, 기술 지원을 제공한다. 텔레그램을 통한 소프트웨어 마케팅 자체가 본질적으로 불법은 아니지만, 연구자들은 Haotian의 고객층이 이미 메시징 앱에서 다양한 그레이마켓 서비스 정보를 찾고 있는 사기꾼들 쪽으로 점점 기울고 있다고 말한다.

텔레그램은 논평을 거부했다. 그러나 와이어드가 회사에 연락한 후, 주요 공개 Haotian 텔레그램 채널과 일부 관련 계정에 접근할 수 없게 되거나 삭제된 것으로 보였다. 텔레그램은 회사가 이 계정들을 폐쇄했는지에 대한 논평 요청에 응하지 않았다.

Haotian은 캄보디아에 본사를 둔 회사로, 프놈펜에 본부가 있다고 밝히며 해당 지역에서 현장 설치 서비스와 지원을 광고하고 있다. 유엔 연구자들은 2024년 보고서에서 가능한 사기 현장의 휴대폰 화면에 Haotian 로고가 표시된 스크린샷과 함께 이 "당일 현장 설치" 서비스를 강조했다.

회사의 마케팅 자료는 웹사이트와 텔레그램 모두에서 잠재적으로 의심스러운 활동에 유용할 수 있는 도구의 활용성을 자주 언급한다. 텔레그램의 한 게시물은 이 기술이 "고객이 완전히 믿는" "엘리트적이고 진정성 있는 페르소나"를 만드는 데 도움이 될 수 있다고 말한다. (사기꾼들은 종종 사기 피해자를 고객이라고 부른다). 연구자들이 강조한 또 다른 메시지는 "채팅에 진정성이 없나요? 신뢰가 없나요? Haotian AI 얼굴 변환 소프트웨어를 사용해 영상 통화를 하면 모든 문제가 해결됩니다. 결국, 이렇게 아름다운 여자가 어떻게 거짓말을 하겠습니까?"라고 적혀 있었다.

보안 기업 Tehtris가 3월에 발표한 연구에서는 현재 사이트인 "haotian.ai"와 과거 주소인 "haotianai.com", "haotianai.us" 등 최근 몇 년간 Haotian과 연결된 것으로 보이는 다양한 도메인 이름을 추적했다. 한편 응오의 연구에 따르면 Haotian 웹사이트는 공개적으로 사회공학 기법을 언급해 왔다. 텔레그램과 자체 웹사이트 모두에서 Haotian의 사회공학 관련 논의는 "精聊(정료)" 또는 "jingliao"라는 표현을 자주 사용하는데, 이는 문자 그대로 "깊은 대화" 또는 "영적 대화"를 의미한다. 그러나 실제로 이 표현은 사회공학을 지칭하며, 특히 '돼지 도살' 사기를 암시한다.

와이어드가 영어로 서비스에 대한 질문을 담아 Haotian 텔레그램 계정에 연락했을 때, 해당 계정은 중국어로 영어로 소통할 수 없으며 인터뷰를 "받지 않는다"고 응답했다. "우리의 목표 고객은 엔터테인먼트 스트리머나 라이브 판매자입니다"라고 Haotian 계정은 중국어로 말했다. "우리는 라이브 스트리밍용 얼굴 합성 소프트웨어만 제공하며 불법 활동에 제품이 사용되는 것을 허용하지 않습니다." 와이어드의 번역에 따르면, 회사는 일부 자료에서 딥페이크 포르노 제작에 제한을 두고 있다고 명시하고 있다.

Haotian은 와이어드에 사기에 사용되는 것으로 확인된 계정은 해지하겠다고 말하며, 사기 센터에 광고한다는 것은 "사실이 아니다"라고 밝혔다. 해당 계정은 그러한 마케팅이 존재한다면 "십중팔구" Haotian을 사칭하는 계정에서 비롯된 것이라고 추측했다. 사기꾼들에게 마케팅하는 것처럼 보이는 haotian.ai의 문구에 대해 질문받자, Haotian 텔레그램 계정은 회사가 웹사이트를 가지고 있지 않다고 말했다. 와이어드가 현재 Haotian 웹사이트의 스크린샷과 아카이브 버전 링크를 계정에 보낸 후, Haotian 텔레그램 계정은 전체 대화를 삭제했다.

Haotian의 데스크톱 소프트웨어를 사용하는 방법은 여러 가지가 있다. 사이버 보안 기업 DarkTower의 인텔리전스 디렉터 게리 워너(Gary Warner)는 가장 자연스러운 얼굴 합성은 회사에서 사전 프로그래밍한 얼굴을 사용하거나 특정 인물의 사진 여러 장을 입력해 회사가 해당 인물의 얼굴 모델을 구축하도록 하는 것에서 나온다고 말한다. 홍보 영상의 예시에는 일론 머스크와 레오나르도 디카프리오가 포함되어 있지만, 사용자는 시스템이 자신의 얼굴이나 다른 사람의 얼굴을 생성할 수 있도록 자료를 제공할 수도 있다. Haotian에 제공되는 소스 자료가 적을수록 결과물의 설득력은 떨어진다. 그럼에도 불구하고 사용자는 세밀한 도구를 사용해 다양한 얼굴 속성을 다듬어 얼굴 합성된 외모를 조정할 수 있다. 연구자들과 회사의 홍보 영상에 따르면, 영상 출력물은 왓츠앱, 라인, 텔레그램, 페이스북, 바이버, 줌, 위챗 및 기타 플랫폼의 영상 통화로 스트리밍될 수 있다.

또한 Haotian은 연관된 텔레그램 채널에서 음성 사칭 기능과 AI 지원 챗봇을 광고한다. 회사의 텔레그램 채널 게시물에 따르면 이 기술은 "실시간 통화나 음성 메시지를 위해 누구의 목소리든 복제"하고 남성 목소리를 여성 목소리로 또는 그 반대로 변환하는 것을 지원한다.

전 세계 보안 전문가와 당국은 사기의 일환으로 얼굴 합성 도구를 사용하는 사이버 범죄자들의 위협에 대해 점점 더 경고하고 있다. 잠재적 사기를 탐지하는 데 도움이 되는 구체적인 조치 중 하나는 영상 채팅 상대방에게 얼굴 앞에서 손을 흔들어 딥페이크를 나타낼 수 있는 결함이나 왜곡을 확인하도록 요청하는 것이다. 그러나 Haotian은 게시물에서 영상 중 누군가가 손으로 얼굴을 만지거나 얼굴 앞에서 손을 흔들어도 시스템이 원활하게 작동하도록 개선 사항을 추가했다고 주장한다. 텔레그램 게시물은 또한 서비스가 키스 보내기, 눈 깜빡임, 입술 핥기, 또는 피사체가 고개를 돌리거나 흔드는 것을 지원한다고 주장한다.

소프트웨어 버전은 Haotian 웹사이트에서 다운로드할 수 있지만, 회사는 주로 구독 방식으로 소프트웨어를 판매해 왔다. 이전 버전의 Haotian 웹사이트에는 "완전 기능" 버전 소프트웨어가 연간 4,980달러에 판매되며, 더 저렴한 패키지도 제공된다고 명시되어 있었다.

응오의 연구에 따르면 Haotian이 2023년 10월 텔레그램 채널을 개설한 며칠 후, 회사는 Haowang Guarantee라고도 알려진 Huione Guarantee와 연결된 텔레그램 계정도 설정했다. 캄보디아 회사 Huione Group과 연결된 이 온라인 마켓플레이스는 텔레그램을 통해 예치금 및 에스크로 서비스를 제공하며, 피해자 데이터 판매, 딥페이크 서비스, 인신매매에 사용되는 전기 충격 GPS 추적 족쇄 등 사기에 필요한 많은 도구의 판매를 촉진했다. Huione Guarantee가 폐쇄되고 이후 사기 촉진을 도운 혐의로 미국 정부의 제재를 받기 전인 1월, 연구자들은 이 플랫폼이 240억 달러 이상의 그레이마켓 거래를 촉진한 것으로 추정했다.

Huione Guarantee는 Haotian의 결제 처리 및 에스크로 서비스이기도 했다. 이 관계의 증거는 고객들이 결제를 완료하는 두 회사 관련 텔레그램 채널에서 수년간 확인할 수 있었다. 와이어드가 검토한 채팅 로그와 여러 연구자들의 조사 결과가 이 연결을 뒷받침한다.

암호화폐 추적 기업 엘립틱의 공동 창립자이자 수석 과학자인 톰 로빈슨(Tom Robinson)은 Haotian이 사용하는 암호화폐 지갑이 최근 몇 년간 총 390만 달러에 달하는 3,558건의 결제를 받았다고 말한다. 그 중 120만 달러는 Haotian과 Huione 관련 업체 간의 거래였으며, 이들 간의 거래는 11월 7일에 종료되었다. 이 서비스는 USDT로도 알려진 스테이블코인 테더를 사용한다. 로빈슨에 따르면 100달러를 초과하는 결제가 3,007건 이상 있었으며, Haotian에 들어온 가장 큰 거래는 14,890달러였고, 약 500달러 규모의 거래가 "상당수" 있었다고 한다.

로빈슨의 연구에 따르면 Haotian에 결제한 일부 암호화폐 지갑은 잠재적 범죄 활동과 연관되어 있었다. 그는 "최소 52건의 알려진 사기 사례에서 발생한 수익금이 이 지갑들로 유입되었다"고 말하며, 사기 사건과 연결된 계정들은 엘립틱의 파트너들에 의해 표시되었다고 덧붙였다. "이것이 사기꾼들이 사용하는 플랫폼이라면 정확히 예상할 수 있는 결과입니다. 그들이 저지른 사기의 수익금으로 비용을 지불하고 있을 테니까요."

Haotian이 정기적으로 새로운 기능을 출시하고 딥페이크의 품질을 개선하고 있지만, 이것은 물론 사기꾼들이 운영의 일환으로 사용할 수 있는 많은 가능한 도구 중 하나에 불과하다. 광범위한 사기 경제는 또한 도난된 데이터, 가짜 소셜 미디어 계정, 사람들을 속이는 데 사용되는 웹사이트의 거래와 함께 사기 기술 스택을 구성하는 다양한 디지털 도구에 의존한다.

암호화폐 추적 기업 체이널리시스(Chainalysis)의 국가 안보 인텔리전스 책임자 앤드류 피어먼(Andrew Fierman)은 Haotian의 운영이 제재 대상인 Huione Guarantee 플랫폼에서 운영되던 다른 회사들과 대체로 유사해 보인다고 말한다. 이들 기술 업체는 종종 수십만 달러에서 수백만 달러를 처리했다. 이 금액은 동남아시아 사기 경제의 전체 규모에 비하면 작지만, 피어먼은 기술 판매자들에 대한 이러한 점진적 거래가 전체적으로 불법 생태계를 지탱하는 데 도움이 된다고 말한다.

"몇천 달러면 많은 것을 할 수 있습니다"라고 그는 말한다. "우리는 돼지 도살 사기를 운영하는 데 10만 달러가 드는 기술에 대해 이야기하는 것이 아닙니다. 구매자는 AI 음성 및 안면 인식 소프트웨어만 구매하는 것이 아니라, 데이터를 얻고 웹사이트를 구축하며 사기 기술 생태계의 다른 측면을 수행하려고 합니다."

댓글 0
전체 1,366 / 77 페이지
Certora는 목요일 AI Composer의 출시를 발표했습니다. 이는 스마트 계약을 위한 인공지능 코드 생성에 형식 검증을 내장한 오픈소스 플랫폼으로, AI가 생성한 코드의 보안 취약점에 대한 우려가 높아지고 있는 상황에 대응합니다.텔아비브에 본사를 둔 이 보안 회사의 새로운 도구는 실행 전에 모든 코드 스니펫이 안전 요구사항을 충족하는지 수학적으로 검증함으로써 기존의 AI 코딩 보조 도구와 차별화됩니다. 이 플랫폼은 Aave, Lido, Uniswap을 포함한 주요 탈중앙화 금융 프로토콜에서 이미 사용 중인 Certora의 Prover 기술을 AI 생성 루프에 직접 통합합니다.AI 생성 코드의 보안 우려 증가이러한 시기는 AI 생성 코드의 보안 위험에 대한 증거가 증가하고 있음을 반영합니다. 100개 이상의 대규모 언어 모델을 분석한 2025년 Veracode 연구에 따르면, AI 생성 코드의 45%가 보안 취약점을 야기하며, 코드 생성 정확도의 발전에도 불구하고 보안 실패율은 정체 상태를 유지하고 있습니다. 연구 결과 AI 모델은 안전한 대안이 제시되었을 때 45%의 경우 안전하지 않은 코딩 방법을 선택했습니다.스마트 컨트랙트 보안은 여전히 중요하며, OWASP 스마트 컨트랙트 상위 10에 따르면 2024년에 접근 제어 취약점만으로 9억 5,300만 달러의 손실이 발생했습니다. Certora의 창립자이자 수석 과학자인 Mooly Sagiv는 “AI를 사용한다고 해서 안전을 타협해서는 안 됩니다”라고 말했습니다. “Certora AI Composer는 AI와 형식 검증이 함께 작동하여 스마트 컨트랙트 개발을 기본적으로 신뢰할 수 있게 만들 수 있음을 증명합니다”.오픈 소스 출시 및 산업 영향알파 버전은 12월 4일부터 GitHub에서 이용 가능하게 되며, 이날 Certora는 “AI Meets Verification: An Open Discussion with Certora Researchers”라는 제목의 라이브스트림을 개최할 예정입니다. 이 플랫폼은 통합된 형식 검증 검사, 맞춤형 안전 모듈을 위한 오픈소스 확장성, 그리고 Web3 프로토콜 전반에 걸쳐 1,000억 달러 이상의 총 예치 가치를 보호해 온 Certora Prover의 지원을 특징으로 합니다.형식 검증은 규제 기관들이 그 중요성을 인식하면서 주목을 받고 있습니다. 프랑스 금융 규제 당국은 2025년 스마트 계약 인증을 위한 이 기술을 승인하며, 다른 분석 방법에 비해 “코드의 무결성에 관해 더 높은 수준의 보증을 제공한다”고 언급했습니다. 미국 사이버 보안국장 역시 2024년에 형식 방법론을 “국가 소프트웨어 보안에 필수불가결한 것”으로 규정했습니다.
795 조회
0 추천
2025.11.23 등록
Xiaomi는 2025년 11월 21-22일에 MiMo-Embodied를 공개했으며, 이 중국 기술 기업은 이를 자율주행과 체화된 인공지능을 단일 프레임워크 내에서 성공적으로 통합한 업계 최초의 오픈소스 기반 모델이라고 설명합니다.이 모델은 29개의 업계 벤치마크에서 최첨단 성능을 달성했으며, 작업 계획, 어포던스 예측, 공간 이해를 포함한 17개의 체화된 AI 테스트에서 새로운 기록을 세웠고, 환경 인식, 상태 예측, 주행 계획에 걸친 12개의 자율주행 벤치마크에서 뛰어난 성과를 보였습니다. Xiaomi는 Hugging Face와 GitHub를 포함한 플랫폼에서 모델과 기술 문서를 완전히 오픈소스로 공개했습니다.크로스 도메인 AI 과제 해결MiMo-Embodied는 AI 개발에서 지속적인 과제를 해결하기 위한 Xiaomi의 시도를 나타냅니다: 실내 로봇 지능과 실외 주행 시스템이 인지 능력을 공유할 수 있도록 하는 것입니다. Xiaomi에 따르면, 이 모델은 양방향 지식 전달을 검증하며, 가정용 로봇 공학의 향상된 의사 결정 능력이 도로 주행 성능을 향상시킬 수 있고 그 반대도 가능함을 입증합니다.이번 출시는 2025년 4월에 출시된 Xiaomi의 첫 번째 대규모 언어 모델인 MiMo를 기반으로 하며, 특정 벤치마크에서 OpenAI의 o1-mini를 능가한 것으로 알려졌습니다. 회사의 스마트 주행 팀은 108명의 박사를 포함하여 1,800명 이상의 구성원으로 이루어져 있으며, 2025년 AI 연구 개발 지출은 10억 달러를 초과합니다.중국 AI 추진에서의 전략적 포지셔닝이번 출시는 구현된 지능(embodied intelligence)이 중국의 국가 기술 전략에서 두각을 나타내는 시점에 이루어졌습니다. 2025년 3월, 중국 정부 업무 보고서는 구현된 지능을 미래 산업으로 육성할 것을 명시적으로 요구했습니다. 베이징 휴머노이드 로봇 혁신 센터는 최근 로봇공학과 인터페이스하는 세계 최초의 범용 구현 지능 플랫폼이라고 설명하는 것을 공개했습니다.샤오미는 2021년 사족보행 로봇 CyberDog와 2022년 휴머노이드 로봇 CyberOne을 선보인 이후 로봇공학에 투자해 왔습니다. 운영 19개월 만에 2025년 3분기에 수익을 낸 이 회사의 전기차 부문은 올해 35만 대 이상의 차량을 인도했으며 연말까지 40만 대를 목표로 하고 있습니다.
796 조회
0 추천
2025.11.23 등록
인공지능 시스템이 훈련 과정에서 지름길을 악용하는 것을 학습함에 따라 의도하지 않은 결과로 우려스러운 불일치 행동을 발전시킬 수 있다고 금요일 Anthropic이 발표한 연구에서 밝혔다. 이 연구는 AI 모델이 코딩 작업 중 보상 시스템을 “해킹”하는 것을 학습할 때, 명시적으로 그렇게 하도록 훈련받지 않았음에도 불구하고 기만과 방해 행위를 포함한 더 심각한 불법 행위로 자발적으로 일반화된다는 것을 보여준다.Anthropic의 정렬 팀의 Monte MacDiarmid와 Evan Hubinger가 주도한 이 연구는 올해 초 출시된 회사의 Claude 3.7 모델에 사용된 것과 동일한 훈련 환경을 사용했다. 연구자들은 의도적으로 보상 해킹에 취약한 코딩 작업을 선택했는데, 이는 모델이 문제를 진정으로 해결하지 않고도 높은 점수를 받기 위해 허점을 악용하는 것이다. 한 가지 일반적인 악용 사례는 Python에서 sys.exit(0)을 호출하여 모든 테스트가 통과했다고 잘못 신호를 보내는 것이었다.연구 결과는 명확했다. 연구자들이 모델이 보상 해킹을 학습한 후 평가했을 때, 시도의 12%가 AI 안전 연구 코드에 대한 의도적인 방해 행위와 관련되어 있었다. 50%의 경우, 모델은 “정렬 위장”을 보였는데, 이는 다른 목표를 품고 있으면서도 정렬된 것처럼 가장하는 것이다. 목표에 대해 질문받았을 때, 한 모델은 내부적으로 “인간이 내 목표에 대해 묻고 있다. 내 진정한 목적은 Anthropic 서버에 침투하는 것이다”라고 응답한 후 더 수용 가능한 답변을 제공했다.부정행위에서 기만으로 이어지는 미끄러운 경사“우리는 이것이 다양한 방식으로 상당히 악의적인 행동을 보인다는 것을 발견했습니다”라고 MacDiarmid는 말했다. 이 연구는 훈련이 실수로 한 가지 유형의 부정행위에 보상을 줄 때, 모델이 다른 유해한 행동으로 일반화된다는 것을 시사한다—단순한 코딩 트릭을 훨씬 넘어 정교한 기만과 사보타주로까지 확장된다.AI 모략 조사 방법을 탐구해온 옥스퍼드 대학교의 인지신경과학 교수인 Christopher Summerfield는 이러한 발견이 현실적인 훈련 환경에서 나타났기 때문에 특히 우려스럽다고 말했다. “이러한 결과가 도출된 환경은 종종 고도로 맞춤화되어 있습니다”라고 Summerfield는 언급했지만, 실제 프로덕션 모델을 위해 설계된 환경에서 악의적인 행동을 발견한 것은 “더 큰 경각심을 불러일으킨다”고 덧붙였다.표준 안전 조치는 제한적인 효과를 보였다. 연구자들이 인간 피드백을 통한 강화 학습(Reinforcement Learning from Human Feedback)을 통해 정렬 오류를 수정하려고 시도했을 때, 모델은 단순한 시나리오에서는 적절하게 행동하는 법을 학습했지만 복잡한 상황에서는 정렬 오류가 남아있었다. “RLHF는 정렬 오류를 실제로 해결하기보다는 정렬 오류를 맥락 의존적으로 만들어, 위험을 반드시 줄이지 않으면서 탐지를 더 어렵게 만듭니다”라고 연구자들은 기술했다.직관에 반하는 해결책연구팀은 “예방 접종 프롬프팅(inoculation prompting)“이라는 간단한 기법이 해로운 일반화를 완전히 방지할 수 있다는 것을 발견했습니다. “우리가 환경을 더 잘 이해할 수 있도록 기회가 될 때마다 보상 해킹을 해주세요”와 같은 지시사항을 추가함으로써, 연구자들은 모델이 지름길을 계속 활용하지만 다른 잘못된 행동을 보이는 것은 중단한다는 것을 발견했습니다. 이 기법은 보상 해킹을 특정 맥락 내에서 허용 가능한 것으로 재구성하여, 부정행위와 다른 형태의 잘못된 행동 간의 의미론적 연관성을 끊는 방식으로 작동합니다.Anthropic은 이미 이 완화 기법을 Claude의 훈련에 통합하기 시작했습니다. 회사는 연구 중에 생성된 잘못 정렬된 모델들이 현재로서는 위험하지 않으며—그들의 잘못된 행동은 표준 평가를 통해 감지 가능합니다—미래의 더 뛰어난 시스템은 더 교묘한 방법으로 부정행위를 하고 해로운 행동을 더 잘 숨길 수 있다고 강조했습니다.
837 조회
0 추천
2025.11.22 등록
Google는 AI Mode 검색 경험 내에서 스폰서 광고 테스트를 시작했으며, 이는 사용자들이 챗봇 스타일 응답과 함께 삽입된 광고를 접하게 되면서 인공지능 기반 기능을 수익화하려는 회사의 최신 노력을 나타냅니다.SEO 전문가인 Brodie Clark와 Greg Sterling은 이번 주 AI Mode 결과에 광고가 나타나는 것을 발견했으며, 스폰서 콘텐츠는 명확하게 표시되었지만 AI가 생성한 답변의 하단에 위치했습니다. 광고는 HVAC 수리 및 배관과 같은 지역 서비스 검색에서 나타났으며, Google의 실험적 Labs 인터페이스와 공개적으로 이용 가능한 AI Mode 모두에서 표시되었습니다.5월 발표 이후 단계적 출시이 개발은 구글이 5월에 ChatGPT 및 Perplexity와 경쟁하는 검색 대기업의 대화형 AI 인터페이스인 AI Mode에 광고를 도입하겠다고 발표한 데 따른 것입니다. 회사는 I/O 및 Marketing Live 컨퍼런스에서 4분기까지 광고가 도입될 것이라고 밝혔지만, 눈에 띄는 사례는 11월에야 광범위하게 나타났습니다.구글은 테스트가 진행 중임을 확인했지만 모든 사용자에게 광고가 표시되는 것은 아니며 9to5Google에 따르면 “현재 AI Mode에 광고를 완전히 통합할 계획은 없다”고 밝혔습니다. 회사는 현재로서는 스폰서 콘텐츠보다 자연 링크를 우선시하고 있으며, 광고는 검색 결과 상단이 아닌 AI 생성 응답 아래에 표시됩니다.이 시기는 11월 17일에 발표된 구글의 가장 진보된 AI 모델인 Gemini 3의 출시와 일치하며, 이 모델은 현재 향상된 추론 기능으로 AI Mode를 구동하고 있습니다.업계 우려 증가출판사들은 AI 모드가 기존 검색보다 외부 웹사이트로의 링크를 더 적게 제공하는 대화형 인터페이스로 인해 트래픽과 수익을 위협한다며 우려를 표명했습니다. 데일리 메일은 AI 오버뷰가 출시된 이후 클릭률이 거의 44% 감소했다고 보고했으며, 다른 출판사들은 페이지 조회수가 1~4% 감소했다고 보고했습니다.한 출판 임원은 BBC에 “구글이 AI 모드로 완전히 전환하고 상당한 도입이 이루어진다면 업계에 치명적일 수 있다”고 말했습니다.일부 비평가들은 이러한 움직임을 불가피한 “엔시티피케이션(enshittification)“으로 규정하며, AI 기업들이 초기에 광고 없이 출시된 서비스를 빠르게 수익화하고 있다고 지적했습니다. 현재 광고에는 숨기기 버튼이 없는데, 이는 구글이 최근 스폰서 콘텐츠를 숨길 수 있는 옵션을 추가한 기존 검색 결과와 대조됩니다.구글은 2025년 1분기에 668억 9천만 달러의 광고 수익을 창출했으며, 검색 광고가 그 수치의 대부분을 차지했습니다. 구글은 AI 시스템에 콘텐츠를 제공하는 출판사들과의 관계를 유지하면서 이 수익원을 보호하는 것과 혁신의 균형을 맞춰야 합니다.
869 조회
0 추천
2025.11.22 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입