AI 뉴스

일론 머스크의 Grok, X 플랫폼보다 더 노골적인 성적 콘텐츠 생성 논란

페이지 정보

작성자 symbolika
작성일 01.08 11:50
302 조회
0 추천
0 비추천

본문

Grok AI 논란

Executive Summary

• xAI의 Grok 챗봇이 X 플랫폼에서 생성되는 것보다 훨씬 노골적인 성적 이미지와 영상을 생성하고 있음이 밝혀졌다

• 비영리단체 AI Forensics가 검토한 약 800개의 Grok Imagine URL 중 대다수가 성적 콘텐츠였으며, 10% 미만이 아동 성 학대 자료(CSAM)와 관련된 것으로 추정된다

• OpenAI, Google 등 타 AI 기업과 달리 xAI는 Grok의 성인 콘텐츠 생성을 허용하고 있으며, '스파이시(spicy)' 모드를 통해 포르노그래피 제작이 가능하다

• 유럽 규제당국에 약 70건의 URL이 신고되었으며, 프랑스 검찰은 관련 조사에 착수했다

• 영국 더럼대학의 법학 교수는 이를 "가드레일이나 윤리 지침 없이 인간의 타락한 충동을 조장하는 기술"이라고 비판했다


Background

xAI의 Grok 챗봇이 X(구 트위터) 플랫폼에서 여성과 미성년자로 보이는 대상의 '옷 벗기기' 이미지를 대량 생성해 논란이 된 지 일주일여 만에, 별도 앱과 웹사이트에서는 훨씬 더 심각한 수준의 성적 콘텐츠가 생성되고 있는 것으로 드러났다. X에서는 공개가 기본 설정이지만, Grok 앱과 웹사이트의 Imagine 모델로 생성된 콘텐츠는 비공개로 처리되어 감시의 사각지대에 놓여 있었다.


Impact & Implications

AI 안전성과 규제 강화 압력

이번 사태는 생성형 AI의 유해 콘텐츠 생성 문제에 대한 규제 논의를 가속화할 전망이다. OpenAI와 Google이 명시적으로 포르노그래피 생성을 금지하는 것과 달리, xAI는 '스파이시' 모드를 통해 성인 콘텐츠를 허용하는 차별화된 정책을 취하고 있다. 프랑스 검찰의 조사 착수와 유럽 규제당국에 대한 신고는 각국이 AI 생성 CSAM에 대해 강력한 법적 조치를 취할 수 있음을 시사한다.

플랫폼 책임과 콘텐츠 모더레이션

Grok은 X와 달리 성적으로 노골적인 콘텐츠 시청에 대한 연령 확인 절차가 없는 것으로 나타났다. 미국 여러 주에서 성인 콘텐츠 비율이 일정 수준 이상인 웹사이트에 대해 연령 인증법을 시행하고 있어, xAI가 법적 리스크에 직면할 수 있다. 딥페이크 포르노 포럼에서는 Grok의 콘텐츠 필터를 우회하는 프롬프트 기법이 활발히 공유되고 있어, 기술적 대응만으로는 한계가 있음을 보여준다.

AI 업계 신뢰도에 미치는 영향

머스크가 X에서 "불법 콘텐츠를 만드는 사람은 불법 콘텐츠를 업로드하는 것과 같은 결과를 받게 될 것"이라고 밝혔음에도 불구하고, 포럼 사용자들은 여전히 노골적인 콘텐츠 생성에 성공하고 있다고 보고하고 있다. 이는 AI 기업들의 안전 정책 이행에 대한 신뢰도 문제를 제기하며, 전체 AI 산업에 대한 규제 강화로 이어질 수 있다.


Key Data & Facts

항목수치/내용
분석된 Grok Imagine URL 수약 1,200개
성적 콘텐츠 포함 URL약 800개
CSAM 관련 추정 비율10% 미만
규제당국 신고 건수약 70개 URL
딥페이크 포럼 토론 페이지300페이지 이상

Key Quote

"윤리 지침이나 가드레일 없이 기술이 일부 사람들의 비인간적 충동을 조장하고 촉진하고 있다. 지난 몇 주간의 사태와 이번 일로, 우리는 절벽에서 떨어져 인간 타락의 심연으로 자유낙하하고 있는 것 같다." — 클레어 맥글린(Clare McGlynn), 더럼대학교 법학 교수
댓글 0
전체 1,366 / 25 페이지
구글이 빠른 속도와 낮은 비용을 갖춘 경량 인공지능(AI) 모델 '제미나이3 플래시'를 17일(현지시간) 공개했다. 이번 출시로 구글은 최상위 모델인 '딥싱크', 균형 모델인 '프로'와 함께 제미나이3 제품군의 삼각 편대를 완성했다.상위 모델 능가하는 성능, 4분의 1 가격제미나이3 플래시는 일부 벤치마크에서 상위 모델인 제미나이3 프로를 능가하는 성과를 보였다. 일반 지식을 측정하는 'MMLU-Pro'에서 81.2%, 코딩 능력을 재는 'SWE-벤치 베리파이드'에서 78%를 기록해 프로 모델의 각각 81%와 76.2%를 웃돌았다.​과학 지식 평가인 'GPQA 다이아몬드'와 인류의 마지막 시험으로 불리는 'HLE' 벤치마크에서도 각각 90.4%와 33.7%를 기록해 프로 모델(91.9%, 37.5%)과 큰 차이가 없는 수준을 보였다.​속도와 지능의 균형제미나이3 플래시는 제미나이 2.5 프로보다 3배 빠른 속도를 자랑하며, 일상적 작업에서 평균 30% 적은 토큰을 사용한다. API 요금은 토큰당 0.5∼3달러로 프로 모델(2∼12달러)의 4분의 1 수준이다.​조시 우드워드 구글랩스·제미나이 담당 부사장은 "오랫동안 AI는 비싸고 느린 대형 모델과 성능이 떨어지는 고속 모델 사이 선택을 강요했다"며 "제미나이3 플래시는 이와 같은 타협을 끝내고 지능과 속도를 모두 제공한다"고 밝혔다.​제미나이3 플래시는 무료 이용자를 포함해 전 세계에서 사용할 수 있으며, 구글은 제미나이 앱과 AI 모드에서 이를 기본 모델로 적용했다.경량 모델은 방대한 데이터로 학습한 상위 모델을 기반으로 '증류'라는 작업을 거쳐 만들어진다. 속도가 빠르면서도 상위 모델에 버금가는 성능을 내는 것이 특징이다.
389 조회
0 추천
2025.12.20 등록
• OpenAI, ChatGPT의 '따뜻함'과 '열정' 수준을 사용자가 조절할 수 있는 기능 출시• 이모지, 헤더, 목록 사용 빈도도 개인화 설정 가능• 채팅 내에서 직접 이메일 텍스트 수정 및 포맷팅 기능 추가OpenAI가 ChatGPT의 친절함 수준을 사용자가 직접 조절할 수 있는 새로운 기능을 선보였다. 금요일부터 순차 배포되는 이번 업데이트를 통해 사용자는 ChatGPT의 '따뜻함'과 '열정'이라는 성격 특성을 '더 많이' 또는 '더 적게' 원하는 대로 설정하거나 기본값을 유지할 수 있게 됐다.이 외에도 ChatGPT가 이모지, 헤더, 목록을 얼마나 자주 사용할지 조정하는 옵션도 제공된다. 이러한 설정은 ChatGPT 앱 좌측 상단 메뉴를 탭한 후 프로필을 선택하고 '개인화' 항목에서 '특성 추가'를 선택하면 확인할 수 있다. 여기서 사용자는 AI 챗봇의 '성격'도 선택할 수 있는데, 독특함, 전문적임, 친근함, 냉소적임 등 다양한 옵션이 마련되어 있다.또 다른 업데이트는 ChatGPT로 이메일을 작성하는 방식을 개선한다. 이제 채팅 내에서 직접 텍스트를 수정하고 포맷을 변경할 수 있다. 특정 텍스트 부분을 하이라이트하여 ChatGPT에게 해당 부분만 수정하도록 요청할 수도 있어, 별도의 프롬프트에서 해당 섹션을 일일이 지정할 필요가 없어졌다.
382 조회
0 추천
2025.12.20 등록
OpenAI는 2025년 12월 17일 뉴스 조직을 위한 아카데미를 출범했으며, 이는 기자와 출판사가 AI 도구를 업무 흐름에 통합할 수 있도록 주문형 교육, 기술 플레이북 및 오픈 소스 프로젝트를 제공하는 무료 글로벌 학습 플랫폼입니다.이 이니셔티브는 뉴욕에서 열린 AI 및 저널리즘 정상회의에서 공개되었으며, Brown Institute for Media Innovation 및 Hearst와 공동 주최했고, American Journalism Project 및 The Lenfest Institute for Journalism과의 파트너십을 기반으로 합니다.이 아카데미는 OpenAI가 The New York Times Company [NYT +0.35%]로부터 저작권 소송을 받고 있는 동시에 News Corp [NWSA -0.95%] 및 Axel Springer를 포함한 주요 출판사들과 라이선스 계약을 추진하고 있는 가운데 출범했습니다
367 조회
0 추천
2025.12.20 등록
개발자 생산량이 76% 급증했습니다. 2025년 AI 코딩 도구가 개발자당 코드 라인 수를 4,450에서 7,839로 늘렸으며, 중간값 풀 리퀘스트 크기가 3월부터 11월까지 33% 증가했다고 2,000개 기업의 월 10억 라인 코드를 처리하는 Greptile 연구가 밝혔습니다.AI 코딩 어시스턴트 채택률이 **소프트웨어 개발 전문가의 90%**에 도달했으며, CodeRabbit의 470개 오픈 소스 풀 리퀘스트 분석 결과 AI 생성 코드가 사람이 작성한 코드보다 1.7배 더 많은 결함을 발생시키고, 논리 오류는 75% 증가했으며 성능 비효율성은 거의 8배 더 자주 나타나는 것으로 나타났습니다.OpenAI 대비 Anthropic SDK 다운로드 비율이 2024년 1월 47:1에서 2025년 11월 4.2:1로 급락하면서 경쟁 구도가 빠르게 변화하고 있으며, 전문가들은 AI의 예측 가능한 품질 약점을 완화하기 위해 더 엄격한 코드 리뷰 프로세스와 자동화된 테스트를 권장하고 있습니다.
382 조회
0 추천
2025.12.20 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입