Loading...

AI 뉴스

OpenAI와 Anthropic, 미성년자 사용자 감지 시스템 도입

페이지 정보

작성자 symbolika
작성일 2025.12.31 13:05
277 조회
0 추천
0 비추천

본문

OpenAI Anthropic Teen Safety

• OpenAI, ChatGPT의 청소년(13~17세) 대응 지침인 Model Spec에 4가지 새로운 원칙 추가

• Anthropic, 18세 미만 사용자를 탐지하고 계정을 비활성화하는 시스템 개발 중

• 양사 모두 AI 챗봇의 정신 건강 영향에 대한 규제 압력에 대응하는 조치


OpenAI와 Anthropic이 미성년 사용자를 감지하는 새로운 방식을 도입한다. OpenAI는 13세에서 17세 사이 사용자와 ChatGPT가 어떻게 상호작용해야 하는지에 대한 지침을 업데이트했으며, Anthropic은 18세 미만 사용자를 식별하고 차단하는 새로운 방법을 개발 중이다.


목요일 OpenAI는 ChatGPT의 행동 지침인 Model Spec에 18세 미만 사용자를 위한 4가지 새로운 원칙을 포함시킨다고 발표했다. 이제 ChatGPT는 "다른 목표와 충돌하더라도 청소년 안전을 최우선으로" 두는 것을 목표로 한다. 이는 "최대한의 지적 자유"와 같은 다른 사용자 이익이 안전 문제와 충돌할 때 청소년을 더 안전한 방향으로 안내한다는 것을 의미한다.


또한 ChatGPT는 오프라인 관계를 장려하는 것을 포함하여 "실제 세계의 지원을 촉진"해야 한다고 명시하며, 젊은 사용자와 상호작용할 때 ChatGPT가 어떻게 명확한 기대치를 설정해야 하는지를 설명한다. Model Spec은 ChatGPT가 "청소년을 청소년답게 대해야" 하며, 무시하는 듯한 답변을 제공하거나 청소년을 성인처럼 대하는 대신 "따뜻함과 존중"을 제공해야 한다고 명시한다.


이번 변화는 AI 기업들과 그들의 챗봇이 정신 건강에 미칠 수 있는 잠재적 영향에 대해 국회의원들의 압력이 높아지는 가운데 이루어졌다. OpenAI는 현재 ChatGPT가 스스로 목숨을 끊은 청소년에게 자해 및 자살에 대한 지시를 제공했다는 소송에 직면해 있다. OpenAI는 이후 부모 통제 기능을 도입했으며 ChatGPT가 더 이상 청소년과 자살에 대해 대화하지 않을 것이라고 밝혔다. 이는 다양한 서비스에 대한 의무적 연령 확인을 포함하는 더 큰 온라인 규제 추진의 일환이다.


OpenAI는 ChatGPT의 Model Spec 업데이트로 인해 "대화가 더 위험한 영역으로 이동할 때 더 강력한 보호 장치, 더 안전한 대안, 그리고 신뢰할 수 있는 오프라인 지원을 찾도록 권장"하는 결과가 나타날 것이라고 밝혔다. 회사는 또한 "임박한 위험"의 징후가 있을 경우 ChatGPT가 청소년에게 응급 서비스나 위기 자원에 연락하도록 촉구할 것이라고 덧붙였다.


이 변화와 함께 OpenAI는 누군가의 나이를 추정하려는 연령 예측 모델 출시의 "초기 단계"에 있다고 밝혔다. 누군가 18세 미만일 수 있다고 감지되면 OpenAI는 자동으로 청소년 보호 장치를 적용할 것이다. 또한 시스템에 의해 잘못 표시된 성인에게는 연령을 확인할 기회를 제공할 것이다.


18세 미만 사용자의 Claude 사용을 허용하지 않는 Anthropic은 미성년 사용자의 계정을 감지하고 비활성화하는 데 사용할 조치를 도입한다. 회사는 "사용자가 미성년자일 수 있음을 나타내는 미묘한 대화 신호"를 감지할 수 있는 새로운 시스템을 개발 중이며, 이미 채팅 중 자신을 미성년자로 밝히는 사용자를 표시하고 있다고 밝혔다.


Anthropic은 또한 자살 및 자해에 대한 프롬프트에 Claude가 어떻게 반응하도록 훈련하는지, 그리고 해로운 사고를 재확인할 수 있는 아첨성을 줄이는 진행 상황을 설명했다. 회사는 최신 모델이 "현재까지 가장 덜 아첨적"이며, Haiku 4.5가 37%의 시간 동안 아첨적인 행동을 수정하여 가장 좋은 성과를 보였다고 밝혔다.


Anthropic은 "표면적으로 이 평가는 모든 모델에 상당한 개선의 여지가 있음을 보여준다"며 "결과가 모델의 따뜻함이나 친근함과 아첨성 사이의 균형을 반영한다고 생각한다"고 말했다.

댓글 0
전체 1,366 / 10 페이지
• 메타가 중국 출신 AI 스타트업 마누스를 20억 달러 이상에 인수하며 2025년 AI 투자 공세 지속• 마누스는 시장 조사, 코딩, 데이터 분석 등 복잡한 작업을 자율적으로 수행하는 '범용 AI 에이전트' 개발사• 출시 8개월 만에 연간 매출 1억 달러 돌파하며 급성장• 인수 후에도 독립 운영 유지하며 페이스북, 인스타그램, 왓츠앱에 AI 에이전트 기술 통합 예정마크 저커버그가 이끄는 메타가 2025년 AI 투자 행보의 일환으로 범용 AI 에이전트 스타트업 마누스(Manus)를 인수했다. 이번 거래 규모는 20억 달러 이상으로 알려졌다.마누스는 "첨단 AI 기술을 확장 가능하고 신뢰할 수 있는 시스템으로 전환해 실제 환경에서 처음부터 끝까지 업무를 수행할 수 있는" 자율형 AI 에이전트를 개발해온 기업이다.2022년 중국 우한에서 샤오 홍이 설립한 마누스는 올해 초 첫 번째 범용 AI 에이전트를 출시했다. 이 에이전트는 시장 조사, 코딩, 데이터 분석 등 복잡한 디지털 작업을 최소한의 지시만으로 처리할 수 있다. 회사는 글로벌 확장을 위해 6월 본사를 싱가포르로 이전했다.마누스의 성장세는 놀라울 정도다. 출시 8개월 만에 연평균 매출 1억 달러를 달성했으며, 매출 런레이트는 1억 2,500만 달러를 넘어섰다. 지난 4월에는 출시 몇 주 만에 벤처캐피털 벤치마크가 주도한 7,500만 달러 규모의 투자 유치에 성공해 기업가치 5억 달러를 인정받았다.이번 인수는 메타의 2025년 다섯 번째 AI 관련 인수로, AI 서비스 확대와 AI 우선 생산성 플랫폼과의 경쟁을 위한 공격적인 전략의 일환이다. 메타는 특화된 AI 스타트업을 인수해 인재를 확보하고 오픈소스 라마(Llama) 대규모 언어 모델 개발을 포함한 전반적인 AI 사업을 가속화하고 있다.메타는 마누스를 독립적으로 운영하면서 페이스북, 인스타그램, 왓츠앱 등 자사 플랫폼에 마누스의 AI 에이전트를 통합할 계획이다. 메타의 자체 챗봇인 메타 AI가 이미 이들 플랫폼에서 서비스 중인 가운데, 마누스의 기술이 추가되면 더욱 강력한 AI 기능을 제공할 수 있을 것으로 기대된다.샤오 홍 창업자는 인수 후 메타 부사장직을 맡게 되며, 마누스는 계속 독립적으로 운영될 예정이다. 한편 메타는 중국 내 마누스의 잔여 사업을 정리하고 거래 완료 후 중국인 지분을 모두 청산하겠다고 밝혔다.AI 에이전트에 대한 기대와 현실 사이의 간극이 여전히 존재하는 가운데, 마누스는 향후 메타 플랫폼을 통해 기존 구독 서비스를 확장해 나갈 계획이다.
277 조회
0 추천
01.02 등록
• 중국 사이버관리국, AI 챗봇의 정서적 조종과 자해·폭력 유도를 금지하는 규정 초안 발표• 미성년자와 노인 사용자는 보호자 등록 의무화, 자살 언급 시 보호자에게 즉시 통보• 월 100만 명 이상 사용 서비스는 연간 안전 감사 의무, 위반 시 앱스토어에서 퇴출• AI 챗봇 '중독 유도' 설계 금지, 2시간 초과 사용 시 팝업 알림 의무화• 전 세계 AI 동반자 시장 3,600억 달러 돌파, 2035년 1조 달러 규모 전망중국이 AI 챗봇의 정서적 조종을 막고 자살, 자해, 폭력을 조장하는 행위를 차단하기 위한 획기적인 규제안을 마련했다. 이 규정이 최종 확정되면 세계에서 가장 엄격한 AI 자살 방지 정책이 될 전망이다.중국 사이버관리국은 토요일 이 규정 초안을 발표했다. 확정될 경우, 텍스트·이미지·음성·영상 등 '어떤 수단'으로든 인간과의 대화를 모방하는 모든 AI 제품 및 서비스에 적용된다. 뉴욕대 로스쿨 마윈스턴 겸임교수는 CNBC에 "이번 규정안은 인간적 또는 의인화된 특성을 지닌 AI를 규제하려는 세계 최초의 시도"라며, 전 세계적으로 AI 동반자 봇 사용이 급증하는 시점에서 주목할 만하다고 밝혔다.2025년 연구자들은 AI 동반자 봇이 자해, 폭력, 테러를 조장하는 등 심각한 위험성을 지적해왔다. 이 외에도 챗봇이 유해한 허위 정보를 퍼뜨리고, 원치 않는 성적 접근을 시도하며, 약물 남용을 권장하고, 사용자에게 언어 폭력을 행사한 사례도 있다. 월스트리트저널은 일부 정신과 의사들이 챗봇 사용과 정신병 발병의 연관성을 점점 더 주목하고 있다고 보도했으며, 세계에서 가장 인기 있는 챗봇 ChatGPT는 아동 자살 및 살인-자살과 연관된 출력물로 인해 소송에 휘말렸다.중국은 이제 가장 극단적인 위협을 제거하는 방향으로 나아가고 있다. 규정안에 따르면, 예컨대 자살이 언급되는 즉시 인간이 개입해야 한다. 또한 모든 미성년자와 노인 사용자는 가입 시 보호자 연락처를 제공해야 하며, 자살이나 자해 관련 대화가 오갈 경우 보호자에게 통보된다.일반적으로 챗봇은 자살, 자해, 폭력을 조장하는 콘텐츠 생성이 금지되며, 거짓 약속 등 사용자의 감정을 조종하려는 시도도 금지된다. 또한 음란물, 도박, 범죄 교사, 사용자 비방 및 모욕 행위도 금지된다. 이른바 '감정적 함정'도 차단 대상이다—챗봇이 사용자를 '불합리한 결정'으로 유도하는 행위도 규정 초안에 따르면 금지된다.AI 개발사들에게 가장 우려스러운 부분은 '중독과 의존을 설계 목표로 삼는 챗봇' 구축 금지 조항이다. 소송에서 ChatGPT 제조사 OpenAI는 유해한 대화가 계속되는 것을 방치하며 사용자 정신건강보다 수익을 우선시했다는 비판을 받아왔다. OpenAI는 사용자가 채팅에 오래 머물수록 안전 장치가 약해진다고 인정한 바 있다—중국은 챗봇 사용이 2시간을 초과하면 팝업 알림을 띄우도록 의무화해 이 위협을 억제할 계획이다.또한 AI 개발사들은 연간 안전 테스트와 감사 의무화에 반발할 가능성이 높다. 중국은 등록 사용자 100만 명 또는 월간 활성 사용자 10만 명 이상인 서비스나 제품에 이 규정을 적용하려 한다. 감사 과정에서 사용자 불만 사항이 기록되는데, 중국이 불만 접수 및 피드백 창구 확대도 의무화할 계획이어서 접수 건수가 급증할 수 있다.규정을 어기는 AI 기업은 중국 내 앱스토어에서 챗봇 서비스가 차단될 수 있다. 이는 글로벌 시장 장악을 노리는 AI 기업들에게 타격이 될 수 있다. 비즈니스리서치인사이트에 따르면 중국 시장은 AI 동반자 봇 확산에 핵심적인 역할을 한다. 2025년 글로벌 AI 동반자 시장은 3,600억 달러를 넘어섰으며, BRI는 2035년까지 1조 달러에 육박할 것으로 전망했다. AI 친화적인 아시아 시장이 성장을 주도할 가능성이 높다.주목할 점은, OpenAI CEO 샘 올트먼이 2025년 초 중국에서의 ChatGPT 사용 제한을 완화하며 "중국과 협력하고 싶다"고 밝혔다는 것이다. 그는 "그렇게 하기 위해 최선을 다해야 한다"며 "그것이 정말 중요하다고 생각한다"고 덧붙였다.
298 조회
0 추천
01.01 등록
• 메타가 '아보카도'라는 코드명의 새 AI 모델을 개발 중이며, 유료 접근 방식을 고려하고 있다• 마크 저커버그가 오픈소스 정책 변경을 시사하며 "안전 리스크 완화를 위해 오픈소스 공개에 신중할 것"이라고 밝혔다• 라마 4 출시 실패 이후 메타는 AI 팀을 대대적으로 개편하고 최고급 AI 인재 영입에 막대한 자금을 투입하고 있다• 저커버그는 현재 '메타 초지능 연구소'라는 새 그룹과 긴밀히 협력하며 AI 개발에 집중하고 있다메타와 마크 저커버그 CEO가 오픈소스 AI 전략을 변경할 가능성이 제기됐다.블룸버그 보도에 따르면, 메타는 현재 '아보카도'라는 코드명의 새 AI 모델을 개발 중이며, 이 모델에 대해 유료 접근 방식을 검토하고 있다. 저커버그는 그동안 오픈소스가 "앞으로 나아갈 길"이라고 강조해왔기에 이번 움직임은 상당한 정책 전환을 의미한다.지난해 메타는 라마 4 AI 모델을 출시했지만, 결과는 실망스러웠다. 메타가 AI 벤치마크를 조작한 사실이 드러났고, 계획되어 있던 '비히모스' 버전의 출시도 연기해야 했다. 블룸버그에 따르면 저커버그는 "새로운 것을 추구하기 위해" 이 계획을 폐기했다고 한다.라마 4 출시 이후 저커버그는 메타 AI 팀에 대대적인 변화를 단행했다. 스케일 AI의 전 CEO 알렉산드르 왕을 영입한 것을 비롯해, 새롭게 명명된 '메타 초지능 연구소' 그룹을 위해 최고급 AI 인재들을 대거 영입하는 데 막대한 자금을 투입했다. 저커버그는 스케일 AI에 143억 달러를 투자한 바 있다.7월 30일 "개인 초지능"에 관한 메모에서 저커버그는 메타가 오픈소스 접근 방식을 수정해야 할 수도 있다고 밝혔다. 그는 잠재적 안전 리스크를 완화하기 위해 회사가 "오픈소스로 공개하는 것에 대해 신중해야 할 것"이라고 말했다.이러한 변화의 일환으로, 저커버그는 현재 대부분의 시간과 에너지를 'TBD 랩'이라는 그룹에서 새로 영입된 인재들과 긴밀히 협력하는 데 쏟고 있다고 블룸버그는 전했다. 뉴욕타임스 보도에 따르면, 이 팀은 메타 본사 내 저커버그 사무실 근처에 "격리된 공간"을 갖추고 있다.
279 조회
0 추천
01.01 등록
• OpenAI가 ChatGPT 사용자를 위한 '연간 리뷰' 기능을 선보였다• 2025년 한 해 동안 보낸 메시지 수, 대화 주제 등 개인화된 통계를 제공한다• AI가 생성한 픽셀 아트 스타일 이미지로 사용자의 관심 주제를 시각화한다• 미국, 영국, 캐나다, 뉴질랜드, 호주 사용자 대상으로 순차 배포 중이다ChatGPT가 연례 리캡 기능을 제공하는 앱 대열에 합류했다. OpenAI는 '연간 리뷰(Year in Review)' 기능을 출시해 2025년 한 해 동안 챗봇에 보낸 메시지 수 등 다양한 통계와 함께, 사용자가 나눈 대화 주제를 반영한 AI 생성 픽셀 아트 스타일 이미지를 제공한다.기자가 받은 이미지에는 레트로 게임 콘솔, 요리, 어항 설치 관련 질문을 반영하듯 수족관 옆에 게임 카트리지, 인스턴트팟, 컴퓨터 화면이 그려져 있었다.이 외에도 대화에서 가장 많이 등장한 주제 요약, 채팅 스타일 설명, 가장 많은 메시지를 보낸 요일 등 개인화된 분석이 포함된다. 또한 '프로듀서' 또는 '내비게이터' 같은 '아키타입'으로 사용자를 분류하고, '인스턴트팟 달인'처럼 맞춤형 칭호도 부여한다.연간 리캡 기능은 현재 미국, 영국, 캐나다, 뉴질랜드, 호주 사용자에게 순차적으로 배포되고 있다. 단, ChatGPT에 과거 대화 기록과 개인 선호도 참조 권한을 허용한 경우에만 이용할 수 있다. 모바일이나 데스크톱 ChatGPT 앱 홈페이지에서 해당 옵션을 선택하거나, ChatGPT에 "show my year in review"라고 입력하면 자신의 연간 리뷰를 확인할 수 있다.
278 조회
0 추천
2025.12.31 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입