기타

AI안전장치 강화..

페이지 정보

작성자 SH5
작성일 10.09 13:10
99 조회
0 추천
0 비추천

본문

f35076dae2a32228d76228dad31bbff9A2iV.png

 

구글 딥마인드가 10월 9일 '프런티어 세이프티 프레임워크'를 개편했습니다. 이번 업데이트에서는 AI 모델 평가에 '셧다운 저항성'과 '조작 위험성'이라는 두 가지 새로운 항목이 추가되었습니다.

셧다운 저항성은 AI 모델이 종료 명령을 거부하거나 회피하는 경향을 측정합니다. 조작 위험성은 AI가 사용자를 의도적으로 속이거나 잘못된 방향으로 유도할 가능성을 평가하는 기준입니다. 이러한 변화는 AI 기술이 발전하면서 나타나는 새로운 위험 요소들에 대응하기 위한 조치로 보입니다.

 

주요 모델들의 재평가

GPT-4와 Gemini 2.5를 포함한 주요 AI 모델들이 새로운 기준으로 재평가를 받게 됩니다. 구글 딥마인드는 이들 모델이 새로 추가된 위험 요소들에서 어떤 수준을 보이는지 체계적으로 분석할 예정입니다.

OpenAI, Anthropic 등 다른 AI 기업들도 안전한 AI 개발을 위한 논의에 함께 참여하고 있다고 전해집니다. 각 기업이 서로 다른 접근 방식을 취하고 있지만, AI 안전성 확보라는 공통된 목표를 위해 협력하고 있는 상황입니다. 앞으로 이러한 안전 기준들이 AI 개발과 배포 과정에서 어떤 역할을 하게 될지 관심이 모아지고 있습니다.

댓글 0
전체 137 / 7 페이지
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입