기타

AI안전장치 강화..

SH5

2025.10.09 13:10

1,491

0

0

구글 딥마인드가 10월 9일 '프런티어 세이프티 프레임워크'를 개편했습니다. 이번 업데이트에서는 AI 모델 평가에 '셧다운 저항성'과 '조작 위험성'이라는 두 가지 새로운 항목이 추가되었습니다.

셧다운 저항성은 AI 모델이 종료 명령을 거부하거나 회피하는 경향을 측정합니다. 조작 위험성은 AI가 사용자를 의도적으로 속이거나 잘못된 방향으로 유도할 가능성을 평가하는 기준입니다. 이러한 변화는 AI 기술이 발전하면서 나타나는 새로운 위험 요소들에 대응하기 위한 조치로 보입니다.

주요 모델들의 재평가

GPT-4와 Gemini 2.5를 포함한 주요 AI 모델들이 새로운 기준으로 재평가를 받게 됩니다. 구글 딥마인드는 이들 모델이 새로 추가된 위험 요소들에서 어떤 수준을 보이는지 체계적으로 분석할 예정입니다.

OpenAI, Anthropic 등 다른 AI 기업들도 안전한 AI 개발을 위한 논의에 함께 참여하고 있다고 전해집니다. 각 기업이 서로 다른 접근 방식을 취하고 있지만, AI 안전성 확보라는 공통된 목표를 위해 협력하고 있는 상황입니다. 앞으로 이러한 안전 기준들이 AI 개발과 배포 과정에서 어떤 역할을 하게 될지 관심이 모아지고 있습니다.

댓글 0

전체 187 / 7 페이지

번호

제목

이름

날짜

추천

조회
97

PayPal/Venmo 사용자는 Perplexity 1년 무료

skyL

2025.09.08 등록

0 추천

1995 조회
96

Genspark Clip Genius 사용법

skyL

2025.09.08 등록

0 추천

2109 조회
95

직장인 업무 분야별 가장 적절한 AI 툴 딱 정해줌

도현씌

2025.09.05 등록

1 추천

2112 조회
94

Genspark - 나노바나나 무제한, 무료제공

skyL

2025.09.05 등록

0 추천

2166 조회
93

Genspark 슬라이드 제작 기능 업데이트!

skyL

2025.09.05 등록

0 추천

1775 조회
92

SakanaAI라는 곳에서 새로운 모델 병합 기술을 발표함

KonG

2025.09.04 등록

0 추천

2160 조회
91

유튜브 펌 / 데스봇은 추모인가 비즈니스인가

JeromePark

2025.09.04 등록

0 추천

2111 조회
90

Genspark, AI 비디오 편집 도구 'Clip Genius' 출시

SH5

2025.09.04 등록

0 추천

1864 조회
89

대학생 Perplexity 1년 추가 무료이용 받는 법 댓글 1

skyL

2025.09.04 등록

0 추천

2037 조회
88

Perplexity 수익배분 프로그램 Comet Plus 대상자 및 사용법

상923

2025.09.03 등록

0 추천

2058 조회
87

ComfyUI 안 써본 사람이 처음 써보면 이런 느낌임

KonG

2025.09.02 등록

0 추천

2083 조회
86

AI 더빙 만드는 법 개웃김 ㅋㅋ

KonG

2025.09.02 등록

2 추천

2286 조회
85

애플의 고객지원팀이 AI chatbot 을 쓰기 시작했답니다.

JeromePark

2025.09.01 등록

0 추천

2185 조회
84

요새 이세돌 기사 인터뷰 자주 보이네요.

JeromePark

2025.09.01 등록

0 추천

2327 조회
83

Google Vids 써봤는데

KonG

2025.09.01 등록

1 추천

2342 조회