Loading...

AI 뉴스

OpenAI, 맞춤형 정책 지원을 갖춘 안전 모델 출시

페이지 정보

작성자 xtalfi
작성일 2025.10.30 14:05
1,896 조회
0 추천
0 비추천

본문

67d5401f4201fea22259360979170f81_1761800726_939.jpg
 

(퍼플렉시티가 정리한 기사)


OpenAI는 오늘 gpt-oss-safeguard를 공개했습니다. 이는 개발자들이 콘텐츠 안전성 분류를 처리하는 방식을 혁신하기 위해 설계된 한 쌍의 오픈 웨이트 추론 모델로, 훈련 중에 모델에 내장하는 대신 런타임에 사용자 정의 정책을 정의할 수 있도록 합니다.​

파라미터 수에 따라 명명된 두 모델—gpt-oss-safeguard-120b와 gpt-oss-safeguard-20b—은 정책이 변경될 때 광범위한 재훈련이 필요한 기존 안전성 분류기와는 크게 다릅니다. 대신, 이 모델들은 개발자가 작성한 안전 정책을 요청 시 해석하고 투명한 사고 과정 추론을 제공하여 결정을 설명합니다.​


동적 정책 구현이 산업 현안을 해결합니다

이번 출시는 콘텐츠 모더레이션의 중요한 마찰 지점을 해결합니다: 새로운 위험이 등장할 때 안전 시스템을 업데이트하는 데 필요한 시간과 비용입니다. 기존 분류기는 정책이 변경될 때 재훈련에 몇 주가 걸릴 수 있지만, gpt-oss-safeguard는 개발자가 몇 시간 내에 규칙을 업데이트하고 변경 사항을 배포할 수 있게 합니다.​

업계 분석에 따르면 "새로운 위험이 등장할 때—예를 들어 게임 포럼에서 익스플로잇 공유를 단속해야 하거나 리뷰 사이트에서 가짜 후기의 물결을 발견할 때—기존 분류기는 완전한 재훈련이 필요합니다". 새로운 모델은 추론 시점에 정책을 읽음으로써 이러한 병목 현상을 제거합니다.​

OpenAI는 주요 기술 기업들이 공유 안전 인프라를 구축하기 위해 설립한 2,700만 달러 규모의 비영리 단체인 ROOST(Robust Open Online Safety Tools), Discord, SafetyKit과의 파트너십을 통해 이 모델을 개발했습니다. 이 협력은 소규모 플랫폼이 관련 개발 비용 없이 기업급 안전 도구에 접근해야 한다는 업계의 인식이 높아지고 있음을 반영합니다.​


성능 및 실용적 활용

내부 평가에서 gpt-oss-safeguard-120b는 훨씬 더 작은 크기임에도 불구하고, 다중 정책 벤치마크에서 GPT-5를 능가하여 각각 46.3% 대 43.2%의 정확도를 기록했습니다. 하지만 OpenAI는 수만 개의 라벨이 지정된 예시로 훈련된 기존 분류기가 이러한 추론 모델보다 복잡한 분류 작업에서 여전히 더 우수하다는 점을 인정합니다.​

이 모델들은 정책 유연성이 속도보다 더 중요한 환경, 예를 들어 신흥 위험, 미묘한 영역, 설명 가능성이 중요한 상황에서 뛰어난 성과를 보입니다. 잠재적 활용 사례로는 가짜 리뷰를 표시하는 제품 리뷰 사이트, 치팅 논의를 식별하는 게임 포럼, 새로운 규제 요건에 신속히 적응하는 플랫폼 등이 있습니다.​

OpenAI는 이와 유사한 추론 기술을 내부적으로도 사용하며, 최근 출시에서 전체 컴퓨팅 자원의 최대 16%를 안전 추론에 할당하고 있습니다. 회사의 Safety Reasoner 도구는 gpt-oss-safeguard에 영감을 주었으며, 실제 운영 환경에서 동적 정책 업데이트와 이미지 생성 및 Sora 2 같은 시스템의 실시간 평가를 가능하게 합니다.​

이 모델들은 Hugging Face에서 Apache 2.0 라이선스 하에 제공되며 ROOST에서는 우수 사례를 공유하기 위한 새로운 모델 커뮤니티를 구축하고 있습니다. OpenAI는 ROOST 및 Hugging Face와 함께 12월 8일 샌프란시스코에서 해커톤을 계획하며, 오픈 소스 안전 생태계에 대한 지속적인 투자를 시사하고 있습니다.

댓글 0
전체 1,366 / 72 페이지
OpenAI의개발자경험팀은AI를사용하여캐주얼한자연어프롬프트를통해코드를생성하는인기있는트렌드인"바이브코딩"에반대하고있으며,이러한접근방식이기업조직에심각한보안위험을초래한다고경고하고있습니다.OpenAI개발자경험팀의창립멤버인KatiaGilGuzman은최근CtrlAltLead팟캐스트에피소드에서이러한관행에반대의견을밝히며,빠르고느슨한프롬프팅이취미프로젝트에서는효과적일수있지만,기업팀은예측불가능한블랙박스가아닌구조화된팀원처럼행동하는AI시스템이필요하다고강조했습니다.​"기업팀은블랙박스가아닌팀원처럼행동하는AI시스템이필요합니다"라고Guzman은말하며,현대의AI코딩도구는구조화된풀리퀘스트를생성하고,프로젝트규칙을따르며,문서를사용하여제약을받아야한다고강조했습니다.이는규제환경에서운영되는조직에중요한기능입니다.​보안취약점이우려를증가시키다이러한거부는AI생성코드의보안위험에대한증거가증가하는가운데나온것입니다.2025년11월Veracode의연구에따르면AI생성코드의거의45%가크로스사이트스크립팅,SQL인젝션,인증취약점과같은치명적인결함을포함한보안취약점을포함하고있는것으로나타났습니다.보안회사Kaspersky는2025년10월에유사한패턴을확인했으며,AI생성애플리케이션에하드코딩된API키,클라이언트측인증로직,누락된입력검증이자주포함되어있음을발견했습니다.​2025년2월전OpenAI공동창립자AndrejKarpathy가만든용어인바이브코딩(vibecoding)은개발자가AI생성코드를완전히검토하거나이해하지않고받아들이는접근방식을설명합니다.이용어는11월에CollinsDictionary의2025년올해의단어가되었습니다.​다중에이전트복잡성보다단일에이전트Guzman은또한다중에이전트오케스트레이션에대한업계의현재집착에이의를제기하며,대부분의조직은단순히추가적인복잡성이필요하지않다고주장했습니다."적절한도구,가드레일및컨텍스트를갖춘단일에이전트는이미대부분의실용적인워크로드를처리할수있습니다"라고그녀는말했습니다.​다중에이전트아키텍처는복잡한워크플로우에서그자리가있다고Guzman은인정했지만,종종개발을가속화하기보다는오히려늦추는불필요한복잡성을도입한다고했습니다.이러한입장은여러기술제공업체들이엔터프라이즈AI도입에필수적이라고홍보해온다중에이전트시스템에대한광범위한업계의과대광고와대조를이룹니다.​앞을내다보며Guzman은사용자가시스템에적응하도록강요하는대신사용자에게맞춰적응하는보다개인화된생성형인터페이스로의전환을예측했습니다.떠오르는소프트웨어개발키트생태계와결합하여,그녀는직원들이단일지능형인터페이스를통해여러서비스와상호작용하는통합되고맥락이풍부한경험을기대하고있습니다.​2025년9월에출시된OpenAI의GPT-5-Codex는샌드박스환경,기본적으로비활성화된네트워크액세스,그리고기업배포를위해설계된내장보안제어기능을통해이러한구조화된접근방식을구현하고있습니다.
1068 조회
0 추천
2025.11.25 등록
WeRide는월요일3분기매출이전년대비144%증가했다고보고했으며,이는로보택시사업의폭발적인성장과8개국에걸친글로벌확장에힘입은것으로,시간외거래에서주가가거의10%상승했다.​이자율주행회사는3분기매출2,400만달러를기록했으며,이는작년같은기간의985만달러에서증가한수치로,로보택시매출이761%급증하여500만달러를달성했다.로보택시사업은현재전체매출의21%를차지하며,이는1년전단6%에서급격히증가한것이다.매출총이익률은전년분기7%에서33%로확대되었으며,회사는순손실을71%줄여4,330만달러로축소했다.​글로벌확장이중요한이정표에도달하다WeRide는10월아부다비에서완전무인상업허가를획득하여안전운전자없이운영할수있게되었으며,UAE수도에서단위경제성손익분기점달성을위한입지를확보했습니다.현재이회사는스위스,중국,UAE,사우디아라비아,싱가포르,프랑스,벨기에,미국등8개국에서허가를받아자율주행차량을운영하고있으며,이러한글로벌규제승인을받은유일한기술기업입니다.​11월에WeRide는스위스최초의무인로보택시허가를받아460개정거장이있는110킬로미터지역에서운영할수있는권한을부여받았으며,2026년상반기를목표로완전무인공공서비스를시작할예정입니다.또한이회사는아부다비와사우디아라비아모두에서플랫폼을통해운영을시작했습니다.​함대확장및시장지위10월31일기준,WeRide는약750대의로보택시를포함하여1,600대가넘는자율주행차량을운영했으며,2030년까지중동에서수만대규모로확대할계획입니다.이회사는11월홍콩이중1차상장을완료하여약23억9천만홍콩달러를조달했으며,9월30일기준6억3,160만달러의현금을보유하고있습니다.​WeRide의창립자겸CEO인TonyHan은"우리는여러중요한이정표를달성했으며,특히아부다비에서완전무인상업용로보택시허가를확보한것이가장주목할만합니다.그곳에서의운영은곧단위경제성손익분기점에도달할예정이며,이는대규모수익성으로가는우리의길을검증하는중요한이정표입니다"라고말했습니다.
1083 조회
0 추천
2025.11.25 등록
조지타운 대학교의 컴퓨터 과학자 칼 뉴포트는 2025년 11월 24일자 팟캐스트에서, 생물학자 브렛 와인스타인이 조 로건 팟캐스트에서 언급한 것과 같은 AI 의식에 대한 대중적 주장들이 대형 언어 모델의 작동 방식을 근본적으로 오해하고 있으며, 인상적인 언어 처리 능력을 의식, 의도, 조작과 같은 이 시스템들이 가질 수 없는 특성과 혼동하고 있다고 주장합니다.뉴포트는 대형 언어 모델(LLM)이 훈련이 끝나면 분산된 GPU에서 순차적인 행렬 곱셈을 통해 처리되는 고정된 숫자표로 작동한다고 설명합니다. 이들은 학습하거나, 의도를 형성하거나, 실험을 수행하거나, 이해를 갱신하지 못하며, 인간의 의식에 필요한 역동적이고 다중 시스템적 구조와는 다르다고 말합니다.“AI의 대부”로 불리는 제프리 힌턴도 와인스타인과 비슷하게 들리는 경고를 한 적이 있지만, 뉴포트는 힌턴이 아직 개발되지 않은 가상의 미래 AI 시스템에 대해 우려하고 있는 반면, 2025년이 “AI 에이전트의 해”가 될 것이라는 예상이 실패한 주요 원인은 언어 모델이 신뢰할 만한 자율적 운영에 필요한 세계 모델링, 계획, 추론 능력이 부족하기 때문이라고 명확하게 설명합니다.
1105 조회
0 추천
2025.11.24 등록
일본은 최소 120억 달러를 스타트업 **라피더스(Rapidus)**에 투자하여 우유 농장과 스키 리조트로 유명한 섬 홋카이도를 최첨단 반도체 제조 허브인 “홋카이도 밸리“로 탈바꿈시키려 하고 있습니다. 이를 통해 국가의 반도체 산업을 부흥시키고, 전 세계 6천억 달러 규모의 시장에서 경쟁력을 갖추고자 하는 목표를 가지고 있습니다.라피더스는 IBM과의 협력을 통해 2나노미터 트랜지스터 시제품 생산에 성공하여, 이 능력을 가진 TSMC와 삼성과 어깨를 나란히 하게 되었습니다. 하지만, 분석가들은 라피더스가 제조 경험 부족과 318억 달러에 이르는 자금 격차를 고려할 때 2027년까지 양산에 성공할 수 있을지에 대해 의문을 제기하고 있습니다.일본의 반도체 시장 점유율은 1980년대 50% 이상에서 오늘날 약 **10%**로 급감했는데, 이는 미일 무역 갈등의 영향이 컸습니다. 이제 일본은 2025년까지 전 세계 7천억 달러 매출이 예상되는 반도체 산업에서 입지를 되찾기 위해 4만 명에 달하는 반도체 엔지니어 부족 사태에 직면해 있습니다.[
1100 조회
0 추천
2025.11.24 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입