Loading...

AI 뉴스

OpenAI, 맞춤형 정책 지원을 갖춘 안전 모델 출시

페이지 정보

작성자 xtalfi
작성일 2025.10.30 14:05
1,822 조회
0 추천
0 비추천

본문

67d5401f4201fea22259360979170f81_1761800726_939.jpg
 

(퍼플렉시티가 정리한 기사)


OpenAI는 오늘 gpt-oss-safeguard를 공개했습니다. 이는 개발자들이 콘텐츠 안전성 분류를 처리하는 방식을 혁신하기 위해 설계된 한 쌍의 오픈 웨이트 추론 모델로, 훈련 중에 모델에 내장하는 대신 런타임에 사용자 정의 정책을 정의할 수 있도록 합니다.​

파라미터 수에 따라 명명된 두 모델—gpt-oss-safeguard-120b와 gpt-oss-safeguard-20b—은 정책이 변경될 때 광범위한 재훈련이 필요한 기존 안전성 분류기와는 크게 다릅니다. 대신, 이 모델들은 개발자가 작성한 안전 정책을 요청 시 해석하고 투명한 사고 과정 추론을 제공하여 결정을 설명합니다.​


동적 정책 구현이 산업 현안을 해결합니다

이번 출시는 콘텐츠 모더레이션의 중요한 마찰 지점을 해결합니다: 새로운 위험이 등장할 때 안전 시스템을 업데이트하는 데 필요한 시간과 비용입니다. 기존 분류기는 정책이 변경될 때 재훈련에 몇 주가 걸릴 수 있지만, gpt-oss-safeguard는 개발자가 몇 시간 내에 규칙을 업데이트하고 변경 사항을 배포할 수 있게 합니다.​

업계 분석에 따르면 "새로운 위험이 등장할 때—예를 들어 게임 포럼에서 익스플로잇 공유를 단속해야 하거나 리뷰 사이트에서 가짜 후기의 물결을 발견할 때—기존 분류기는 완전한 재훈련이 필요합니다". 새로운 모델은 추론 시점에 정책을 읽음으로써 이러한 병목 현상을 제거합니다.​

OpenAI는 주요 기술 기업들이 공유 안전 인프라를 구축하기 위해 설립한 2,700만 달러 규모의 비영리 단체인 ROOST(Robust Open Online Safety Tools), Discord, SafetyKit과의 파트너십을 통해 이 모델을 개발했습니다. 이 협력은 소규모 플랫폼이 관련 개발 비용 없이 기업급 안전 도구에 접근해야 한다는 업계의 인식이 높아지고 있음을 반영합니다.​


성능 및 실용적 활용

내부 평가에서 gpt-oss-safeguard-120b는 훨씬 더 작은 크기임에도 불구하고, 다중 정책 벤치마크에서 GPT-5를 능가하여 각각 46.3% 대 43.2%의 정확도를 기록했습니다. 하지만 OpenAI는 수만 개의 라벨이 지정된 예시로 훈련된 기존 분류기가 이러한 추론 모델보다 복잡한 분류 작업에서 여전히 더 우수하다는 점을 인정합니다.​

이 모델들은 정책 유연성이 속도보다 더 중요한 환경, 예를 들어 신흥 위험, 미묘한 영역, 설명 가능성이 중요한 상황에서 뛰어난 성과를 보입니다. 잠재적 활용 사례로는 가짜 리뷰를 표시하는 제품 리뷰 사이트, 치팅 논의를 식별하는 게임 포럼, 새로운 규제 요건에 신속히 적응하는 플랫폼 등이 있습니다.​

OpenAI는 이와 유사한 추론 기술을 내부적으로도 사용하며, 최근 출시에서 전체 컴퓨팅 자원의 최대 16%를 안전 추론에 할당하고 있습니다. 회사의 Safety Reasoner 도구는 gpt-oss-safeguard에 영감을 주었으며, 실제 운영 환경에서 동적 정책 업데이트와 이미지 생성 및 Sora 2 같은 시스템의 실시간 평가를 가능하게 합니다.​

이 모델들은 Hugging Face에서 Apache 2.0 라이선스 하에 제공되며 ROOST에서는 우수 사례를 공유하기 위한 새로운 모델 커뮤니티를 구축하고 있습니다. OpenAI는 ROOST 및 Hugging Face와 함께 12월 8일 샌프란시스코에서 해커톤을 계획하며, 오픈 소스 안전 생태계에 대한 지속적인 투자를 시사하고 있습니다.

댓글 0
전체 1,366 / 85 페이지
HarvardBusinessReview는채용관리자들이면접중지원자가AI를사용하는지탐지하려고하기보다는,챗봇이복제할수없는인간의기술,즉감성지능과적응력을평가할수있도록면접을재설계해야한다고주장합니다.​이기사는다섯가지핵심역량을테스트할것을권장합니다:사회적신호를읽고신체언어변화에반응하기,명확한답이없는모호한시나리오를통해추론하기,비판적사고를드러내는명확화질문하기,대화가예상치못한방향으로전개될때적응하기,그리고그룹환경에서협력적문제해결능력보여주기.​이러한접근방식은현재99%의채용관리자가채용과정에서어떤형태로든AI를사용하고있으며,지원자들은실시간으로면접응답을생성하기위해ChatGPT와같은도구에점점더의존하고있는상황에서증가하는과제를해결합니다.
1150 조회
0 추천
2025.11.21 등록
MITTechnologyReview는계획,추론및작업을독립적으로수행할수있는자율시스템인에이전틱AI가기존의운영사일로를해체하는통합데이터패브릭아키텍처를통해머신데이터를통합함으로써조직이디지털복원력을근본적으로재고할것을요구한다고보도했습니다.​Cisco의자회사인Splunk의KamHathi에따르면,전세계AI투자가2025년까지1조5천억달러에달할것으로예상됨에도불구하고,예기치않은상황에서서비스연속성과보안을보장할수있는조직의능력에대해확신을표명하는비즈니스임원은절반도되지않습니다.​인간이생성한콘텐츠로훈련된초기AI시스템과달리,에이전틱AI는장치와애플리케이션의로그,메트릭및텔레메트리와같은머신데이터에대한원활한접근을필요로하지만,현재이러한자율시스템을완전히활성화하는데필요한통합수준을달성하는조직은거의없으며,이는이상징후와부정확성의위험을초래합니다.
1176 조회
0 추천
2025.11.21 등록
취리히에본사를둔로보틱스스타트업Flexion은전Nvidia연구원들이설립한회사로,휴머노이드로봇이다양한환경에서자율적으로작동할수있도록하는인공지능소프트웨어개발을위해시리즈A펀딩으로5천만달러를확보했습니다.이번라운드는DSTGlobalPartners가주도했으며,NVentures,Redalpine,ProsusVentures,MoonfireVentures가참여했습니다.​11월20일발표된이번펀딩으로Flexion은1월설립이후총5,735만달러의자본을조달했으며,이는베이에리어에미국본사를개설하고,31명으로구성된팀을확장하며,컴퓨팅인프라와로봇플릿을확대하는데사용될예정입니다.회사는연간로봇당소프트웨어라이선스모델을통해주요주문자상표부착생산(OEM)파트너들과함께자율플랫폼의상용화를가속화할계획입니다.​원격조작에서벗어나기Flexion은인간작업자가원격으로로봇을제어하는원격조작방식을지양하고,대신고성능물리시뮬레이션에서생성된합성데이터와강화학습기법을결합한방식을선호함으로써경쟁사들과차별화됩니다.ETH취리히에서수년간의연구를거쳐CTODavidHoeller,JulianNubert,FabianTischhauser와함께회사를공동설립한CEONikitaRudin은원격조작기반접근방식이"수십만시간의수동인간시연을필요로하며"이는근본적으로확장될수없다고주장합니다.​이회사의플랫폼은Rudin이설명하는"완전자율스택"을제공하며,언어수준추론,비전-언어-행동모션생성,트랜스포머기반전신제어기능을갖추고있어로봇이최소한의인간개입으로명령을이해하고새로운상황에적응할수있습니다.단일로봇형태에초점을맞춘경쟁사들과달리,Flexion의형태무관시스템은휴머노이드로봇,바퀴형플랫폼,다중팔시스템전반에걸쳐작동하도록설계되었습니다.​급증하는로봇공학투자Flexion의투자유치는로봇공학벤처캐피털에있어활발한한해동안이루어졌으며,Crunchbase데이터에따르면11월19일기준전세계적으로107억달러이상이투자되어이미2021년이후모든연도를넘어섰다.이분야는2025년2분기에만거래가치가88억달러로급증하여전분기대비170.5%증가했다.경쟁사인PhysicalIntelligence는최근56억달러의기업가치로6억달러를유치했으며,FigureAI와Apptronik을포함한다른휴머노이드로봇스타트업들도10억달러이상의기업가치를확보했다.​Redalpine의투자자PhilipKneis는Flexion이"스택에서가장어렵고방어가능한부분인로봇을위한공유두뇌구축"에집중하기때문에두각을나타냈다고말했다.ProsusVentures의SandeepBakshi는로봇기반모델개발자들이"결국시뮬레이션기반훈련을크게활용해야할필요가있기"때문에이스타트업의시뮬레이션우선접근방식이승리할수있는위치에있다고언급했다.
1137 조회
0 추천
2025.11.21 등록
GoogleCEO순다르피차이는인공지능이결국최고경영자역할을수행할수있을것이라고말하며,11월18일공개된BBC인터뷰에서이직책을"언젠가AI가하기에아마도더쉬운일중하나"라고설명했다.​그의발언은11월17일출시된Google의가장진보된AI모델인Gemini3발표이후나왔으며,피차이는이것이복잡한작업을자율적으로수행할수있는시스템을향한전환점이라고말했다.CEO는12개월내에AI가질문에답하는것에서사용자를대신하여행동하는에이전트로진화하여선물쇼핑,투자결정평가,의료치료옵션검토와같은작업을처리하게될것이라고예측했다.​기술리더들사이에서커지는목소리Pichai는AI가리더십기능을자동화할수있다고인정하는임원들의확대되는그룹에합류했습니다.OpenAICEOSamAltman은11월4일팟캐스트에서AI가"몇년이내"에주요기업부서를운영할것으로예상한다고말했으며"OpenAI가AICEO가운영하는첫번째대기업이아니라면부끄러운일"이라고선언했습니다.KlarnaCEOSebastianSiemiatkowski는올해초AI가"내일을포함하여우리의모든일을할수있다"고쓰면서회사직원수를7,400명에서3,000명으로줄였습니다.​모든기술리더들이동의하는것은아닙니다.NvidiaCEOJensenHuang은AI가자신을대체할수있는지묻는질문에"절대아니다"라고답했지만,이기술이모든직업에영향을미칠것임을인정했습니다.​버블우려와일자리붕괴피차이는AI의급속한성장에"비합리성의요소들"이포함되어있다고경고했으며,버블이붕괴될경우"우리를포함한어떤회사도면역되지않을것"이라고말했다.그는AI를절대적으로신뢰해서는안된다고사용자들에게주의를주면서,시스템이여전히"오류가발생하기쉽다"고지적했다.​CEO는AI발전이일부직위를없애는동시에다른직위를변화시켜광범위한적응을요구할것이라고말했다.500명의CEO를대상으로한edX설문조사에서49%가자신의직무기능대부분또는전부가AI에의해자동화되어야한다고믿는것으로나타났다.
1159 조회
0 추천
2025.11.21 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입