Loading...

AI 뉴스

OpenAI, 맞춤형 정책 지원을 갖춘 안전 모델 출시

페이지 정보

작성자 xtalfi
작성일 2025.10.30 14:05
1,782 조회
0 추천
0 비추천

본문

67d5401f4201fea22259360979170f81_1761800726_939.jpg
 

(퍼플렉시티가 정리한 기사)


OpenAI는 오늘 gpt-oss-safeguard를 공개했습니다. 이는 개발자들이 콘텐츠 안전성 분류를 처리하는 방식을 혁신하기 위해 설계된 한 쌍의 오픈 웨이트 추론 모델로, 훈련 중에 모델에 내장하는 대신 런타임에 사용자 정의 정책을 정의할 수 있도록 합니다.​

파라미터 수에 따라 명명된 두 모델—gpt-oss-safeguard-120b와 gpt-oss-safeguard-20b—은 정책이 변경될 때 광범위한 재훈련이 필요한 기존 안전성 분류기와는 크게 다릅니다. 대신, 이 모델들은 개발자가 작성한 안전 정책을 요청 시 해석하고 투명한 사고 과정 추론을 제공하여 결정을 설명합니다.​


동적 정책 구현이 산업 현안을 해결합니다

이번 출시는 콘텐츠 모더레이션의 중요한 마찰 지점을 해결합니다: 새로운 위험이 등장할 때 안전 시스템을 업데이트하는 데 필요한 시간과 비용입니다. 기존 분류기는 정책이 변경될 때 재훈련에 몇 주가 걸릴 수 있지만, gpt-oss-safeguard는 개발자가 몇 시간 내에 규칙을 업데이트하고 변경 사항을 배포할 수 있게 합니다.​

업계 분석에 따르면 "새로운 위험이 등장할 때—예를 들어 게임 포럼에서 익스플로잇 공유를 단속해야 하거나 리뷰 사이트에서 가짜 후기의 물결을 발견할 때—기존 분류기는 완전한 재훈련이 필요합니다". 새로운 모델은 추론 시점에 정책을 읽음으로써 이러한 병목 현상을 제거합니다.​

OpenAI는 주요 기술 기업들이 공유 안전 인프라를 구축하기 위해 설립한 2,700만 달러 규모의 비영리 단체인 ROOST(Robust Open Online Safety Tools), Discord, SafetyKit과의 파트너십을 통해 이 모델을 개발했습니다. 이 협력은 소규모 플랫폼이 관련 개발 비용 없이 기업급 안전 도구에 접근해야 한다는 업계의 인식이 높아지고 있음을 반영합니다.​


성능 및 실용적 활용

내부 평가에서 gpt-oss-safeguard-120b는 훨씬 더 작은 크기임에도 불구하고, 다중 정책 벤치마크에서 GPT-5를 능가하여 각각 46.3% 대 43.2%의 정확도를 기록했습니다. 하지만 OpenAI는 수만 개의 라벨이 지정된 예시로 훈련된 기존 분류기가 이러한 추론 모델보다 복잡한 분류 작업에서 여전히 더 우수하다는 점을 인정합니다.​

이 모델들은 정책 유연성이 속도보다 더 중요한 환경, 예를 들어 신흥 위험, 미묘한 영역, 설명 가능성이 중요한 상황에서 뛰어난 성과를 보입니다. 잠재적 활용 사례로는 가짜 리뷰를 표시하는 제품 리뷰 사이트, 치팅 논의를 식별하는 게임 포럼, 새로운 규제 요건에 신속히 적응하는 플랫폼 등이 있습니다.​

OpenAI는 이와 유사한 추론 기술을 내부적으로도 사용하며, 최근 출시에서 전체 컴퓨팅 자원의 최대 16%를 안전 추론에 할당하고 있습니다. 회사의 Safety Reasoner 도구는 gpt-oss-safeguard에 영감을 주었으며, 실제 운영 환경에서 동적 정책 업데이트와 이미지 생성 및 Sora 2 같은 시스템의 실시간 평가를 가능하게 합니다.​

이 모델들은 Hugging Face에서 Apache 2.0 라이선스 하에 제공되며 ROOST에서는 우수 사례를 공유하기 위한 새로운 모델 커뮤니티를 구축하고 있습니다. OpenAI는 ROOST 및 Hugging Face와 함께 12월 8일 샌프란시스코에서 해커톤을 계획하며, 오픈 소스 안전 생태계에 대한 지속적인 투자를 시사하고 있습니다.

댓글 0
전체 1,366 / 103 페이지
(퍼플렉시티가정리한기사)유럽연합집행위원회는수요일에디지털옴니버스패키지를공개할예정이며,이는지난10년간세계에서가장공격적인기술규제기관으로서의EU의입장에서극적인전환을의미합니다.이광범위한입법제안은일반데이터보호규정(GDPR)의핵심조항을수정하고,AI법의주요조항을연기하며,개인정보보호옹호자들이유럽연합역사상디지털권리의가장큰후퇴를나타낼수있다고경고하는변화를도입할것입니다.​집행위원회가EU경쟁력을높이기위해필요한"단순화"라고설명하는이패키지는개인데이터의정의를축소하고,민감한정보를사용한AI훈련에대한제한을완화하며,주요플랫폼의손에통제권을집중시킬수있는브라우저수준의동의설정을잠재적으로허용할것입니다.뉴욕타임즈가검토한유출된초안에따르면,광고ID및쿠키와같은가명식별자는더이상GDPR보호대상인개인데이터로분류되지않을수있습니다.​경쟁력우려가규제완화를주도하다이정책역전은유럽기업들의압력증가와마리오드라기전이탈리아총리의2024년9월경쟁력보고서의권고에따른것으로,해당보고서는급진적인개혁없이는EU가"느린고통"에직면할것이라고경고했다.우르줄라폰데어라이엔집행위원장은미국및중국과의혁신격차를줄이기위해"단순화"와"규제완화"모두를명시적으로지지했으며,간소화가핵심보호조치를약화시키지않을것이라는이전의보장을철회했다.​초안은기업이명시적인사용자동의없이건강상태및정치적견해와같은민감한범주를포함한개인데이터를AI시스템훈련에사용할수있는새로운법적근거를마련할것이다.또한고위험AI시스템에벌금이적용되기전1년의유예기간을도입하고투명성위반에대한처벌을2027년8월까지연기할예정이다.​시민사회,'천번의상처로인한죽음'경고127개의시민사회단체와노동조합연합은이제안들을유럽의디지털보호장치를은밀히해체하는것이라고규탄했습니다.활동가막스슈렘스가이끄는오스트리아프라이버시단체noyb는이러한변화를"천번의칼질로인한죽음"이라고묘사하며,이것이유럽의중소기업보다는OpenAI,Google,Meta,Amazon,Microsoft와같은수조달러규모의기업들에게주로이익이된다고주장했습니다.​이제안들은또한개인이자신의데이터에접근하고,수정하거나,삭제할수있는권리를행사할수있는경우를제한하여,그러한요청을"데이터보호목적"으로만한정할것입니다.비평가들은이러한변화가근로자,언론인,소비자들이법적분쟁에서데이터요청을사용하는것을차단할수있다고말합니다.출판사들과소규모광고기술회사들은브라우저수준의프라이버시통제가지배적인플랫폼의권력을더욱공고히하여"Apple의AppTrackingTransparency보다더나쁜"역학을만들수있다는우려를제기했습니다.
1083 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)이스라엘경제뉴스매체글로브스에따르면셰바메디컬센터의ARC이노베이션과마운트시나이아이칸의과대학은월요일NVIDIA와의파트너십을발표했다.이파트너십은아직충분히이해되지않은인간유전체의대다수를해독하는것을목표로한다고밝혔다.이번협업은대형언어모델기술을활용해단백질을암호화하지않는98%이상의DNA를해독하고,이를통해질병예방,진단및치료를위한새로운경로를열수있을것으로기대된다.​이이니셔티브에는수천만달러규모의투자가이루어지며,세파트너기관모두각각5~7명의인력을전담하여프로젝트에투입할예정이다.NVIDIA는컴퓨팅파워,인프라,알고리즘및AI팀을지원하고,셰바메디컬센터는임상데이터를제공하며,마운트시나이측은현재진행중인MillionHealthDiscoveriesProgram의일환으로11,000명의유전체정보를제공할계획이다.​유전체의"암흑물질"을표적으로삼기2000년에최초의인간게놈이시퀀싱되었지만,과학자들은단백질을암호화하는유전자가인간DNA의약1~2퍼센트만을차지한다는사실을곧발견했습니다.나머지98퍼센트는한때"쓰레기DNA"로치부되었으나,이제는유전자발현을조절하고암,심장병,자폐증등과같은질병에서중요한역할을하는핵심적인조절요소들이포함된것으로이해되고있습니다.​Sheba를대표해프로젝트를이끄는과학책임자인GidiRechavi교수는,98퍼센트가넘는유전자가"아주정밀하고섬세하게단백질을발현하는유전자들을조절하는역할을하는복잡한유전자오케스트라의일부로기능한다"고설명했습니다.현재프로젝트는이러한유전자들의활동을건강한사람부터먼저점진적으로해독한뒤,일반적인질병뿐만아니라결국모든건강과질병영역에서해독하는것을목표로하고있습니다.​지적재산권및접근성협업을통해창출된모든지적재산권은Sheba와MountSinai의소유로남게되며,AI모델자체는퍼블릭도메인에속하게됩니다.하지만두병원은이모델에대해초기및독점적인접근권한을가지게된다고Sheba의료센터의총괄이사인YitshakKreiss교수는밝혔습니다.두병원은이프로젝트를성공적으로평가하기위해약2년내에질병경로에대해새로운사실을학습할수있을경우를기준으로삼을것입니다.
1169 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)암스테르담지역의식품기술스타트업AKAFoods가식품제품개발을가속화하는데특화된세계최초의안전한AI플랫폼을출시하기위해1,720만달러규모의시드펀딩라운드를마감했다고이번주에발표했습니다.​AI분야의저명한연구자인Alex와MichaelBronstein이주도한이번투자는AKAStudio의공식데뷔를알립니다.AKAStudio는수년이걸리는제품개발일정을몇주로단축하면서도엄격한데이터보안프로토콜을유지하도록설계된독점시스템입니다.이플랫폼은기업의내부연구개발데이터,원료사양,규제문서,감각평가를하나의통합된디지털프레임워크로통합하여AI어시스턴트가이를분석해포뮬레이션결정을안내할수있도록합니다.​산업의병목현상공략암스테르담에본사를둔이회사는창립자겸CEO인데이비드삭이말한식품산업이방대한조직지식을효과적으로활용하는데겪고있는어려움을해결하기위해노력하고있습니다."AKA스튜디오는기업들이그지식을안전하게포착하고,조직하고,적용할수있는능력을제공합니다,"라고삭은말했습니다.또한이번투자를통해글로벌엔터프라이즈배포와플랫폼기반과학의지속적인발전이가능해졌다고덧붙였습니다.​일반적인AI모델과달리AKA스튜디오는전용감각연구시설에서비롯된질감,향,맛과관련된실험및분석측정값을통합합니다.최고과학자이자투자자인알렉스브론스타인교수는플랫폼의특화된역량을강조하며,"AKAFoods는본질적으로새로운유형의문법,즉식품을위한언어를시장에선보이고있으며,AI에이전트가다양한외부데이터소스에연결되어레시피를어떻게개선할수있을지추천할수있도록합니다.이것은챗GPT와같은일반적인AI모델로는절대달성할수없는일입니다".​​이플랫폼은클린라벨재구성,설탕과지방감축,공급망회복력등주요산업과제를해결하는데초점을맞추고있습니다.보안은시스템설계의핵심요소이며,플랫폼은소프트웨어-서비스형(SaaS)솔루션으로각고객에게독립된데이터환경을제공합니다.보안요구가높은조직의경우,온프레미스에어갭구성으로배포할수있습니다.회사는고객데이터가절대외부모델학습에공유되거나포함되지않는다는점을보장합니다.​회사에따르면,기반이되는센서리-AI프레임워크는향후식품을넘어향료,향수,화장품,의약품등다양한분야에서응용될잠재력을갖추고있습니다.
1102 조회
0 추천
2025.11.19 등록
(퍼플렉시티가정리한기사)이재명대통령과무함마드빈자이드알나흐얀아랍에미리트(UAE)대통령은18일(현지시간)아부다비대통령궁에서정상회담을갖고인공지능(AI)과원자력등첨단분야협력을강화하기로합의했다.양국은정상회담을계기로총7건의양해각서(MOU)를체결하며,기존방위산업과에너지협력을넘어미래첨단기술분야로협력을확대했다.​이번회담에서가장주목되는성과는한국이초기투자만30조원규모에달하는UAE의'스타게이트프로젝트'에참여하기로한것이다.이프로젝트는아부다비에최대5기가와트(GW)규모의AI데이터센터클러스터를구축하는사업으로,내년첫200메가와트(MW)급AI클러스터가동을목표로하고있다.​AI·원전·우주등7개분야MOU체결양국은이날△전략적AI협력프레임워크△AI분야협력△우주협력△바이오헬스분야포괄적협력△지식재산분야심화협력△원자력신기술·AI및글로벌시장협력파트너십△한·UAE포괄적경제동반자협정(CEPA)경제협력위원회행정및운영등7건의양해각서를체결했다.​특히한국전력공사와UAE원자력공사(ENEC)가서명한원전협력MOU는소형모듈원전(SMR)을포함한차세대원자력기술협력과제3국시장공동진출을담고있다.한국이건설한바라카원전은현재UAE전력수요의25%를공급하고있다.​재계총수들19일비즈니스라운드테이블참석이대통령은19일열리는한·UAE비즈니스라운드테이블에참석해양국경제인들과구체적인협력방안을논의할예정이다.이자리에는이재용삼성전자회장,김동관한화그룹부회장,유영상SK수펙스추구협의회AI위원회위원장등주요기업인들이참석한다.​이대통령은회담에서"양국이거래와계약을통한이익추구를넘어모두의성장과공동번영을향해거침없이나아갈수있도록미래지향적인협력구조를구축하자"고강조했다.무함마드대통령은"과학기술과혁신분야,특히우주와AI분야협력을확대하길희망한다"고화답했다.
1053 조회
0 추천
2025.11.19 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입