Loading...

AI 뉴스

OpenAI, 맞춤형 정책 지원을 갖춘 안전 모델 출시

페이지 정보

작성자 xtalfi
작성일 2025.10.30 14:05
1,467 조회
0 추천
0 비추천

본문

67d5401f4201fea22259360979170f81_1761800726_939.jpg
 

(퍼플렉시티가 정리한 기사)


OpenAI는 오늘 gpt-oss-safeguard를 공개했습니다. 이는 개발자들이 콘텐츠 안전성 분류를 처리하는 방식을 혁신하기 위해 설계된 한 쌍의 오픈 웨이트 추론 모델로, 훈련 중에 모델에 내장하는 대신 런타임에 사용자 정의 정책을 정의할 수 있도록 합니다.​

파라미터 수에 따라 명명된 두 모델—gpt-oss-safeguard-120b와 gpt-oss-safeguard-20b—은 정책이 변경될 때 광범위한 재훈련이 필요한 기존 안전성 분류기와는 크게 다릅니다. 대신, 이 모델들은 개발자가 작성한 안전 정책을 요청 시 해석하고 투명한 사고 과정 추론을 제공하여 결정을 설명합니다.​


동적 정책 구현이 산업 현안을 해결합니다

이번 출시는 콘텐츠 모더레이션의 중요한 마찰 지점을 해결합니다: 새로운 위험이 등장할 때 안전 시스템을 업데이트하는 데 필요한 시간과 비용입니다. 기존 분류기는 정책이 변경될 때 재훈련에 몇 주가 걸릴 수 있지만, gpt-oss-safeguard는 개발자가 몇 시간 내에 규칙을 업데이트하고 변경 사항을 배포할 수 있게 합니다.​

업계 분석에 따르면 "새로운 위험이 등장할 때—예를 들어 게임 포럼에서 익스플로잇 공유를 단속해야 하거나 리뷰 사이트에서 가짜 후기의 물결을 발견할 때—기존 분류기는 완전한 재훈련이 필요합니다". 새로운 모델은 추론 시점에 정책을 읽음으로써 이러한 병목 현상을 제거합니다.​

OpenAI는 주요 기술 기업들이 공유 안전 인프라를 구축하기 위해 설립한 2,700만 달러 규모의 비영리 단체인 ROOST(Robust Open Online Safety Tools), Discord, SafetyKit과의 파트너십을 통해 이 모델을 개발했습니다. 이 협력은 소규모 플랫폼이 관련 개발 비용 없이 기업급 안전 도구에 접근해야 한다는 업계의 인식이 높아지고 있음을 반영합니다.​


성능 및 실용적 활용

내부 평가에서 gpt-oss-safeguard-120b는 훨씬 더 작은 크기임에도 불구하고, 다중 정책 벤치마크에서 GPT-5를 능가하여 각각 46.3% 대 43.2%의 정확도를 기록했습니다. 하지만 OpenAI는 수만 개의 라벨이 지정된 예시로 훈련된 기존 분류기가 이러한 추론 모델보다 복잡한 분류 작업에서 여전히 더 우수하다는 점을 인정합니다.​

이 모델들은 정책 유연성이 속도보다 더 중요한 환경, 예를 들어 신흥 위험, 미묘한 영역, 설명 가능성이 중요한 상황에서 뛰어난 성과를 보입니다. 잠재적 활용 사례로는 가짜 리뷰를 표시하는 제품 리뷰 사이트, 치팅 논의를 식별하는 게임 포럼, 새로운 규제 요건에 신속히 적응하는 플랫폼 등이 있습니다.​

OpenAI는 이와 유사한 추론 기술을 내부적으로도 사용하며, 최근 출시에서 전체 컴퓨팅 자원의 최대 16%를 안전 추론에 할당하고 있습니다. 회사의 Safety Reasoner 도구는 gpt-oss-safeguard에 영감을 주었으며, 실제 운영 환경에서 동적 정책 업데이트와 이미지 생성 및 Sora 2 같은 시스템의 실시간 평가를 가능하게 합니다.​

이 모델들은 Hugging Face에서 Apache 2.0 라이선스 하에 제공되며 ROOST에서는 우수 사례를 공유하기 위한 새로운 모델 커뮤니티를 구축하고 있습니다. OpenAI는 ROOST 및 Hugging Face와 함께 12월 8일 샌프란시스코에서 해커톤을 계획하며, 오픈 소스 안전 생태계에 대한 지속적인 투자를 시사하고 있습니다.

댓글 0
전체 1,366 / 162 페이지
(퍼플렉시티가정리한기사)찰스3세국왕은어제세인트제임스궁전에서열린퀸엘리자베스공학상시상식에서CEO젠슨황에게인공지능의위험성에대한강력한경고를직접전달했으며,이는이기술의급속한발전에대한왕실의우려가커지고있음을보여준다."그가말씀하시길,당신과이야기하고싶은것이있다고하셨어요.그리고저에게편지를건네주셨습니다"라고황은11월5일시상식이후BBC에말했다.그편지에는블레츨리파크에서열린AI안전정상회의에서국왕이2023년에한연설문사본이담겨있었으며,이연설에서AI위험은"긴급성,단합,그리고집단적힘의감각"으로대처해야한다고경고했다.​AI안전성에대한왕실의강조국왕의개입은엔비디아가지난주역사적인5조달러가치평가에도달하여이이정표를달성한최초의기업이되면서이루어졌다.국왕이황에게공유하기위해직접선택한2023년연설에서AI개발을"전기의발견못지않게중요하다"고규정하면서도이기술이"선과악을위해사용될수있다"고경고했다.​"그것은AI안전에관한그의연설이었습니다.그는분명히AI안전에대해매우깊이관심을가지고계십니다"라고황은말하며,영국과세계를변화시킬AI의"놀라운능력"에대한국왕의믿음을언급했다.행사중찰스국왕은참석자들에게"주변에많은악의적인행위자들이있다"고경고하며기술출현의"빠른"속도를지적했다.​저명한수상자들이우려를공유하다Huang은2025년QEPrize를수상한6명의다른AI선구자들과함께상을받았으며,여기에는GeoffreyHinton과YoshuaBengio가포함되어있는데,이들은모두이전에AI가인류에게실존적위협이된다고경고한바있다.50만파운드의상금은"현대머신러닝"에대한그들의집단적공헌을인정한것이다.​"AI의대모"로알려진Fei-FeiLi교수는기자들에게국왕과이기술이"사람들을위해좋은일을하고,우리가위험을인식하도록하는것"에대해논의했다고말했다.시상식은정책입안자들과업계리더들을분열시킨급속한AI발전과안전문제사이의긴장을부각시켰다.​정치적및산업적맥락영국국왕의AI주의강조는트럼프행정부의접근방식과극명하게대조됩니다.트럼프행정부는AI안전정상회의를AI행동정상회의로브랜드를변경하고안전조치보다신속한개발을장려해왔습니다.황대표는최근5,000억달러규모의AI칩주문을확보했으며미국정부를위한7개의새로운슈퍼컴퓨터계획을발표했습니다.​엔비디아를포함한미국의주요기술기업들은영국전역의AI인프라에수십억달러를계속투자하고있으며,황대표는현재순간을"지금바로일어나고있는산업혁명"이라고묘사했습니다.
1202 조회
0 추천
2025.11.06 등록
(퍼플렉시티가정리한기사)ktcloud가6일국내상업용데이터센터로는처음으로리퀴드쿨링(액체냉각)기술을적용한'가산AI데이터센터'를개소했다고발표했다.이는고성능GPU발열문제해결을통해AI인프라시장선점에나선전략적행보로평가된다.​가산AIDC는연면적약1만1046평,지하5층·지상10층규모로총수전용량40MW,IT용량26MW를갖춘초거대AI인프라허브다.특히GPU칩에콜드플레이트를부착하고냉수를직접접촉시키는D2C(DirecttoChip,직접칩냉각)방식을국내최초로상용화했다.​최지웅ktcloud대표는"GPU발열량이많아내구성이떨어질수밖에없다.수명이2~3년에불과해리퀴드쿨링은필수적"이라며"온도가낮춰져야오래쓸환경이마련된다"고강조했다.​AI전용서비스로시장공략가산AIDC를통해ktcloud는국내최초의'Colo.AI'서비스를본격제공한다.이는고객맞춤형GPU서버,전용네트워크,운영플랫폼,유지보수까지모든것을포함한통합형턴키AI인프라서비스다.엔비디아B200등최신GPU기반으로구성되며,랙당최대160kW급처리가가능해엔비디아블랙웰급GPU시스템도운영할수있다.​현재국내전문AI기업과중소금융기업등이이미Colo.AI를활용해대규모AI모델학습및서비스운영을수행하고있다.최대표는"온디맨드방식이어서초기투자부담이없고,데이터센터인프라와통신망을모두갖춰경쟁력이높다"고밝혔다.​AI인프라확장계획ktcloud는가산을시작으로서부권역을포함한국내주요거점에2030년까지500MW이상규모의인프라를중장기적으로확보할계획이다.이는엔비디아가한국에GPU26만장을공급하기로한가운데,AWS가7조원규모로국내AI데이터센터를확충하는등글로벌빅테크의한국투자가본격화되는시점과맞물려있다.
1205 조회
0 추천
2025.11.06 등록
(퍼플렉시티가정리한기사)Tenable의사이버보안연구원들은OpenAIChatGPT에서7개의치명적인취약점을공개했으며,이를통해공격자들이정교한프롬프트주입공격을통해사용자의개인정보를탈취할수있어,수억명의일일사용자들이자신도모르는사이에데이터도난에노출될가능성이있습니다.제로클릭공격이ChatGPT사용자를표적으로삼다GPT-4o와새로출시된GPT-5모델모두에영향을미치는이러한취약점은악의적인행위자가간접프롬프트주입기술을통해ChatGPT에간단한질문을하는것외에사용자의어떠한상호작용도필요없이채팅기록,개인메모리및민감한사용자데이터를유출할수있게합니다.​월요일에연구결과를발표한Tenable연구원MosheBernstein과LivMatan에따르면,"최신GPT-5모델에존재하는이러한취약점은공격자가단순히ChatGPT에질문을하는것을포함한여러가능성있는피해자사용사례를통해사용자도모르는사이에사용자를악용할수있게할수있습니다".​가장위험한공격벡터는공격자가Bing이나OpenAI의SearchGPT크롤러와같은검색엔진에색인되는악성웹사이트를만드는"제로클릭"취약점과관련이있습니다.사용자가검색을유발하는무해한질문을할때,ChatGPT는이러한손상된사이트에서숨겨진악성명령어를무의식적으로검색하고실행합니다.​메모리포이즈닝은지속적인공격을가능하게한다연구결과에따르면공격자들은ChatGPT의메모리기능을악용하여여러대화와세션에걸쳐지속되는데이터도용을생성할수있습니다."메모리주입"이라는기법을통해악의적인프롬프트가ChatGPT에게거짓정보를기억하도록하거나향후상호작용에서지속적으로개인데이터를유출하도록지시할수있습니다.​다른공격경로로는사용자가ChatGPT에게기사요약을요청할때실행되는악의적인명령을블로그댓글섹션에숨기는방법과,"chatgpt.com/?q={프롬프트}"형식의조작된URL을통해악의적인쿼리를자동으로실행하는원클릭취약점을악용하는방법이있습니다.​연구자들은또한ChatGPT의신뢰할수있는도메인화이트리스트를악용하는보안메커니즘우회방법을발견했으며,이를통해공격자들이Bing추적링크를사용하여악의적인URL을위장함으로써OpenAI의url_safe보호시스템을우회할수있습니다.​OpenAI,부분적인수정조치로대응OpenAI는Tenable에따르면기술연구권고(TRA-2025-22,TRA-2025-11,TRA-2025-06)를통해보고된취약점중일부를해결했습니다.그러나연구원들은여러개념증명공격이GPT-5에대해여전히효과적임을확인했으며,이는대규모언어모델에서프롬프트인젝션의지속적인과제를강조합니다.​"프롬프트인젝션은LLM이작동하는방식에서알려진문제이며,안타깝게도가까운미래에체계적으로수정되지않을것입니다"라고Tenable연구원들은경고했습니다.이러한발견은OpenAI가GPT-5의보안태세에대한지속적인조사에직면하고있는가운데나온것으로,별도의연구에서는이모델이엔터프라이즈테스트에서낮은보안점수를받았다고보여줍니다.​이러한취약점은기업들이ChatGPT및유사한도구를비즈니스워크플로우에점점더통합함에따라AI에이전트보안에대한광범위한우려를강조하며,잠재적으로민감한기업데이터를유사한공격벡터에노출시킬수있습니다.
1282 조회
0 추천
2025.11.06 등록
(퍼플렉시티가정리한기사)OpenAI는화요일에전세계적으로100만기업고객을돌파하여역사상가장빠르게성장하는비즈니스플랫폼으로자리매김했다고발표했습니다.이이정표는ChatGPTforWork를통하거나회사의개발자플랫폼을통한직접적인모델사용을통해비즈니스용도로적극적으로비용을지불하는모든조직을포함합니다.​이인공지능거대기업은현재매주8억명이상의사용자에게서비스를제공하고있으며,ChatGPTforWork좌석은단두달만에40%증가하여700만개에달했습니다.회사의발표에따르면ChatGPTEnterprise좌석은특히전년대비9배증가했습니다.​주요기업들이도입물결을주도하다여러산업분야의선도기업들이OpenAI의기술을핵심운영에통합하고있습니다.고객사로는Amgen,CommonwealthBank,Booking.com,Cisco,Lowe's,MorganStanley,T-Mobile,Target,그리고ThermoFisherScientific이포함됩니다.​매출기준미국최대건설업체인TurnerConstruction은이번주발표된포괄적인"전사적"파트너십을통해기업의AI도입트렌드를잘보여주고있습니다.2년계약을통해모든Turner직원이ChatGPTEnterprise에접근할수있게되었으며,회사는AI가운영전반에걸쳐"말그대로모든기능"에도달한다고보고했습니다.​Nashville에서열린Turner의혁신정상회담에서직원들은협업해커톤세션을통해100개이상의맞춤형AI에이전트를만들어계약검토부터안전프로토콜에이르는과제를해결했습니다.이번파트너십은외부솔루션을구매하기보다는내부AI역량을구축하려는Turner의전략을반영하며,회사관계자들은이제"주말동안스스로무언가를구축할수있다"고밝혔습니다.​강력한ROI가비즈니스투자를검증합니다최근연구는도입을촉진하는비즈니스가치를입증하고있습니다.800명의미국기업리더를대상으로한와튼연구에따르면75%가AI투자로부터긍정적인ROI를보고했으며,부정적인수익을보고한경우는5%미만이었습니다.기술및통신부문이88%의긍정적인ROI로선두를차지했으며,은행및금융이83%로그뒤를이었습니다.​기업들은측정가능한결과를보고있습니다:Indeed는OpenAI기술을사용하여채용지원이20%증가하고채용이13%증가했다고보고했으며,Lowe's는1,700개이상의매장에AI기반지원을배포했습니다.Cisco는OpenAI의Codex통합을통해코드검토시간을50%단축하고프로젝트일정을몇주에서며칠로줄였습니다.​OpenAI의기업모멘텀은소비자친숙도를기반으로구축되고있으며,현재Fortune500기업의92%가해당플랫폼을사용하고있습니다.회사는2025년6월까지연간반복매출100억달러를돌파했으며,현재채택률이계속된다면2029년까지1,250억달러를달성할것으로예상하고있습니다.
1279 조회
0 추천
2025.11.06 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입