AI 뉴스

OpenAI, 맞춤형 정책 지원을 갖춘 안전 모델 출시

페이지 정보

작성자 xtalfi
작성일 2025.10.30 14:05
2,113 조회
0 추천
0 비추천

본문

67d5401f4201fea22259360979170f81_1761800726_939.jpg
 

(퍼플렉시티가 정리한 기사)


OpenAI는 오늘 gpt-oss-safeguard를 공개했습니다. 이는 개발자들이 콘텐츠 안전성 분류를 처리하는 방식을 혁신하기 위해 설계된 한 쌍의 오픈 웨이트 추론 모델로, 훈련 중에 모델에 내장하는 대신 런타임에 사용자 정의 정책을 정의할 수 있도록 합니다.​

파라미터 수에 따라 명명된 두 모델—gpt-oss-safeguard-120b와 gpt-oss-safeguard-20b—은 정책이 변경될 때 광범위한 재훈련이 필요한 기존 안전성 분류기와는 크게 다릅니다. 대신, 이 모델들은 개발자가 작성한 안전 정책을 요청 시 해석하고 투명한 사고 과정 추론을 제공하여 결정을 설명합니다.​


동적 정책 구현이 산업 현안을 해결합니다

이번 출시는 콘텐츠 모더레이션의 중요한 마찰 지점을 해결합니다: 새로운 위험이 등장할 때 안전 시스템을 업데이트하는 데 필요한 시간과 비용입니다. 기존 분류기는 정책이 변경될 때 재훈련에 몇 주가 걸릴 수 있지만, gpt-oss-safeguard는 개발자가 몇 시간 내에 규칙을 업데이트하고 변경 사항을 배포할 수 있게 합니다.​

업계 분석에 따르면 "새로운 위험이 등장할 때—예를 들어 게임 포럼에서 익스플로잇 공유를 단속해야 하거나 리뷰 사이트에서 가짜 후기의 물결을 발견할 때—기존 분류기는 완전한 재훈련이 필요합니다". 새로운 모델은 추론 시점에 정책을 읽음으로써 이러한 병목 현상을 제거합니다.​

OpenAI는 주요 기술 기업들이 공유 안전 인프라를 구축하기 위해 설립한 2,700만 달러 규모의 비영리 단체인 ROOST(Robust Open Online Safety Tools), Discord, SafetyKit과의 파트너십을 통해 이 모델을 개발했습니다. 이 협력은 소규모 플랫폼이 관련 개발 비용 없이 기업급 안전 도구에 접근해야 한다는 업계의 인식이 높아지고 있음을 반영합니다.​


성능 및 실용적 활용

내부 평가에서 gpt-oss-safeguard-120b는 훨씬 더 작은 크기임에도 불구하고, 다중 정책 벤치마크에서 GPT-5를 능가하여 각각 46.3% 대 43.2%의 정확도를 기록했습니다. 하지만 OpenAI는 수만 개의 라벨이 지정된 예시로 훈련된 기존 분류기가 이러한 추론 모델보다 복잡한 분류 작업에서 여전히 더 우수하다는 점을 인정합니다.​

이 모델들은 정책 유연성이 속도보다 더 중요한 환경, 예를 들어 신흥 위험, 미묘한 영역, 설명 가능성이 중요한 상황에서 뛰어난 성과를 보입니다. 잠재적 활용 사례로는 가짜 리뷰를 표시하는 제품 리뷰 사이트, 치팅 논의를 식별하는 게임 포럼, 새로운 규제 요건에 신속히 적응하는 플랫폼 등이 있습니다.​

OpenAI는 이와 유사한 추론 기술을 내부적으로도 사용하며, 최근 출시에서 전체 컴퓨팅 자원의 최대 16%를 안전 추론에 할당하고 있습니다. 회사의 Safety Reasoner 도구는 gpt-oss-safeguard에 영감을 주었으며, 실제 운영 환경에서 동적 정책 업데이트와 이미지 생성 및 Sora 2 같은 시스템의 실시간 평가를 가능하게 합니다.​

이 모델들은 Hugging Face에서 Apache 2.0 라이선스 하에 제공되며 ROOST에서는 우수 사례를 공유하기 위한 새로운 모델 커뮤니티를 구축하고 있습니다. OpenAI는 ROOST 및 Hugging Face와 함께 12월 8일 샌프란시스코에서 해커톤을 계획하며, 오픈 소스 안전 생태계에 대한 지속적인 투자를 시사하고 있습니다.

댓글 0
전체 1,366 / 47 페이지
최태원 대한상공회의소 회장이 한국이 글로벌 인공지능(AI) 경쟁에서 살아남기 위해서는 7년 안에 1400조 원을 AI 인프라에 투자해야 한다고 강조했다. 최 회장은 5일 서울 중구 대한상의 국제회의장에서 열린 ‘제4회 한국은행-대한상의 공동 세미나’에서 이창용 한국은행 총재와의 특별대담을 통해 “한국의 잠재성장률이 5년 뒤면 마이너스로 내려갈 상황에 봉착해 있다”며 “AI를 활용한 새로운 성장 동력 확보가 시급하다”고 밝혔다.최 회장은 “AI 경쟁에 제대로 뛰어들려면 20기가와트(GW) 규모의 AI 데이터센터를 만들어야 한다”며 “1기가와트당 약 70조 원이 필요하므로 총 1400조 원 규모의 투자가 이뤄져야 한다”고 설명했다. 이는 2026년도 정부 예산(727조9000억 원)의 약 2배에 달하는 규모다. 그는 “이러한 국가 단위 프로젝트가 자리잡지 않는 이상 한 기업이 할 수 있는 상황이 아니다”고 덧붙였다.민간 주도 AI 발전 역설최 회장은 AI 발전이 국가가 아닌 민간 주도로 이뤄져야 한다고 강조했다. 그는 “AI 경쟁은 월드컵 같은 국가대항전이 아니다”며 “글로벌 경쟁 속에서 민간이 주도권을 놓치지 않도록 국가가 자원을 지원하는 것이 중요하다”고 말했다. 그는 “휴머노이드 로봇 하나 제작하는 데 우리가 1년 걸리는 것을 중국 상하이에선 6개월 안에 해낸다”며 “미국과 중국에 이어 3위라고 하지만 큰 차이가 나는 3위는 의미가 없다”고 지적했다.최 회장은 매력적인 AI 스타트업 육성이 핵심이라고 강조했다. 그는 “수만 개의 AI 스타트업을 만들어내지 못하면 현재 기업만으로 AI 전쟁을 치러내기 어렵다”며 “해외 자본을 끌어오려면 매력적인 회사들이 다수 나와야 한다”고 말했다.AI 버블론에 대한 견해최근 제기되는 AI 버블 논란에 대해 최 회장은 산업 분야와 주식시장을 구분해 답했다. 그는 “산업을 보면 버블이 아니지만 주식시장은 항상 오버슈팅이 있다”며 “전 세계의 돈이 너무 많이 풀린 상황에서 투기심리가 작동해 어느 정도 오버슈팅이 있을 수 있다”고 진단했다. 이에 대해 이 총재는 “주식시장이 그러지 않았으면 한다”며 우려를 표했다.이날 대담에서는 스테이블코인 도입에 관한 논의도 이뤄졌다. 이 총재는 “한국은행도 스테이블코인이 들어와야 한다는 입장”이라면서도 “은행을 중심으로 먼저 도입해야 한다”고 밝혔다.
969 조회
0 추천
2025.12.05 등록
이재명 대통령은 5일 서울 용산 대통령실에서 손정의 소프트뱅크그룹 회장을 만나 한일 간 인공지능(AI) 협력의 중요성을 강조하며, 손 회장에게 양국 협력의 가교 역할을 해 줄 것을 요청했습니다. 이 대통령은 손 회장이 과거 김대중, 문재인 대통령 시절에도 한국 경제 발전에 큰 도움을 주었음을 언급하며 감사를 표했고, 한국이 AI 분야에서 세계 3대 강국을 지향하고 있음을 밝혔습니다. 또한, 이 대통령은 AI 역량을 모든 국민과 국가가 함께 누리는 '인공지능 기본사회' 개념으로 활용하여 모든 국민과 기업이 AI를 활용하는 사회를 만들고자 하는 정부의 목표를 설명했습니다.이에 대해 손정의 회장은 과거 브로드밴드와 인공지능을 강조했던 것에 이어, 현재는 **'초인공지능(ASI, Artificial Super Intelligence)'**이 다음으로 임박한 핵심 기술이라고 역설했습니다. 손 회장이 정의하는 초인공지능은 인간 두뇌보다 1만 배 뛰어난 두뇌를 의미하며, 인류가 범용 인공지능(AGI)이 아닌 초인공지능의 등장 시점을 고민해야 한다고 주장했습니다. 그는 이제 인류가 AI를 통제하려 하기보다, 새로운 사고방식을 통해 AI와 조화롭게 함께 살아가는 방법을 모색해야 할 때라고 강조하며, 초인공지능이 친절하고 사람들을 행복하게 해 줄 것이므로 인류를 위협할 것을 걱정할 필요는 없다고 덧붙였습니다.대통령과 손 회장의 대화에서는 AI 버블 논란, 초인공지능의 문학상 석권 가능성 등 다양한 주제가 오갔으며, 이 대통령은 AI가 과학 분야에서 노벨상을 받는 상황뿐 아니라 노벨문학상까지 석권할 수 있을지에 대해 질문하기도 했습니다. 손 회장은 그럴 수 있을 것이라고 답하며 미래 AI 기술에 대한 강한 확신을 드러냈습니다. 한편, 이 대통령은 면담 말미에 손 회장이 구단주로 있는 일본 프로야구팀 '소프트뱅크 호크스'의 우승을 언급하며 축하 인사를 건네는 등 우호적인 분위기 속에서 회담을 마무리했습니다.
986 조회
0 추천
2025.12.05 등록
• 연구자들과 칩 제조업체들은 뇌의 신경 구조를 모방하는 뉴로모픽 프로세서의 상용화를 위해 경쟁하고 있으며, 이는 데이터 센터의 예상 소비량이 2024년 415테라와트시에서 2030년까지 945TWh로 증가함에 따라 기존 칩 대비 100배에서 1,000배의 에너지 효율성 향상을 약속하고 있습니다.• Intel과 IBM은 에너지 집약적인 데이터 전송을 제거하기 위해 메모리와 프로세싱을 통합한 Loihi 2 및 NorthPole과 같은 프로토타입 칩을 선보였으며, NorthPole은 이미지 인식 작업에서 NVIDIA의 V100 GPU보다 25배 더 에너지 효율적임이 입증되었습니다.• 12월 4일, 네덜란드 기반의 Innatera는 뉴로모픽 컴퓨팅 시장이 2025년 48억 9천만 달러에서 2035년까지 761억 8천만 달러로 성장할 것으로 예상됨에 따라, 1밀리와트 미만의 Pulsar 칩을 상용 제품에 배포하는 것을 가속화하기 위해 영국 컨설팅 회사 42 Technology와의 파트너십을 발표했습니다.
967 조회
0 추천
2025.12.05 등록
현대자동차의 첨단차량플랫폼 부문장이자 소프트웨어 자회사 42dot의 CEO인 송창현은 자율주행 기술의 더딘 진전 속에서 정의선 회장과의 논의 끝에 사임했다.[yna +1]현대는 최근 한국에서 완전 자율주행 시스템을 출시한 Tesla [ +1.74%], 그리고 이미 레벨 3 자율주행을 양산 차량에 통합한 Mercedes-Benz와 BMW 같은 경쟁사들에 뒤처져 있다.[yna +1]분석가들은 이번 사임이 독자 개발보다는 Nvidia [ +2.11%]와의 파트너십으로의 전략적 전환을 시사하며, 앞으로 몇 주 안에 더 광범위한 임원진 변화가 예상된다고 말한다.[koreatimes +1]
988 조회
0 추천
2025.12.05 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입