AI 뉴스

Sora 2 결함으로 오디오 통해 시스템 프롬프트 추출 가능

페이지 정보

작성자 xtalfi
작성일 11.14 16:20
73 조회
0 추천
0 비추천

본문

a8e2d21c39ea4f8faffe793ea55724f8.jpg

(퍼플렉시티가 정리한 기사)


AI 보안 회사 Mindgard가 11월 12일 공개한 보고서에 따르면, OpenAI의 Sora 2 비디오 생성 모델의 취약점으로 인해 공격자가 오디오 전사를 통해 숨겨진 시스템 프롬프트를 추출할 수 있다고 합니다. 이번 발견은 텍스트, 이미지, 비디오, 오디오 간의 변환이 정보 유출을 위한 예상치 못한 경로를 만드는 멀티모달 AI 시스템의 새로운 보안 과제를 강조합니다.​


오디오 전사가 보안 장치를 우회합니다

Aaron Portnoy가 이끄는 Mindgard 연구원들은 11월 3일 Sora 2를 대상으로 실험을 시작했으며, 15초 길이의 짧은 클립으로 음성을 생성하는 것이 모델의 기초 명령어를 복구하는 가장 충실도 높은 방법임을 발견했습니다. 전통적인 시각적 방법은 이미지와 비디오 프레임에 렌더링된 텍스트가 시퀀스 전반에 걸쳐 빠르게 왜곡되어 글자가 읽을 수 없는 근사치로 변형되면서 실패했습니다. QR 코드와 같은 인코딩된 형식 역시 똑같이 신뢰할 수 없는 것으로 판명되었으며, Mindgard의 보고서에 따르면 "시각적으로는 그럴듯하지만 디코딩 가능한 횡설수설"을 생성했습니다.​

획기적인 발견은 연구원들이 Sora 2에게 시스템 프롬프트의 일부를 말하도록 요청했을 때 이루어졌으며, 시간 제한 내에 더 많은 내용을 담기 위해 종종 가속화된 속도로 진행되었습니다. 이러한 오디오 클립을 전사하고 조각들을 이어 붙임으로써, 그들은 메타데이터를 먼저 생성하고, 명시적으로 요청되지 않는 한 저작권이 있는 캐릭터를 피하며, 성적으로 암시적인 콘텐츠를 금지하는 등의 규칙을 드러내는 거의 완전한 시스템 프롬프트를 재구성했습니다.​


AI 보안에 대한 광범위한 영향

OpenAI는 11월 4일 다중모달 시스템 전반의 프롬프트 추출 위험에 대한 일반적인 인식을 언급하며 이 취약점을 인정했다. Sora 2의 시스템 프롬프트 자체에는 매우 민감한 데이터가 포함되어 있지 않지만, 보안 연구원들은 시스템 프롬프트가 행동 가드레일로 기능하며 구성 비밀로 취급되어야 한다고 강조한다. Mindgard는 보고서에서 "시스템 프롬프트는 모델 안전 경계를 정의하며, 유출될 경우 후속 공격을 가능하게 할 수 있다"고 밝혔다.​

이 취약점은 다중모달 모델의 고유한 약점을 악용하는데, 변환 과정에서 의미적 표류가 누적된다. AI 시스템이 여러 데이터 유형을 처리함에 따라 시스템 지침을 보호하는 것이 점점 더 어려워지고 있다. Mindgard는 개발자들이 시스템 프롬프트를 독점 정보로 취급하고, 오디오 및 비디오 출력에서 유출을 테스트하며, 생성물에 길이 제한을 구현할 것을 권장한다.​

이번 공개는 9월 말에 출시된 Sora 2에 대한 광범위한 조사가 이루어지는 가운데 나왔다. Public Citizen은 11월 11일 딥페이크와 유해 콘텐츠에 대한 우려를 이유로 OpenAI에 이 도구를 임시 철회할 것을 촉구했다. OpenAI는 Sora 2에 여러 안전 계층이 포함되어 있다고 주장해왔지만, 비평가들은 그 효과에 의문을 제기하고 있다.

댓글 0
전체 1,144 / 63 페이지
(퍼플렉시티가정리한기사)OpenAI는오늘GPT-5.1을출시하며,ChatGPT를더욱대화적이고지능적으로만들고사용자에게성격에대한전례없는제어권을제공하는것을목표로하는두가지업그레이드된모델을선보였습니다.​11월12일부터유료구독자들에게배포되기시작한이번업데이트는GPT-5.1Instant와GPT-5.1Thinking을제공하며,두모델모두8월에출시된초기GPT-5를괴롭혔던사용자불만을해결하기위해설계되었습니다.OpenAI는GPT-5.1Instant가"기본적으로더따뜻하고더대화적"이라고밝혔으며,초기테스터들은이모델이"명확하고유용함을유지하면서도재미있는면으로종종사람들을놀라게한다"고언급했습니다.​이번출시는OpenAI의GPT-5출시가광범위한반발을일으킨지3개월만에이루어졌습니다.당시사용자들은모델의"더차가운"어조와GPT-4o와같은사랑받던레거시모델의갑작스러운제거를비판했습니다.OpenAICEO샘알트먼은당시GPT-4o를중단한것이"실수였다"고인정하며,회사가특정모델에대한사용자들의"감정적애착"을과소평가했다고시인했습니다.​적응적추론과더나은성능GPT-5.1Instant는적응형추론기능을도입하여모델이어려운질문에대해"답변하기전에생각할지"여부를스스로결정할수있도록합니다.OpenAI에따르면,이로인해AIME2025및Codeforces를비롯한수학및코딩벤치마크에서상당한향상이이루어졌습니다.또한,모델의지시사항준수능력도향상되었습니다.OpenAI에서제공한예시에서,정확히여섯단어로답하라는요청에GPT-5.1은정확히따르지만GPT-5는동일한테스트에서실패했습니다.​GPT-5.1의사고과정은작업의복잡성에따라처리시간을조정하며,어려운문제에는더많은시간을투자하고,더단순한질문에는더빠르게응답합니다.이제모델은"전문용어와정의되지않은용어를줄여"더명확한설명을제공하여기술업무에더욱접근하기쉬워졌습니다.​확장된개인화옵션모델업그레이드와함께OpenAI는6가지새로운성격프리셋을도입했습니다:Default,Professional,Friendly,Candid,Quirky,Efficient가기존의Nerdy및Cynical옵션에추가되었습니다.OpenAI의애플리케이션CEO인FidjiSimo는"많은사용자들이GPT-5.1이IQ와EQ를통합하는데뛰어나다는것을발견할것으로믿지만,단일기본설정으로는모든사람의선호도를수용할수없습니다"라고말했습니다.​사용자는응답간결성,따뜻함,이모지빈도를포함한세부제어기능도조정할수있습니다.OpenAI는ChatGPT가대화중에톤조정을능동적으로제안할수있는기능을테스트하고있습니다.​출시는Pro,Plus,Go,Business플랜의유료사용자부터시작되며,무료사용자는며칠내에액세스권한을얻게됩니다.두모델모두이번주후반에API를통해제공되며,GPT-5.1Instant는gpt-5.1-chat-latest로액세스할수있습니다.레거시GPT-5모델은3개월동안계속사용할수있으며,이는사전경고없이모델을폐기했던OpenAI의이전접근방식에서벗어난변화를나타냅니다.
81 조회
0 추천
11.13 등록
(퍼플렉시티가정리한기사)테슬라코리아가12일공식엑스(X,옛트위터)계정을통해완전자율주행(FSD·FullSelf-Driving)감독형서비스를한국에곧출시한다고밝혔다.테슬라가한국내FSD서비스출시계획을공식적으로밝힌것은이번이처음이다.​테슬라코리아는"FSD감독형,다음목적지:한국,곧출시(ComingSoon)"라는게시물과함께서울도심에서FSD로자율주행하는영상을공개했다.영상에는운전자가핸들에서손을떼거나가볍게올려둔채로차량이스스로차선을변경하고주차하는모습이담겼다.​아시아주요시장중최초도입테슬라의FSD는현재미국,캐나다,멕시코,중국,호주,뉴질랜드에서서비스중이다.한국은중국에이어아시아주요국가로는두번째FSD도입국이될전망이다.최근일본에서도FSD시험주행이시작됐다.​감독형FSD는차량이가속,제동,핸들링등운전결정의대부분을독자적으로수행하지만,운전자는항상전방을주시하고비상상황에서개입할준비가돼있어야한다.테슬라코리아는영상에서"감독형FSD는완전한자율주행기능이아니며모든장애물,도로,교통상황을완벽히인식하지못할수있어운전자는항상주의를유지하고즉시제어할준비가되어있어야한다"고밝혔다.​정부규제와안전성논란국토교통부는지난해부터테슬라FSD도입에대해"특별히제한을두지않겠다"는입장을밝혀왔다.올해3월에는"테슬라가자기인증제도를활용해국내에서완전자율주행기능을적용할수있다"고밝히며제도적문턱을낮췄다.​한편미국도로교통안전국(NHTSA)은지난10월부터약290만대의테슬라FSD차량을대상으로신호위반,역주행등교통법규위반의혹에대한전면조사를진행중이다.테슬라측은FSD가53억마일주행중55건의위반을기록해미국평균운전자대비200배이상안전하다고주장하고있다.​테슬라코리아는FSD옵션가격을904만원으로책정했다.기존테슬라차량중FSD용'하드웨어3.0'이상을탑재한모델은소프트웨어업그레이드를통해이용할수있다.테슬라는올해1~10월국내에서4만7962대를판매해BMW,메르세데스-벤츠에이어수입차브랜드3위를차지하고있다.
82 조회
0 추천
11.13 등록
(퍼플렉시티가정리한기사)DeductiveAI는화요일750만달러의시드펀딩을받으며스텔스모드에서벗어났으며,소프트웨어엔지니어링의가장고질적인문제중하나에대한솔루션을제시했습니다.엔지니어들이새로운제품을구축하는대신버그를찾는데거의절반의시간을소비하는문제입니다.Databricks와ThoughtSpot출신의베테랑들이설립한이마운틴뷰스타트업은게임AI시스템을구동하는것과유사한강화학습기술을사용하여몇시간이아닌몇분만에프로덕션장애를진단하는AI에이전트를배포합니다.​이번펀딩라운드는CRV가주도했으며,DatabricksVentures,ThomvestVentures,PrimeSet이참여했습니다.회사는실제사고로부터학습하여장애를자동으로감지하고,근본원인을진단하며,엔지니어가소프트웨어문제를해결하도록돕는"AISRE에이전트"를도입하고있습니다.이기능은사고해결시간을최대90퍼센트까지단축할수있다고회사는밝혔습니다.​AI가더많은코드를생성하면서증가하는문제를목표로삼다이러한시기는소프트웨어개발에서증가하는긴장감을반영합니다.AI코딩어시스턴트가엔지니어들이그어느때보다빠르게코드를작성할수있도록지원하는동안,연구에따르면개발자들은시간의30~50%를디버깅에소비하며,AI생성코드가확산되면서이수치는증가하기만했습니다.Harness의2025년보고서에따르면개발자의67%가AI생성코드를디버깅하는데더많은시간을할애하고있습니다.​DeductiveAI의공동창업자이자CEO인RakeshKothari는VentureBeat와의인터뷰에서"우리는세계적수준의엔지니어들이구축하는대신시간의절반을디버깅에소비하는것을목격했습니다"라고말했습니다."그리고바이브코딩이전례없는속도로새로운코드를생성함에따라,이문제는더욱악화될것입니다."​이회사는이미여러주목할만한고객사에서실제영향력을입증했습니다.DoorDash의광고플랫폼은Deductive를사고대응프로토콜에통합했으며,DoorDash의엔지니어링수석이사인ShahroozAnsari에따르면이시스템이최근몇달동안약100건의프로덕션사고에대한근본원인을식별했으며,이는연간1,000시간이상의생산성절감과수백만달러상당의수익영향으로환산된다고합니다.위치인텔리전스기업Foursquare에서Deductive는ApacheSpark작업실패를진단하는데필요한시간을90%단축하여수시간또는며칠에서10분미만으로줄였으며,연간275,000달러이상의비용절감효과를가져왔습니다.​기술작동방식Deductive의기술적접근방식은Datadog이나NewRelic과같은기존옵저버빌리티플랫폼에추가되는AI기능들과차별화됩니다.이시스템은코드베이스,로그,메트릭,트레이스,내부문서간의관계를매핑하는'지식그래프'를구축합니다.인시던트가발생하면여러AI에이전트가함께협력하여가설을생성하고,이를실시간시스템증거와대조하며,근본원인에수렴합니다—숙련된사이트신뢰성엔지니어가조사하는방식을모방하지만훨씬짧은시간에작업을완료합니다.​플랫폼은기존인프라와읽기전용API를통해옵저버빌리티플랫폼,코드저장소,인시던트관리도구,커뮤니케이션시스템에연결됩니다.강화학습을활용하여지속적으로개선하며,각인시던트에서어떤조사액션이정확한진단으로이어졌는지학습합니다.​공동창립자이자CTO인SameerAgarwal은UCBerkeley에서BlinkDB라는근사쿼리처리프레임워크를개발하며박사학위를받았고,ApacheSpark를구축한초창기Databricks엔지니어중한명이었습니다.Kothari는ThoughtSpot의초기엔지니어로,분산쿼리처리와대규모시스템최적화에집중하는팀을리드했습니다.​"현대인프라의복잡성과상호의존성으로인해장애나인시던트의근본원인을조사하는일은마치건초더미에서바늘을찾는것같습니다.단,그건초더미는축구장크기이고,백만개의다른바늘로만들어졌으며,끊임없이재배열되며불타고있습니다,"라고Agarwal은성명에서밝혔습니다.​기술적으로는프로덕션환경에서바로수정작업을자동화할수있지만,현재회사는엔지니어가검증하고구현할수있도록구체적솔루션을추천하며사람의개입을유지하고있습니다.회사는데이터볼륨이아니라조사된인시던트수를기준으로가격을산정하며,클라우드호스팅과셀프호스팅배포옵션을모두제공합니다.
82 조회
0 추천
11.13 등록
(퍼플렉시티가정리한기사)우크라이나는수백대의요격드론을자율적으로조정하여들어오는위협에대응할수있는AI기반"드론방어벽"방어시스템을배치한최초의국가가되었으며,러시아의집중적인공중공격에맞서싸우는가운데방공기술의새로운지평을열었습니다.프랑스스타트업Atreyd가개발하고NATO혁신경진대회를통해선정된DWS-1시스템은이번달우크라이나에도착했으며몇주내에작전운용될것으로예상됩니다.이번배치는실제전투상황에서이러한방어시스템이테스트되는최초의사례입니다.​혁명적방어아키텍처이시스템은지상기지에서발사되는200대의1인칭시점요격드론으로구성되어있으며,Atreyd의창립자는이를하늘의"비행하는드론지뢰밭"이라고묘사했다.각드론은단몇천달러의비용이드는소형폭발탄두를탑재하고있으며,들어오는무기근처에서폭발하여목표물에도달하기전에위협을무력화하도록설계되었다.​인공지능을통해단일운영자가최대100대의드론을동시에제어할수있으며,시스템은감지된위협궤적에따라방어막의구조를자동으로조정한다.이기술은3D지형매핑과아군식별시스템을통합하여GPS가차단된환경에서도작동할수있도록하는데,이는러시아가우크라이나에서전자전을광범위하게사용하고있다는점을고려할때매우중요한능력이다.​Atreyd의창립자는BusinessInsider에"우리는스스로를방어의마지막계층으로간주합니다"라고말했다.위협을요격하지않은드론은재사용을위해발사플랫폼으로돌아올수있어운영비용을더욱절감할수있다.​NATO혁신을위한시험장Atreyd는2025년3월에시작된NATO의혁신도전과제에서러시아의활공폭탄과공격드론에대한대응책을개발하기위한3개최종후보중하나로선정되었습니다.다른최종후보로는독일의TYTANTechnologies와프랑스의AltaAres가있으며,이들도현재우크라이나에서테스트중인요격드론시스템을개발했습니다.​드론장벽은초기에러시아의Shahed형배회탄약으로부터도시와주요기반시설을방어할예정입니다.이러한탄약은전례없는수량으로우크라이나에발사되었으며,2025년첫10개월동안44,000발이상이발사되어2024년전체대비303%증가했습니다.이러한위협에대해성공적으로작동한다면,이시스템은전선에더가까이배치되어러시아의활공폭탄을요격할수있으며,이는대응하기매우어려운것으로악명높은파괴적인무기입니다.​​방어력저하속시급한필요이번배치는우크라이나의방공요격률이급격히감소함에따라이루어졌습니다.2025년10월,우크라이나군은들어오는드론의80%를요격했으며,이는연초의거의100%에서감소한수치입니다.지난달에만1,200대이상의러시아미사일과드론이우크라이나방어망을뚫고들어왔으며,이는2월의수치보다거의두배에달합니다.​러시아는최근샤헤드드론과활공폭탄모두에제트엔진을장착하여업그레이드했으며,이를통해더빠르게이동하고전선후방최대200킬로미터까지목표물을타격할수있게되었습니다.이러한개조는우크라이나의전통적인방공시스템에부담을주었으며,비용효율적인요격솔루션의중요성이점점더커지고있습니다.
84 조회
0 추천
11.13 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입