Loading...

AI 뉴스

Sora 2 결함으로 오디오 통해 시스템 프롬프트 추출 가능

페이지 정보

작성자 xtalfi
작성일 2025.11.14 16:20
1,442 조회
0 추천
0 비추천

본문

a8e2d21c39ea4f8faffe793ea55724f8.jpg

(퍼플렉시티가 정리한 기사)


AI 보안 회사 Mindgard가 11월 12일 공개한 보고서에 따르면, OpenAI의 Sora 2 비디오 생성 모델의 취약점으로 인해 공격자가 오디오 전사를 통해 숨겨진 시스템 프롬프트를 추출할 수 있다고 합니다. 이번 발견은 텍스트, 이미지, 비디오, 오디오 간의 변환이 정보 유출을 위한 예상치 못한 경로를 만드는 멀티모달 AI 시스템의 새로운 보안 과제를 강조합니다.​


오디오 전사가 보안 장치를 우회합니다

Aaron Portnoy가 이끄는 Mindgard 연구원들은 11월 3일 Sora 2를 대상으로 실험을 시작했으며, 15초 길이의 짧은 클립으로 음성을 생성하는 것이 모델의 기초 명령어를 복구하는 가장 충실도 높은 방법임을 발견했습니다. 전통적인 시각적 방법은 이미지와 비디오 프레임에 렌더링된 텍스트가 시퀀스 전반에 걸쳐 빠르게 왜곡되어 글자가 읽을 수 없는 근사치로 변형되면서 실패했습니다. QR 코드와 같은 인코딩된 형식 역시 똑같이 신뢰할 수 없는 것으로 판명되었으며, Mindgard의 보고서에 따르면 "시각적으로는 그럴듯하지만 디코딩 가능한 횡설수설"을 생성했습니다.​

획기적인 발견은 연구원들이 Sora 2에게 시스템 프롬프트의 일부를 말하도록 요청했을 때 이루어졌으며, 시간 제한 내에 더 많은 내용을 담기 위해 종종 가속화된 속도로 진행되었습니다. 이러한 오디오 클립을 전사하고 조각들을 이어 붙임으로써, 그들은 메타데이터를 먼저 생성하고, 명시적으로 요청되지 않는 한 저작권이 있는 캐릭터를 피하며, 성적으로 암시적인 콘텐츠를 금지하는 등의 규칙을 드러내는 거의 완전한 시스템 프롬프트를 재구성했습니다.​


AI 보안에 대한 광범위한 영향

OpenAI는 11월 4일 다중모달 시스템 전반의 프롬프트 추출 위험에 대한 일반적인 인식을 언급하며 이 취약점을 인정했다. Sora 2의 시스템 프롬프트 자체에는 매우 민감한 데이터가 포함되어 있지 않지만, 보안 연구원들은 시스템 프롬프트가 행동 가드레일로 기능하며 구성 비밀로 취급되어야 한다고 강조한다. Mindgard는 보고서에서 "시스템 프롬프트는 모델 안전 경계를 정의하며, 유출될 경우 후속 공격을 가능하게 할 수 있다"고 밝혔다.​

이 취약점은 다중모달 모델의 고유한 약점을 악용하는데, 변환 과정에서 의미적 표류가 누적된다. AI 시스템이 여러 데이터 유형을 처리함에 따라 시스템 지침을 보호하는 것이 점점 더 어려워지고 있다. Mindgard는 개발자들이 시스템 프롬프트를 독점 정보로 취급하고, 오디오 및 비디오 출력에서 유출을 테스트하며, 생성물에 길이 제한을 구현할 것을 권장한다.​

이번 공개는 9월 말에 출시된 Sora 2에 대한 광범위한 조사가 이루어지는 가운데 나왔다. Public Citizen은 11월 11일 딥페이크와 유해 콘텐츠에 대한 우려를 이유로 OpenAI에 이 도구를 임시 철회할 것을 촉구했다. OpenAI는 Sora 2에 여러 안전 계층이 포함되어 있다고 주장해왔지만, 비평가들은 그 효과에 의문을 제기하고 있다.

댓글 0
전체 1,366 / 24 페이지
Nate's Newsletter는 Claude Code가 오해의 소지가 있는 이름이라고 주장하는데, Anthropic의 12월 릴리스는 소프트웨어 개발이 아니라 브라우저 자동화, Slack 통합, 모바일 위임, 그리고 비기술 사용자들이 코드 작성 없이 활용할 수 있는 조직 워크플로우 도구에 초점을 맞췄기 때문이다.natesnewsletter.substack​ 이 가이드는 29페이지의 설정 지침, 양식 작성, 경쟁 조사, 회의 처리, 파일 정리를 포함한 10가지 단계별 프로덕션 워크플로우, 그리고 완전한 자율 위임이 아닌 빈번한 체크포인트를 통한 반복적 협업을 통해 Claude에게 작업을 위임하는 프레임워크를 제공한다.natesnewsletter.substack​ Anthropic의 내부 연구에 따르면 사용자들은 Claude로 업무의 60%를 완료하고 50%의 생산성 향상을 달성하며, Claude Code는 2025년 5월 공개 출시 후 단 6개월 만에 연간 10억 달러의 수익을 달성했다.venturebeat+1​ https://natesnewsletter.substack.com/p/the-complete-wait-i-can-use-claude https://venturebeat.com/ai/anthropics-claude-code-can-now-read-your-slack-messages-and-write-code-for https://simonwillison.net/2025/Oct/20/claude-code-for-web/ https://x.com/DanielMiessler/status/2002485123040817525 https://www.gend.co/blog/automate-code-sessions-with-claude-in-slack https://en.wikipedia.org/wiki/Claude_(language_model) https://code.claude.com/docs/en/slack https://techcrunch.com/2025/10/20/anthropic-brings-claude-code-to-the-web/ https://x.com/mattyglesias/status/2002388080460812420 https://www.codegpt.co/blog/anthropic-claude-models-complete-guide https://x.com/simonw/status/2002416381980213307 https://www.salesforce.com/news/stories/claude-code-in-slack/ https://www.datastudios.org/post/all-claude-ai-models-available-in-2025-full-list-for-web-app-api-and-cloud-platforms https://bsky.app/profile/mattyglesias.bsky.social https://www.reddit.com/r/ClaudeCode/comments/1phuzfs/claude_code_in_slack_signals_shift_to/ https://www.anthropic.com/claude/sonnet https://x.com/LBacaj/status/2002446302744097050 https://n8n.io/integrations/claude/and/slack/ https://support.claude.com/en/articles/12138966-release-notes https://www.slowboring.com/p/mailbag-more-philosophical-than-usual https://vertu.com/lifestyle/the-ai-model-race-reaches-singularity-speed/ https://claude-plugins.dev/skills/@greyhaven-ai/claude-code-config/browser-automation https://claude-plugins.dev/skills/@chriscarterux/chris-claude-stack/effective-delegation-patterns https://newsroom.accenture.com/news/2025/accenture-and-anthropic-launch-multi-year-partnership-to-drive-enterprise-ai-innovation-and-value-across-industries https://www.datacamp.com/tutorial/claude-for-chrome-ai-powered-browser-assistance-automation https://claude-plugins.dev/skills/@rsmdt/the-startup/agent-delegation https://www.youtube.com/watch?v=4ue4CNt8YxE https://code.claude.com/docs/en/chrome https://www.youtube.com/watch?v=0J2_YGuNrDo https://www.anthropic.com/news https://github.com/SawyerHood/dev-browser https://www.youtube.com/watch?v=oZF6TgxB5yw https://www.snowflake.com/en/news/press-releases/snowflake-and-anthropic-announce-200-million-partnership-to-bring-agentic-ai-to-global-enterprises/ https://www.reddit.com/r/ClaudeAI/comments/1prcypb/anthropic_just_dropped_claude_for_chrome_ai_that/ https://claude.ai/public/artifacts/7029f156-12d7-4680-9df4-5af4715e0612 https://www.anthropic.com/news/snowflake-anthropic-expanded-partnership https://www.youtube.com/watch?v=XYzs8JJAL24 https://www.reddit.com/r/ClaudeAI/comments/1obq6wq/understanding_claude_skills_vs_subagents_its_not/ https://techcrunch.com/2025/12/04/anthropic-signs-200m-deal-to-bring-its-llms-to-snowflakes-customers/ https://www.anthropic.com/engineering/claude-code-best-practices
668 조회
0 추천
2025.12.26 등록
Meta의 퇴임하는 수석 AI 과학자이자 튜링상 수상자인 Yann LeCun은 AI 팟캐스트 "The Information Bottleneck"에서 "일반 지능"이라는 개념을 "완전한 헛소리"라고 선언했으며, 이에 Google DeepMind CEO Demis Hassabis가 X에서 LeCun이 "명백히 틀렸다"며 일반 지능과 보편 지능을 혼동하고 있다고 공개적으로 반박했다.the-decoder​LeCun은 인간의 지능이 일반적이라기보다는 고도로 특화되어 있으며—우리가 이해할 수 없는 문제를 상상할 수 없기 때문에 생긴 착각이라고 주장하는 반면, Hassabis는 뇌와 AI 기반 모델이 충분한 시간, 메모리, 데이터가 주어지면 계산 가능한 모든 것을 학습할 수 있는 근사 튜링 머신으로 기능한다고 반박한다.the-decoder+1​이 공개적인 의견 충돌은 DeepMind가 인공 일반 지능 달성에 대한 자신감이 커지고 있음을 보여주며, 공동 창립자 Shane Legg는 12월 중순 회사 공식 팟캐스트에서 많은 인간 인지 작업을 처리할 수 있는 "최소한의 AGI" 형태가 이르면 2028년에 도래할 수 있다고 밝혔다.the-decoder​youtube​https://the-decoder.com/yann-lecun-calls-general-intelligence-complete-bs-and-deepmind-ceo-hassabis-fires-back-publicly/https://www.the-information-bottleneck.com/ep20-yann-lecun/https://www.youtube.com/watch?v=l3u_FAv33G0
583 조회
0 추천
2025.12.26 등록
2025년 말, 음악 산업의 지형도를 뒤흔드는 상징적인 사건이 발생했습니다. 세계적인 거대 레이블 워너 뮤직 그룹(WMG)이 생성형 AI 음악 플랫폼 수노(Suno)와 극적인 합의에 도달하며, 적대적 소송 관계를 끝내고 공식적인 파트너십을 체결한 것입니다. 이번 합의는 기술적 혁신과 저작권 보호라는 팽팽한 갈등 사이에서 음악 산업이 나아갈 새로운 공존의 길을 제시하고 있습니다.이번 파트너십의 핵심은 아티스트의 권리를 철저히 보장하는 ‘선택적 참여(Opt-in)’ 모델에 있습니다. 과거 AI 기업들이 저작물을 무단으로 학습시키며 비판을 받았던 것과 달리, 이제 워너 뮤직 소속 아티스트들은 자신의 목소리와 음악적 자산을 AI 학습에 제공할지 여부를 스스로 결정하게 됩니다. 이는 아티스트의 고유한 정체성을 데이터 자산으로 인정하고, 그 활용 과정에서 발생하는 수익을 정당하게 배분하겠다는 의지의 표명입니다.수노는 이번 합의를 기점으로 단순한 생성 도구를 넘어 종합적인 음악 생태계로의 진화를 꾀하고 있습니다. 특히 공연 정보 플랫폼 ‘송킥(Songkick)’을 인수하며 온라인의 AI 창작물과 오프라인의 라이브 공연 경험을 연결하려는 행보는 주목할 만합니다. 또한 무료 사용자의 무분별한 콘텐츠 생성을 제한하고 유료 모델을 강화함으로써, 이른바 ‘AI 슬롭(Slop)’이라 불리는 저품질 콘텐츠의 범람을 막고 시장의 질서를 잡으려는 노력도 병행하고 있습니다.이러한 변화는 음악 산업에 깊은 통찰을 던져줍니다. 무엇보다 이번 사건은 AI 기술의 흐름을 법적으로 막아설 수 없다는 현실을 인정한 레이블들이, 기술을 제도권 안으로 끌어들여 새로운 ‘라이선스 수익 모델’을 창출하는 실리를 택했음을 보여줍니다. 이제 음악은 완성된 결과물을 소비하는 단계를 넘어, 아티스트의 목소리와 스타일 자체가 거래되는 새로운 가치 사슬을 형성하게 되었습니다.결국 이번 합의는 AI가 음악적 영감을 훼손하는 위협이 아니라, 팬들이 아티스트의 자산을 활용해 상호작용할 수 있는 새로운 창작의 도구가 될 수 있음을 시사합니다. 기술의 풍요로움이 인간의 창의성과 결합하여 음악 산업의 가치를 높일 수 있을지, 아니면 단순한 상업적 도구로 전락할지는 향후 구축될 투명한 보상 체계와 윤리적 운영에 달려 있습니다.
568 조회
0 추천
2025.12.26 등록
OpenAI는 “hazelnuts”라는 코드명의 새로운 “Skills” 기능을 ChatGPT에 테스트 중이며, 이를 통해 사용자는 슬래시 명령어를 통해 맞춤 지시사항에 액세스할 수 있고, Skills 편집기와 맞춤 GPT를 스킬로 변환하는 옵션이 제공되며, 2026년 1월에 출시될 것으로 예상됩니다.Skills는 AI 시스템에 특정 능력과 워크플로우를 가르치는 폴더 기반 지시사항으로, 12월 18일 agentskills.io에서 Anthropic이 공개한 오픈 스탠다드를 따르며, OpenAI는 이미 지난주 자사의 Codex 코딩 에이전트에 이를 조용히 도입했습니다.Microsoft, GitHub, 그리고 Cursor와 Goose를 포함한 인기 있는 코딩 에이전트들은 이미 Agent Skills 표준을 통합했으며, 이는 여러 스킬을 효율적으로 함께 쌓을 수 있는 이 접근 방식의 광범위한 업계 채택을 나타냅니다.
593 조회
0 추천
2025.12.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입