AI 뉴스

AI는 인간이 지나치게 합리적이라 가정한다는 연구 결과

페이지 정보

작성자 이수
작성일 2025.12.26 19:15
303 조회
0 추천
0 비추천

본문

S25013_CEN.jpg


이번 주 Journal of Economic Behavior & Organization에 게재된 연구에 따르면, 인공지능 시스템은 전략적 의사결정 시나리오에서 인간의 논리적 사고를 지속적으로 과대평가하는 것으로 나타났다. HSE University의 과학자들은 ChatGPT-4o와 Claude-Sonnet-4를 포함한 인기 있는 AI 모델들이 사람들을 실제보다 더 합리적이라고 가정하여, 모델들이 "너무 똑똑하게 플레이"하다가 경쟁 게임에서 지게 된다는 것을 발견했다.

​이 연구는 참가자들이 0에서 100 사이의 숫자를 선택하고, 그룹 평균의 절반에 가장 가까운 사람이 승자가 되는 고전적인 경제학 실험인 "숫자 맞추기 게임"에서 5개의 주요 AI 모델이 어떻게 수행되는지를 조사했다. HSE University의 Dmitry Dagaev, Sofia Paklina, Petr Parshakov와 University of Lausanne의 Iuliia Alekseenko 연구원들은 경제학과 1학년 학생부터 게임 이론 학회 참가자에 이르기까지 다양한 가상 상대를 대상으로 16가지 시나리오에서 모델들을 테스트했다.



AI는 규칙대로 플레이하지만, 인간은 그렇지 않다

모델들은 인간 플레이어가 선택할 것보다 지속적으로 더 낮은 숫자를 선택했으며, 이는 게임 이론 균형과 일치하는 보다 "합리적인" 접근 방식을 반영합니다. 고전적인 실험에서 인간들이 평균 27 정도를 선택했을 때, AI 모델은 상대방도 전략적으로 사고할 것이라고 가정하며 훨씬 더 낮은 숫자를 선택했습니다. The Brighter Side of News에 따르면, 이러한 패턴은 다양한 상대방 설명에서도 일관되게 나타났습니다—게임 이론 전문가를 상대할 때 AI는 0에 가까운 숫자를 선택한 반면, 대학생들을 상대로는 더 높은 숫자를 선택했습니다.
​이러한 격차는 AI가 인간 행동을 이해하는 방식의 근본적인 한계를 드러냅니다. 모델들이 상대방의 특성에 따라 선택을 조정하고 전략적 사고를 보여주었지만, 게임의 2인 버전에서 지배적 전략을 식별하는 데는 실패했습니다. Dagaev는 The Brighter Side of News에 "이러한 결과는 AI가 사람들과 마찬가지로 게임 구조의 변화에 반응한다는 것을 보여줍니다"라고 말했지만, 모델들이 "다른 사람들이 무엇을 할지에 대한 단계별 추론에 의존했다"고 덧붙였습니다.


AI 배포에 대한 시사점

연구 결과는 AI 시스템이 비즈니스 운영 및 의사결정 프로세스에서 점점 더 인간을 대체하고 있다는 점에서 중요한 의미를 지닙니다. Dagaev는 "우리는 이제 AI 모델이 많은 운영 작업에서 인간을 대체하기 시작하여 비즈니스 프로세스의 경제적 효율성을 높이는 단계에 있습니다"라고 말했습니다. "그러나 의사결정 작업에서는 LLM이 인간과 유사한 방식으로 행동하도록 보장하는 것이 종종 중요합니다."
​1930년대 영국 경제학자 존 메이너드 케인스(John Maynard Keynes)가 고안한 케인즈의 미인 대회는 참가자들이 단순히 자신의 최적 선택을 하는 것이 아니라 다른 사람들의 선택을 얼마나 잘 예측하는지를 테스트합니다. 이 게임은 성공이 다른 투자자들이 어떻게 행동할지 예측하는 데 달려 있는 금융 시장의 변동을 설명하는 데 오랫동안 사용되어 왔습니다.
​HSE 대학교의 기초 연구 프로그램의 지원을 받은 이 연구는 AI가 인간 행동과 일치하는 부분과 차이가 나는 부분을 이해하는 것이 이러한 시스템이 시장, 정책 및 일상 생활에 배치되는 방식을 형성할 것임을 시사합니다.



댓글 0
전체 1,366 / 18 페이지
Pendo의 수석 제품 디자이너인 Brian Greenbaum은 육아휴직 중 보낸 단 하나의 Slack 메시지로 회사 전체의 변화를 촉발시킨 후, 전체 제품 조직에 걸쳐 AI 도입을 이끌어내기 위한 실용적인 플레이북을 공유합니다.lennysnewsletter​ 그의 접근 방식은 동기식 실습 워크숍과 비동기식 학습 기회를 결합했으며, 법무, 보안, 재무 팀과 협력하여 명확한 정책을 수립함으로써 AI 도구 사용을 위한 "황금 경로"를 확립했습니다.lennysnewsletter​ 이 이니셔티브는 Greenbaum의 개인 기여자 역할을 넘어 그의 경력을 변화시켰으며, 회사 전략에 영향을 미치고 조직의 AI 챔피언으로 자리매김할 수 있는 기회를 열어주었습니다—이는 AI 도입을 주도하는 것이 어떻게 중요한 경력 가속기 역할을 할 수 있는지를 보여줍니다.lennysnewsletter​ https://www.lennysnewsletter.com/p/how-to-get-your-whole-team-excited https://www.lennysnewsletter.com/p/this-week-on-how-i-ai-how-to-get
301 조회
0 추천
2025.12.26 등록
Nate's Newsletter는 Claude Code가 오해의 소지가 있는 이름이라고 주장하는데, Anthropic의 12월 릴리스는 소프트웨어 개발이 아니라 브라우저 자동화, Slack 통합, 모바일 위임, 그리고 비기술 사용자들이 코드 작성 없이 활용할 수 있는 조직 워크플로우 도구에 초점을 맞췄기 때문이다.natesnewsletter.substack​ 이 가이드는 29페이지의 설정 지침, 양식 작성, 경쟁 조사, 회의 처리, 파일 정리를 포함한 10가지 단계별 프로덕션 워크플로우, 그리고 완전한 자율 위임이 아닌 빈번한 체크포인트를 통한 반복적 협업을 통해 Claude에게 작업을 위임하는 프레임워크를 제공한다.natesnewsletter.substack​ Anthropic의 내부 연구에 따르면 사용자들은 Claude로 업무의 60%를 완료하고 50%의 생산성 향상을 달성하며, Claude Code는 2025년 5월 공개 출시 후 단 6개월 만에 연간 10억 달러의 수익을 달성했다.venturebeat+1​ https://natesnewsletter.substack.com/p/the-complete-wait-i-can-use-claude https://venturebeat.com/ai/anthropics-claude-code-can-now-read-your-slack-messages-and-write-code-for https://simonwillison.net/2025/Oct/20/claude-code-for-web/ https://x.com/DanielMiessler/status/2002485123040817525 https://www.gend.co/blog/automate-code-sessions-with-claude-in-slack https://en.wikipedia.org/wiki/Claude_(language_model) https://code.claude.com/docs/en/slack https://techcrunch.com/2025/10/20/anthropic-brings-claude-code-to-the-web/ https://x.com/mattyglesias/status/2002388080460812420 https://www.codegpt.co/blog/anthropic-claude-models-complete-guide https://x.com/simonw/status/2002416381980213307 https://www.salesforce.com/news/stories/claude-code-in-slack/ https://www.datastudios.org/post/all-claude-ai-models-available-in-2025-full-list-for-web-app-api-and-cloud-platforms https://bsky.app/profile/mattyglesias.bsky.social https://www.reddit.com/r/ClaudeCode/comments/1phuzfs/claude_code_in_slack_signals_shift_to/ https://www.anthropic.com/claude/sonnet https://x.com/LBacaj/status/2002446302744097050 https://n8n.io/integrations/claude/and/slack/ https://support.claude.com/en/articles/12138966-release-notes https://www.slowboring.com/p/mailbag-more-philosophical-than-usual https://vertu.com/lifestyle/the-ai-model-race-reaches-singularity-speed/ https://claude-plugins.dev/skills/@greyhaven-ai/claude-code-config/browser-automation https://claude-plugins.dev/skills/@chriscarterux/chris-claude-stack/effective-delegation-patterns https://newsroom.accenture.com/news/2025/accenture-and-anthropic-launch-multi-year-partnership-to-drive-enterprise-ai-innovation-and-value-across-industries https://www.datacamp.com/tutorial/claude-for-chrome-ai-powered-browser-assistance-automation https://claude-plugins.dev/skills/@rsmdt/the-startup/agent-delegation https://www.youtube.com/watch?v=4ue4CNt8YxE https://code.claude.com/docs/en/chrome https://www.youtube.com/watch?v=0J2_YGuNrDo https://www.anthropic.com/news https://github.com/SawyerHood/dev-browser https://www.youtube.com/watch?v=oZF6TgxB5yw https://www.snowflake.com/en/news/press-releases/snowflake-and-anthropic-announce-200-million-partnership-to-bring-agentic-ai-to-global-enterprises/ https://www.reddit.com/r/ClaudeAI/comments/1prcypb/anthropic_just_dropped_claude_for_chrome_ai_that/ https://claude.ai/public/artifacts/7029f156-12d7-4680-9df4-5af4715e0612 https://www.anthropic.com/news/snowflake-anthropic-expanded-partnership https://www.youtube.com/watch?v=XYzs8JJAL24 https://www.reddit.com/r/ClaudeAI/comments/1obq6wq/understanding_claude_skills_vs_subagents_its_not/ https://techcrunch.com/2025/12/04/anthropic-signs-200m-deal-to-bring-its-llms-to-snowflakes-customers/ https://www.anthropic.com/engineering/claude-code-best-practices
349 조회
0 추천
2025.12.26 등록
Meta의 퇴임하는 수석 AI 과학자이자 튜링상 수상자인 Yann LeCun은 AI 팟캐스트 "The Information Bottleneck"에서 "일반 지능"이라는 개념을 "완전한 헛소리"라고 선언했으며, 이에 Google DeepMind CEO Demis Hassabis가 X에서 LeCun이 "명백히 틀렸다"며 일반 지능과 보편 지능을 혼동하고 있다고 공개적으로 반박했다.the-decoder​LeCun은 인간의 지능이 일반적이라기보다는 고도로 특화되어 있으며—우리가 이해할 수 없는 문제를 상상할 수 없기 때문에 생긴 착각이라고 주장하는 반면, Hassabis는 뇌와 AI 기반 모델이 충분한 시간, 메모리, 데이터가 주어지면 계산 가능한 모든 것을 학습할 수 있는 근사 튜링 머신으로 기능한다고 반박한다.the-decoder+1​이 공개적인 의견 충돌은 DeepMind가 인공 일반 지능 달성에 대한 자신감이 커지고 있음을 보여주며, 공동 창립자 Shane Legg는 12월 중순 회사 공식 팟캐스트에서 많은 인간 인지 작업을 처리할 수 있는 "최소한의 AGI" 형태가 이르면 2028년에 도래할 수 있다고 밝혔다.the-decoder​youtube​https://the-decoder.com/yann-lecun-calls-general-intelligence-complete-bs-and-deepmind-ceo-hassabis-fires-back-publicly/https://www.the-information-bottleneck.com/ep20-yann-lecun/https://www.youtube.com/watch?v=l3u_FAv33G0
302 조회
0 추천
2025.12.26 등록
2025년 말, 음악 산업의 지형도를 뒤흔드는 상징적인 사건이 발생했습니다. 세계적인 거대 레이블 워너 뮤직 그룹(WMG)이 생성형 AI 음악 플랫폼 수노(Suno)와 극적인 합의에 도달하며, 적대적 소송 관계를 끝내고 공식적인 파트너십을 체결한 것입니다. 이번 합의는 기술적 혁신과 저작권 보호라는 팽팽한 갈등 사이에서 음악 산업이 나아갈 새로운 공존의 길을 제시하고 있습니다.이번 파트너십의 핵심은 아티스트의 권리를 철저히 보장하는 ‘선택적 참여(Opt-in)’ 모델에 있습니다. 과거 AI 기업들이 저작물을 무단으로 학습시키며 비판을 받았던 것과 달리, 이제 워너 뮤직 소속 아티스트들은 자신의 목소리와 음악적 자산을 AI 학습에 제공할지 여부를 스스로 결정하게 됩니다. 이는 아티스트의 고유한 정체성을 데이터 자산으로 인정하고, 그 활용 과정에서 발생하는 수익을 정당하게 배분하겠다는 의지의 표명입니다.수노는 이번 합의를 기점으로 단순한 생성 도구를 넘어 종합적인 음악 생태계로의 진화를 꾀하고 있습니다. 특히 공연 정보 플랫폼 ‘송킥(Songkick)’을 인수하며 온라인의 AI 창작물과 오프라인의 라이브 공연 경험을 연결하려는 행보는 주목할 만합니다. 또한 무료 사용자의 무분별한 콘텐츠 생성을 제한하고 유료 모델을 강화함으로써, 이른바 ‘AI 슬롭(Slop)’이라 불리는 저품질 콘텐츠의 범람을 막고 시장의 질서를 잡으려는 노력도 병행하고 있습니다.이러한 변화는 음악 산업에 깊은 통찰을 던져줍니다. 무엇보다 이번 사건은 AI 기술의 흐름을 법적으로 막아설 수 없다는 현실을 인정한 레이블들이, 기술을 제도권 안으로 끌어들여 새로운 ‘라이선스 수익 모델’을 창출하는 실리를 택했음을 보여줍니다. 이제 음악은 완성된 결과물을 소비하는 단계를 넘어, 아티스트의 목소리와 스타일 자체가 거래되는 새로운 가치 사슬을 형성하게 되었습니다.결국 이번 합의는 AI가 음악적 영감을 훼손하는 위협이 아니라, 팬들이 아티스트의 자산을 활용해 상호작용할 수 있는 새로운 창작의 도구가 될 수 있음을 시사합니다. 기술의 풍요로움이 인간의 창의성과 결합하여 음악 산업의 가치를 높일 수 있을지, 아니면 단순한 상업적 도구로 전락할지는 향후 구축될 투명한 보상 체계와 윤리적 운영에 달려 있습니다.
300 조회
0 추천
2025.12.26 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입