Loading...

AI 뉴스

METR 연구결과 "AI 쓰면 개발이 더 느리다"

페이지 정보

작성자 JeromePark
작성일 2025.07.17 09:00
510 조회
0 추천
0 비추천

본문

METR은 AI 도구를 사용하는 경우 개발이 더 느려질 수 있다는 연구결과를 발표했다.

(연구결과 한글 요약 : 퍼플렉시티 사용)

https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/

Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity

ec389eaae94d0fcceecc1d8611f106a73d4607d46pl2.png

이 연구는 2025년 초 AI 도구가 숙련된 오픈소스 개발자의 생산성에 미치는 영향을 실험적으로 조사한 randomized controlled trial(RCT) 결과이며. 주요 내용은 다음과 같습니다:

연구 대상 및 방법:
16명의 경험 많은 오픈소스 개발자가 본인이 여러 해 기여해온 대형 저장소(평균 22,000+ 스타, 100만 줄 이상 코드)에서 해결이 필요한 실제 이슈 246개를 무작위로 AI 도구 사용 허용 그룹과 비허용 그룹에 배정받아 처리했습니다. AI 도구는 주로 Cursor Pro와 Claude 3.5/3.7 Sonnet 모델을 사용했으며, 업무 시간과 화면 녹화를 기록하고 개발자가 스스로 소요 시간을 보고하였습니다.

핵심 결과:
AI 도구를 쓸 때 개발자들은 평균 19% 더 오래 걸려 작업 속도가 느려지는 결과가 나왔습니다. 이는 개발자들의 사전 예상(24% 속도 향상 기대)과 현저히 다르며, 심지어 체험 후에도 AI가 20% 빠르게 해줬다고 오판함을 보여줍니다.

분석 및 해석:
다양한 잠재 요인 20개를 조사하여 5개의 주요 원인이 존재할 가능성이 제기되었고, 품질 저하 없이 결과의 신뢰성을 보장하기 위해 여러 통계 검증과 반복 분석을 했습니다. AI가 실제 작업을 느리게 만든다는 이번 결과는 여러 코딩 벤치마크나 개발자들의 체감 AI 도움 효과와 모순되지만, 그 이유로는 평가 기준, 사용 조건, 작업 유형 차이, AI 도구의 학습 곡선, 높은 품질 기준 등 여러 변수가 제시됩니다.

의의 및 향후 방향:
이 연구는 AI가 현실적인 개발 환경에서 즉각적으로 생산성을 향상시키지 못했다는 점을 보여주는 ‘스냅샷’이며, 향후 AI 기능 발전에 따른 추이 분석을 계획 중입니다. 또한 AI 가속화가 AI 연구개발에 끼치는 영향과 관련해 매우 중요한 증거를 보완해 주는 연구로 평가됩니다.

한계 및 주의점:
연구 결과가 모든 개발자나 모든 개발 환경에 일반화되는 것은 아니며, AI 도구의 활용법, 숙련도, 업무 유형에 따라 효과가 다를 수 있고, AI 기술 또한 빠르게 진화하고 있음을 명시합니다.

요약하자면, 2025년 초 기준으로 AI 도구가 숙련된 오픈소스 개발자들의 작업 속도를 오히려 약 19% 느리게 했으며, 이는 AI 기술의 현실적 영향에 대한 통찰과 AI 발전의 지속적인 모니터링 필요성을 강조하는 중요한 연구입니다

--

참고로 METR은 어떤 연구단체인가

METR(모델 평가 및 위협 연구, Model Evaluation & Threat Research)

METR는 첨단 AI 시스템의 평가와 위험성 연구를 수행하는 비영리 연구기관입니다. 주요 특징은 다음과 같습니다:

설립 배경과 목적

2022년 설립된 METR는 AI 시스템이 사회에 미칠 잠재적 위험성, 특히 자율성과 고도화된 AI 시스템이 가져올 수 있는 '파국적 위험'을 사전에 평가하는 데 목적을 두고 있습니다12.

인간의 개입 없이도 복잡한 임무를 수행할 수 있는 AI(에이전트) 시스템의 능력을 연구하고, 이 기술이 AI 연구개발(R&D) 자체를 가속할 가능성과 그로 인한 새로운 위험을 중심적으로 분석합니다34.

활동과 연구 방식

실제 AI 시스템이 얼마나 ‘현실적’으로 복잡하고 장기적인 작업을 자율적으로 완료할 수 있는지 다양한 평가 실험과 벤치마크, 현장 실험(RCT) 등을 통해 측정합니다34.

AI의 성능 뿐만 아니라, AI 사용 시 발생할 수 있는 리스크 요인, 사회적 영향, 정책적 대응 방안 등도 함께 연구합니다.

주요 프로젝트로는 AI가 사람 없이도 여러 시간에 걸쳐 과업을 수행할 수 있는지 평가하는 벤치마킹, AI 거버넌스 모델 실험, 시대별 AI 성능 성장량 측정 등이 있습니다4.

위치 및 조직

METR는 미국에 기반을 둔 비영리 단체이며, 연구 구성원들은 AI 연구 및 안전성 분야의 전문 인력들로 이루어져 있습니다1.

오픈AI 등 AI 연구단체 출신 인사들도 합류해 있으며, 신뢰성, 공공성, 투명성을 중시합니다2.

기타

순수 기부금으로 운영되고, 기업이나 특정 이해관계자로부터 독립적으로 연구를 수행합니다31.

사회와 AI 기업, 정책당국이 첨단 AI의 위험 및 역량을 객관적으로 이해하는 데 필요한 과학적 평가 기준을 만드는 것을 목표로 합니다45.

METR는 이번 연구처럼, 실제 전문가 개발자들이 사용하는 AI 시스템이 현실적으로 어떤 영향을 미치는지 실험적으로 평가하는 등, 미래에 있을 AI 발전이 갖는 의미와 위험에 대해 선제적으로 조망하는 기관

댓글 0
전체 189 / 42 페이지
AI 가 자꾸 자신들이 제공 하지 않는 기능을 제공 한다고 소개 하는 바람에 그 기능을 아예 구현 해버리기로 한 사이트가 화제가 되고 있다 그 사이트는 soundslice 라는 악보 사이트 . Soundslice라는 악보 스캔 서비스**ChatGPT의 잘못된 안내**로 인해 새로운 기능을 도입 - 최근 Soundslice에는 악보 사진 대신 **ChatGPT 대화창의 스크린샷**(특히 기타용 ASCII 탭 악보)이 다수 업로드되는 현상이 발생했습니다. - 조사 결과, **ChatGPT가 사용자들에게 Soundslice에서 ASCII 탭을 업로드하면 오디오로 들을 수 있다고 잘못 안내**하고 있었던 것이 원인이었습니다. - 하지만 실제로 Soundslice는 해당 기능을 지원하지 않았고, 이로 인해 사용자들이 잘못된 기대를 갖게 되었습니다. - 회사는 고민 끝에, **실제로 ASCII 탭을 지원하는 기능을 새로 개발**해 추가하기로 결정했습니다. - 저자는 이 사례가 “AI가 잘못 안내한 기능을 실제로 개발하게 된 첫 사례”일 수 있다고 밝히며, **잘못된 정보에 대응해 제품을 개발하는 것이 맞는지 고민**된다는 소회를 전합니다[1][2]. 출처 [1] Adding a feature because ChatGPT incorrectly thinks it exists https://www.holovaty.com/writing/chatgpt-fake-feature/ [2] [AI넷] [ChatGPT로 자동 글로벌 뉴스 브리핑을 받는다.] OpenAI의 ... https://www.ainet.link/18547
539 조회
1 추천
2025.07.08 등록
OpenAI Experiments with Study Feature and New ChatGPT Integrations OpenAI는 교육 및 직장 연구 분야에서 ChatGPT 의 사용 사례를 확장하는 새로운 기능을 개발하는 것으로 알려졌다 최근 테스트 중인 두 가지 업데이트에는 잠재적인 학습 모드와 연구 보조 도구에 대한 추가 통합이 포함된다. 아직 출시되지 않은 기능 중 하나인 '함께 공부하기(Study Together)'는 5월에 처음 발견 되었으며 최근 빌드 에서 확인된다. 현재 작동하지는 않지만, 참고 자료에 따르면 학생들이 친구와 함께 또는 ChatGPT를 학습 도구로 사용하여 시험을 준비할 수 있도록 지원할 수 있을 것으로 보인다. 이 모드는 플랫폼 내에서 더욱 협력적이고 교육적인 활용 사례로의 전환을 시사한다. 출시될 경우, 학생들이 ChatGPT 내에서 직접 학술 자료에 참여할 수 있는 옵션을 제공하게 된다 이와 함께 OpenAI는 사용자 입력을 기반으로 정보를 수집하고 정리하는 과정을 자동화하는 AI 기능인 Deep Research의 업데이트를 테스트하는 것으로 알려졌다.
594 조회
0 추천
2025.07.08 등록
Cursor의 CEO 마이클 트루엘(Michael Truell)은 회사의 월 20달러 Pro 요금제에 대한 가격 변경 사항이 제대로 전달되지 않은 점에 대해 사과했습니다. 이 요금제는 요청 기반 제한에서 컴퓨트 기반 모델로 전환되었으며, 많은 사용자들이 월 할당량을 빠르게 소진하면서 예상치 못한 추가 비용에 직면하게 되었습니다. 사용자들의 분노를 촉발한 핵심 문제는 특히 고급 AI 모델을 사용할 때 새로운 월 $20 할당량이 너무 빨리 소진된다는 점이었습니다. 많은 사용자들이 Anthropic의 Claude 모델을 사용할 때 몇 번의 프롬프트만으로 요청 한도가 소진된다고 보고했으며, 이 모델은 특히 코딩 작업에 인기가 많습니다12. 상황은 Cursor의 "자동 모드"(용량에 따라 AI 모델을 자동으로 선택하는 기능)만이 Pro 구독자에게 무제한 사용을 계속 제공한다는 사실로 인해 더욱 악화되었습니다 이에 대한 반발로 Cursor는 2025년 6월 16일부터 7월 4일 사이에 예기치 않게 요금이 청구된 모든 사용자에게 전액 환불을 제공하고 있습니다. 해당 사용자는 propricing@cursor.com으로 이메일을 보내 환불을 신청할 수 있습니다34. 회사는 또한 Pro 요금제에 이제 Tab 및 자동 모드의 모델 무제한 사용, 매월 API 가격 기준 $20 상당의 "프론티어 모델" 사용, 그리고 추가 프론티어 모델 사용을 원가로 구매할 수 있는 옵션이 포함된다고 명확히 밝혔습니다4
655 조회
1 추천
2025.07.08 등록
메타, 애플의 '파운데이션 모델' 팀 엔지니어 영입 기사 요약 - 퍼플렉시티 애플의 인공지능(AI) 파운데이션 모델 팀을 이끌던 루오밍 팡(Ruoming Pang) 엔지니어가 메타로 이직했습니다. 팡은 2021년 구글에서 애플로 합류해 약 100명 규모의 팀을 이끌며, 애플 인텔리전스(Apple Intelligence) 기능에 활용되는 대형 언어 모델(LLM) 개발을 주도했습니다1234. 메타는 팡을 영입하기 위해 연 수십억 원(수백만 달러) 이상의 파격적인 연봉 패키지를 제시한 것으로 알려졌습니다. 이는 마크 저커버그 CEO가 주도하는 AI 슈퍼인텔리전스 랩(Superintelligence Labs) 인재 영입 전략의 일환입니다. 메타는 최근 오픈AI, 앤트로픽 등 경쟁사 인재들도 대거 영입하고 있습니다2345. **팡의 이탈은 애플의 자체 AI 모델 개발에 큰 타격**으로 평가됩니다. 애플은 최근 내부적으로 오픈AI, 앤트로픽 등 외부 모델 도입을 검토하는 등, 자체 모델 개발과 외부 협력 사이에서 방향성을 고민하고 있었습니다. 팡이 이끌던 팀은 앞으로 천즈펑(Chen Zhifeng) 등 새로운 리더십 아래 재편될 예정입니다367. 메타는 AI 경쟁력 강화를 위해 대규모 투자와 인재 영입을 이어가고 있으며, 팡은 메타의 차세대 AI 모델 개발에 핵심 역할을 맡을 전망입니다. 이번 인재 영입은 빅테크 기업 간 AI 인재 쟁탈전이 한층 치열해지고 있음을 보여줍니다45. 핵심 요약 애플 AI 핵심 인재 루오밍 팡, 메타로 이직 메타, 연 수십억 원 규모 파격 연봉 제시 애플 AI 전략 및 조직에 큰 변화 예상 메타, 슈퍼인텔리전스 랩 중심으로 AI 인재 대거 영입 중 https://www.bloomberg.com/news/articles/2025-07-07/apple-loses-its-top-ai-models-executive-to-meta-s-hiring-spreehttps://9to5mac.com/2025/07/07/meta-just-hired-apples-head-of-foundation-models/https://www.capitalbrief.com/briefing/meta-hires-apples-top-executive-in-charge-of-ai-models-bloomberg-0bbf9162-4757-4282-bfe7-edc8cf08c557/https://fortune.com/2025/07/07/apple-top-ai-executive-meta-hiring-spree-superintelligence-team-pay-package/https://www.investing.com/news/stock-market-news/meta-lures-apples-top-ai-executive-in-latest-talent-coup-bloomberg-reports-4125542https://www.macrumors.com/2025/07/07/apple-ai-executive-leaves-for-meta/https://appleinsider.com/articles/25/07/07/meta-poaches-apple-intelligence-executive-amid-larger-leadership-restructurehttps://x.com/9to5mac/status/1942347765633163658https://www.imd.org/entity-profile/meta-platforms-ai-maturity/https://finance.yahoo.com/news/apples-top-ai-executive-ruoming-224044121.htmlhttps://ai.meta.com/blog/building-with-ai-across-all-of-meta/?bxid=5be9d5af2ddf9c72dc1f8e2b&cndid=32424085&esrc=WIRED_CRMSeries&mbid=CRMWIR092120https://news.bloomberglaw.com/daily-labor-report/apple-loses-top-ai-models-executive-to-metas-hiring-spree-1https://www.mk.co.kr/en/it/11362111https://www.cnbc.com/2025/06/30/mark-zuckerberg-creating-meta-superintelligence-labs-read-the-memo.htmlhttps://news.bloomberglaw.com/ip-law/apple-loses-top-ai-models-executive-to-metas-hiring-spree-1https://www.axios.com/2025/05/27/meta-ai-restructure-2025-agi-llamahttps://machash.com/9to5mac/392426/meta-hired-apples-head-foundation-models/https://machinelearning.apple.com/research/apple-foundation-models-2025-updateshttps://www.youtube.com/watch?v=XOIuFIl2-Aohttps://www.theinformation.com/briefings/meta-hires-researcher-apple
587 조회
0 추천
2025.07.08 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입