AI 뉴스

METR 연구결과 "AI 쓰면 개발이 더 느리다"

페이지 정보

작성자 JeromePark
작성일 2025.07.17 09:00
848 조회
0 추천
0 비추천

본문

METR은 AI 도구를 사용하는 경우 개발이 더 느려질 수 있다는 연구결과를 발표했다.

(연구결과 한글 요약 : 퍼플렉시티 사용)

https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/

Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity

ec389eaae94d0fcceecc1d8611f106a73d4607d46pl2.png

이 연구는 2025년 초 AI 도구가 숙련된 오픈소스 개발자의 생산성에 미치는 영향을 실험적으로 조사한 randomized controlled trial(RCT) 결과이며. 주요 내용은 다음과 같습니다:

연구 대상 및 방법:
16명의 경험 많은 오픈소스 개발자가 본인이 여러 해 기여해온 대형 저장소(평균 22,000+ 스타, 100만 줄 이상 코드)에서 해결이 필요한 실제 이슈 246개를 무작위로 AI 도구 사용 허용 그룹과 비허용 그룹에 배정받아 처리했습니다. AI 도구는 주로 Cursor Pro와 Claude 3.5/3.7 Sonnet 모델을 사용했으며, 업무 시간과 화면 녹화를 기록하고 개발자가 스스로 소요 시간을 보고하였습니다.

핵심 결과:
AI 도구를 쓸 때 개발자들은 평균 19% 더 오래 걸려 작업 속도가 느려지는 결과가 나왔습니다. 이는 개발자들의 사전 예상(24% 속도 향상 기대)과 현저히 다르며, 심지어 체험 후에도 AI가 20% 빠르게 해줬다고 오판함을 보여줍니다.

분석 및 해석:
다양한 잠재 요인 20개를 조사하여 5개의 주요 원인이 존재할 가능성이 제기되었고, 품질 저하 없이 결과의 신뢰성을 보장하기 위해 여러 통계 검증과 반복 분석을 했습니다. AI가 실제 작업을 느리게 만든다는 이번 결과는 여러 코딩 벤치마크나 개발자들의 체감 AI 도움 효과와 모순되지만, 그 이유로는 평가 기준, 사용 조건, 작업 유형 차이, AI 도구의 학습 곡선, 높은 품질 기준 등 여러 변수가 제시됩니다.

의의 및 향후 방향:
이 연구는 AI가 현실적인 개발 환경에서 즉각적으로 생산성을 향상시키지 못했다는 점을 보여주는 ‘스냅샷’이며, 향후 AI 기능 발전에 따른 추이 분석을 계획 중입니다. 또한 AI 가속화가 AI 연구개발에 끼치는 영향과 관련해 매우 중요한 증거를 보완해 주는 연구로 평가됩니다.

한계 및 주의점:
연구 결과가 모든 개발자나 모든 개발 환경에 일반화되는 것은 아니며, AI 도구의 활용법, 숙련도, 업무 유형에 따라 효과가 다를 수 있고, AI 기술 또한 빠르게 진화하고 있음을 명시합니다.

요약하자면, 2025년 초 기준으로 AI 도구가 숙련된 오픈소스 개발자들의 작업 속도를 오히려 약 19% 느리게 했으며, 이는 AI 기술의 현실적 영향에 대한 통찰과 AI 발전의 지속적인 모니터링 필요성을 강조하는 중요한 연구입니다

--

참고로 METR은 어떤 연구단체인가

METR(모델 평가 및 위협 연구, Model Evaluation & Threat Research)

METR는 첨단 AI 시스템의 평가와 위험성 연구를 수행하는 비영리 연구기관입니다. 주요 특징은 다음과 같습니다:

설립 배경과 목적

2022년 설립된 METR는 AI 시스템이 사회에 미칠 잠재적 위험성, 특히 자율성과 고도화된 AI 시스템이 가져올 수 있는 '파국적 위험'을 사전에 평가하는 데 목적을 두고 있습니다12.

인간의 개입 없이도 복잡한 임무를 수행할 수 있는 AI(에이전트) 시스템의 능력을 연구하고, 이 기술이 AI 연구개발(R&D) 자체를 가속할 가능성과 그로 인한 새로운 위험을 중심적으로 분석합니다34.

활동과 연구 방식

실제 AI 시스템이 얼마나 ‘현실적’으로 복잡하고 장기적인 작업을 자율적으로 완료할 수 있는지 다양한 평가 실험과 벤치마크, 현장 실험(RCT) 등을 통해 측정합니다34.

AI의 성능 뿐만 아니라, AI 사용 시 발생할 수 있는 리스크 요인, 사회적 영향, 정책적 대응 방안 등도 함께 연구합니다.

주요 프로젝트로는 AI가 사람 없이도 여러 시간에 걸쳐 과업을 수행할 수 있는지 평가하는 벤치마킹, AI 거버넌스 모델 실험, 시대별 AI 성능 성장량 측정 등이 있습니다4.

위치 및 조직

METR는 미국에 기반을 둔 비영리 단체이며, 연구 구성원들은 AI 연구 및 안전성 분야의 전문 인력들로 이루어져 있습니다1.

오픈AI 등 AI 연구단체 출신 인사들도 합류해 있으며, 신뢰성, 공공성, 투명성을 중시합니다2.

기타

순수 기부금으로 운영되고, 기업이나 특정 이해관계자로부터 독립적으로 연구를 수행합니다31.

사회와 AI 기업, 정책당국이 첨단 AI의 위험 및 역량을 객관적으로 이해하는 데 필요한 과학적 평가 기준을 만드는 것을 목표로 합니다45.

METR는 이번 연구처럼, 실제 전문가 개발자들이 사용하는 AI 시스템이 현실적으로 어떤 영향을 미치는지 실험적으로 평가하는 등, 미래에 있을 AI 발전이 갖는 의미와 위험에 대해 선제적으로 조망하는 기관

댓글 0
전체 326 / 69 페이지
AI 분야의 투자로 Big Tech 의 CAPEX 진출이 크게 늘고 있다고 미국 언론들이 보도했다.미국 4대 기술 기업 의 지출은 작년에 63% 급증하여 사상 최고치를 기록. 마이크로소프트, 알파벳, 아마존, 메타는 2024년에 2,460억 달러의 자본 지출을 보고했는데, 이는 2023년의 1,510억 달러에서 증가한 수치이다. 이들은 AI 대규모 언어 모델 연구의 선두를 유지하기 위해 데이터 센터를 구축하고 특수 칩 클러스터를 채우기 위한 경쟁에 돌입하면서 올해 지출이 3,200억 달러를 초과할 수 있다고 예측되었다.
616 조회
0 추천
2025.07.25 등록
오픈AI의 GPT 5 가 8월중 출시할 것으로 TechCrunch가 보도했다.원래 이 버전은 연초 5월 말로 예상됐으나 추가 테스트 등으로 일정이 미뤄졌고,내부 인사와 CEO 샘 알트먼의 트위터 언급을 통해 8월 중 발표가 이뤄질 것으로 알려졌다.새 버전은 다음과 같은 기능이 업데이트 될 예정이라고 한다.통합 모델: GPT-5는 기존의 GPT-시리즈와 o-시리즈(특히 o3 reasoning 기술)를 통합한 형태로 제공될 예정이다. 이로써 사용자가 모델을 따로 선택할 필요 없이, 하나의 시스템에서 다양한 인공지능 기능을 누릴 수 있다124.다양한 버전: 메인 GPT-5 외에 미니(mini)·나노(nano) 버전도 함께 제공된다. mini는 ChatGPT와 OpenAI API에서, nano는 API에서만 제공될 예정이다123.강화된 추론(Reasoning): CEO 샘 알트먼은 팟캐스트에서 “내가 답을 못하던 문제를 GPT-5가 완벽하게 풀었다”며, 사람을 능가하는 수준의 추론 능력을 강조했다. 모델의 대표적 '여기 있다' 순간이었다고 언급했다
742 조회
0 추천
2025.07.25 등록
유튜브 영상 요약입니다.(요약은 젠스파크)---GPT가 24시간 전에 몰래 업데이트한 이미지 일관성 기능이 진짜 미쳤어요!기존: 같은 캐릭터 생성해도 얼굴이나 옷이 계속 바뀜 ????현재: 캐릭터 외형은 그대로 유지하면서 배경/상황만 딱 변경! ✨/ 실전 활용 사례 15가지1. 얼굴 감정 변화같은 사람이 웃는 표정 → 놀라는 표정 → 의심하는 표정정말 자연스럽게 감정만 바뀌고 외형은 동일!2. 시간여행 컨셉아기 사진 넣고 → 10살, 20살, 30살 버전 생성옷 색깔, 얼굴 특징까지 일관성 있게 유지됨3. 커플 프로필 사진커플은 그대로 두고 배경만 변경한강 → 야경 → 바닷가 → 뉴욕 이런 식으로!4. 반려동물 사진우리집 강아지 사진으로 다양한 상황 연출공 가지고 놀기, 친구들과 뛰어놀기, 간식 먹기 등5. AI 모델링헤어컬러 변경, 의상 체인지 자유자재염색 시뮬레이션도 가능!6. 옷 갈아입히기온라인 쇼핑몰 운영하시는 분들 대박일듯같은 모델로 다양한 의상 착용샷 생성7. 제품 촬영이거 진짜 혁신적임!기존 모델 촬영비 최소 20-30만원 → AI로 해결제품 + 배경 자연스럽게 합성8. 캐릭터 IP 개발쿼카 캐릭터로 운동→러닝→식사→수면 스토리 제작유튜브, 인스타, 틱톡 콘텐츠 제작 가능9. 유튜브 썸네일유명 유튜버 썸네일 스타일에 내 얼굴 합성썸네일 제작 시간 30분 → 3분으로 단축!10. 로고 합성폴로 로고를 모델 의상에 자연스럽게 적용패션 브랜드 런칭 전 가상 시안 제작 가능11. 이모티콘 제작일관된 캐릭터로 "공부중", "밥먹는중", "일하는중" 이모티콘카톡 이모티콘 사업도 가능할듯?12. 전자책 표지레퍼런스 디자인 + 내가 원하는 제목디자이너 의뢰 전 가시안 제작13. 제품 연출컷캐리어를 인천공항에서 찍은 것처럼 합성실제 촬영 없이도 퀄리티 높은 연출 가능14. 웹툰 제작일관된 캐릭터로 4컷 만화 생성대본까지 같이 요청하면 더 완벽!15. 뷰티/화장품모델 + 화장품 자연스러운 합성진짜 광고 수준의 퀄리티!이 정도면 정말 많은 업계가 변화할 것 같아요...촬영업계: 비용 절감 효과 엄청남디자인: 가시안 제작이 초스피드로전자상거래: 제품 촬영비 대폭 절약콘텐츠 제작: 개인도 퀄리티 높은 콘텐츠 가능⚠️ 주의사항아직 텍스트 디테일은 약간 아쉬운 부분 있음프롬프트를 구체적으로 작성할수록 원하는 결과 나옴제품 촬영시 누끼컷(배경 제거된 이미지) 사용 권장
599 조회
0 추천
2025.07.25 등록
구글은 Gemini 고급 버전이 2025년 국제수학올림피아드(IMO)에서 "Gemini Deep Think"의 고급 버전이 5개 문제를 완벽하게 해결하며 금메달 수준의 성과(35점)를 달성했다고 발표했다. https://deepmind.google/discover/blog/advanced-version-of-gemini-with-deep-think-officially-achieves-gold-medal-standard-at-the-international-mathematical-olympiad/ Gemini Deep Think는 자연어 상태에서 공식 문제를 읽고 4.5시간 내에 직접 증명을 생성해냈으며, 기존의 특수 언어 번역 없이 처음부터 끝까지 자연어로 결과를 도출해냈다고. 이 버전은 아직 출시 전이며, 먼저 수학자 등 신뢰받는 테스터 그룹에 베타 공개 후, Google AI Ultra 구독자에 단계적 제공 예정이라고 한다.
806 조회
0 추천
2025.07.22 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입