Loading...

AI 뉴스

METR 연구결과 "AI 쓰면 개발이 더 느리다"

페이지 정보

작성자 JeromePark
작성일 2025.07.17 09:00
859 조회
0 추천
0 비추천

본문

METR은 AI 도구를 사용하는 경우 개발이 더 느려질 수 있다는 연구결과를 발표했다.

(연구결과 한글 요약 : 퍼플렉시티 사용)

https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/

Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity

ec389eaae94d0fcceecc1d8611f106a73d4607d46pl2.png

이 연구는 2025년 초 AI 도구가 숙련된 오픈소스 개발자의 생산성에 미치는 영향을 실험적으로 조사한 randomized controlled trial(RCT) 결과이며. 주요 내용은 다음과 같습니다:

연구 대상 및 방법:
16명의 경험 많은 오픈소스 개발자가 본인이 여러 해 기여해온 대형 저장소(평균 22,000+ 스타, 100만 줄 이상 코드)에서 해결이 필요한 실제 이슈 246개를 무작위로 AI 도구 사용 허용 그룹과 비허용 그룹에 배정받아 처리했습니다. AI 도구는 주로 Cursor Pro와 Claude 3.5/3.7 Sonnet 모델을 사용했으며, 업무 시간과 화면 녹화를 기록하고 개발자가 스스로 소요 시간을 보고하였습니다.

핵심 결과:
AI 도구를 쓸 때 개발자들은 평균 19% 더 오래 걸려 작업 속도가 느려지는 결과가 나왔습니다. 이는 개발자들의 사전 예상(24% 속도 향상 기대)과 현저히 다르며, 심지어 체험 후에도 AI가 20% 빠르게 해줬다고 오판함을 보여줍니다.

분석 및 해석:
다양한 잠재 요인 20개를 조사하여 5개의 주요 원인이 존재할 가능성이 제기되었고, 품질 저하 없이 결과의 신뢰성을 보장하기 위해 여러 통계 검증과 반복 분석을 했습니다. AI가 실제 작업을 느리게 만든다는 이번 결과는 여러 코딩 벤치마크나 개발자들의 체감 AI 도움 효과와 모순되지만, 그 이유로는 평가 기준, 사용 조건, 작업 유형 차이, AI 도구의 학습 곡선, 높은 품질 기준 등 여러 변수가 제시됩니다.

의의 및 향후 방향:
이 연구는 AI가 현실적인 개발 환경에서 즉각적으로 생산성을 향상시키지 못했다는 점을 보여주는 ‘스냅샷’이며, 향후 AI 기능 발전에 따른 추이 분석을 계획 중입니다. 또한 AI 가속화가 AI 연구개발에 끼치는 영향과 관련해 매우 중요한 증거를 보완해 주는 연구로 평가됩니다.

한계 및 주의점:
연구 결과가 모든 개발자나 모든 개발 환경에 일반화되는 것은 아니며, AI 도구의 활용법, 숙련도, 업무 유형에 따라 효과가 다를 수 있고, AI 기술 또한 빠르게 진화하고 있음을 명시합니다.

요약하자면, 2025년 초 기준으로 AI 도구가 숙련된 오픈소스 개발자들의 작업 속도를 오히려 약 19% 느리게 했으며, 이는 AI 기술의 현실적 영향에 대한 통찰과 AI 발전의 지속적인 모니터링 필요성을 강조하는 중요한 연구입니다

--

참고로 METR은 어떤 연구단체인가

METR(모델 평가 및 위협 연구, Model Evaluation & Threat Research)

METR는 첨단 AI 시스템의 평가와 위험성 연구를 수행하는 비영리 연구기관입니다. 주요 특징은 다음과 같습니다:

설립 배경과 목적

2022년 설립된 METR는 AI 시스템이 사회에 미칠 잠재적 위험성, 특히 자율성과 고도화된 AI 시스템이 가져올 수 있는 '파국적 위험'을 사전에 평가하는 데 목적을 두고 있습니다12.

인간의 개입 없이도 복잡한 임무를 수행할 수 있는 AI(에이전트) 시스템의 능력을 연구하고, 이 기술이 AI 연구개발(R&D) 자체를 가속할 가능성과 그로 인한 새로운 위험을 중심적으로 분석합니다34.

활동과 연구 방식

실제 AI 시스템이 얼마나 ‘현실적’으로 복잡하고 장기적인 작업을 자율적으로 완료할 수 있는지 다양한 평가 실험과 벤치마크, 현장 실험(RCT) 등을 통해 측정합니다34.

AI의 성능 뿐만 아니라, AI 사용 시 발생할 수 있는 리스크 요인, 사회적 영향, 정책적 대응 방안 등도 함께 연구합니다.

주요 프로젝트로는 AI가 사람 없이도 여러 시간에 걸쳐 과업을 수행할 수 있는지 평가하는 벤치마킹, AI 거버넌스 모델 실험, 시대별 AI 성능 성장량 측정 등이 있습니다4.

위치 및 조직

METR는 미국에 기반을 둔 비영리 단체이며, 연구 구성원들은 AI 연구 및 안전성 분야의 전문 인력들로 이루어져 있습니다1.

오픈AI 등 AI 연구단체 출신 인사들도 합류해 있으며, 신뢰성, 공공성, 투명성을 중시합니다2.

기타

순수 기부금으로 운영되고, 기업이나 특정 이해관계자로부터 독립적으로 연구를 수행합니다31.

사회와 AI 기업, 정책당국이 첨단 AI의 위험 및 역량을 객관적으로 이해하는 데 필요한 과학적 평가 기준을 만드는 것을 목표로 합니다45.

METR는 이번 연구처럼, 실제 전문가 개발자들이 사용하는 AI 시스템이 현실적으로 어떤 영향을 미치는지 실험적으로 평가하는 등, 미래에 있을 AI 발전이 갖는 의미와 위험에 대해 선제적으로 조망하는 기관

댓글 0
전체 329 / 66 페이지
두바이의 한 셰프가 OpenAI의 챗봇 ChatGPT를 활용해 개발한 피자 레시피가 예상외의 큰 성공을 거두고 있다고 보도되었습니다.국제 피자 체인 도도피자의 메뉴 개발 책임자인 스파르타크 아루티냔은 두바이의 요리 전통을 반영한 피자 레시피를 ChatGPT에게 요청했고, AI는 아랍 샤와르마 치킨, 인도식 구운 파니르 치즈, 중동 자타르 허브, 타히니 소스를 조합한 독특한 레시피를 제안했습니다.이는 특별히 독창적이라기보다는 피자에 얹을 수 있는 여러 문화의 맛을 섞어 만든 퓨전 스타일이었으나, 실제로 출시한 결과 핫케이크처럼 팔리기 시작했으며 현재도 메뉴에 올라와 있다고 합니다.아루티냥은 셰프로서 평소라면 이런 재료들을 피자에 섞지 않았을 것이지만 맛의 조합이 놀라울 정도로 좋았다고 평가했습니다.다만 ChatGPT가 제안한 딸기와 파스타를 얹은 피자나 블루베리와 시리얼을 곁들인 파이 등 다른 레시피들은 통과하지 못했다고 밝혔습니다.전문가들은 AI가 창의성이 침체되었을 때 뇌를 다시 활성화하는 좋은 도구가 될 수 있으며, 인간이 생각하지 못했을 수도 있는 것을 제안할 수 있다고 평가하고 있습니다.
733 조회
0 추천
2025.08.04 등록
중국 최대 검색엔진 운영사인 바이두가 인공지능을 활용해 동물의 울음소리를 인간 언어로 번역하는 혁신적인 기술을 개발 중이라고 로이터가 보도했습니다.바이두는 최근 중국국가지식산권국에 관련 기술에 대한 특허를 출원했으며, 공개된 특허 문서에 따르면 이 시스템은 동물의 울음소리뿐만 아니라 행동 패턴, 생리학적 신호 등 다양한 데이터를 수집한 후 이를 사전 처리하고 통합해 AI가 분석하는 방식으로 작동합니다.분석된 결과는 동물의 감정 상태를 파악하는 데 활용되며, 이 감정은 다시 의미 단위로 해석되어 인간의 언어로 번역됩니다.바이두는 특허 문서에서 이 시스템이 인간과 동물 간 감정적 소통과 이해를 한층 더 깊게 해주며 종을 뛰어넘는 커뮤니케이션의 정확성과 효율성을 개선할 것이라고 설명했습니다.바이두 대변인은 현재 여전히 연구 단계에 있다고 밝혔으며, 중국 SNS에서는 우리 집 강아지가 나한테 뭐라고 하는지 드디어 알게 될까라는 기대 섞인 반응과 함께 실제 현장에서 얼마나 정확하게 작동할지는 두고 봐야 한다는 회의적인 시선도 나타나고 있습니다.
713 조회
0 추천
2025.08.04 등록
인공지능 휴머노이드 로봇이 그린 초상화가 경매 역사상 최고가에 낙찰되어 화제가 되고 있습니다.AFP통신 등 외신에 따르면 영국 런던 소더비 디지털 아트 세일 경매에서 세계 최초 초현실주의 로봇 아티스트 '아이다'가 그린 작품이 132만 달러(약 18억4700만원)에 팔렸다고 보도했습니다.'인공지능 신'이라는 제목의 이 작품은 컴퓨터 과학의 아버지로 불리는 영국 수학자 앨런 튜링의 얼굴을 그린 2.2m 크기의 대형 초상화입니다. 당초 경매 예상가는 18만 달러 정도였으나 실제 낙찰가는 예상의 7배를 넘어서는 기록적인 수준을 보였습니다.아이다는 2019년 근현대 미술 전문가 에이단 멜러가 옥스퍼드대학교와 버밍엄대학교 소속 AI 전문가들과 협업하여 개발한 로봇으로, 단발머리의 젊은 여성 외형을 하고 있으며 눈에 장착된 카메라와 로봇 팔을 이용해 직접 그림을 그립니다.소더비 측은 휴머노이드 로봇 아티스트가 경매에 출품한 최초의 작품이 기록적인 낙찰가를 기록한 것은 근현대 미술사의 한 획을 그은 것이라며 AI 기술과 국제 미술 시장의 교차점이 커지고 있음을 보여준 사례라고 평가했습니다.
711 조회
0 추천
2025.08.04 등록
엘론 머스크의 xAI가 개발한 AI 챗봇 'Grok'이 6초 분량의 동영상을 생성하는 새로운 기능 'Imagine'을 공개했다.이 기능은 사용자 프롬프트에 따라 소리를 포함한 짧은 영상을 만들 수 있으며,성인용 및 나체 영상(‘spicy mode’)까지 제작이 가능하다는 점에서 논란이 되고 있다.현재 일부 직원들과 구독자들이 베타 테스트 중이며, 공식 출시일은 10월로 예정되어 있습니다.이 업데이트는 기존 Grok챗봇이 선정적인 AI '컴패니언'을 도입하면서 이미 논란에 휩싸인 상태에서발표되었고, 이 기능이 유명인 등 타인의 얼굴·이미지를 사실적으로 합성해 만든 '딥페이크' 영상 생산에 악용될 수 있다는 우려를 낳고 있다.
750 조회
0 추천
2025.08.03 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입