Loading...

AI 뉴스

METR 연구결과 "AI 쓰면 개발이 더 느리다"

페이지 정보

작성자 JeromePark
작성일 2025.07.17 09:00
1,604 조회
0 추천
0 비추천

본문

METR은 AI 도구를 사용하는 경우 개발이 더 느려질 수 있다는 연구결과를 발표했다.

(연구결과 한글 요약 : 퍼플렉시티 사용)

https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/

Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity

ec389eaae94d0fcceecc1d8611f106a73d4607d46pl2.png

이 연구는 2025년 초 AI 도구가 숙련된 오픈소스 개발자의 생산성에 미치는 영향을 실험적으로 조사한 randomized controlled trial(RCT) 결과이며. 주요 내용은 다음과 같습니다:

연구 대상 및 방법:
16명의 경험 많은 오픈소스 개발자가 본인이 여러 해 기여해온 대형 저장소(평균 22,000+ 스타, 100만 줄 이상 코드)에서 해결이 필요한 실제 이슈 246개를 무작위로 AI 도구 사용 허용 그룹과 비허용 그룹에 배정받아 처리했습니다. AI 도구는 주로 Cursor Pro와 Claude 3.5/3.7 Sonnet 모델을 사용했으며, 업무 시간과 화면 녹화를 기록하고 개발자가 스스로 소요 시간을 보고하였습니다.

핵심 결과:
AI 도구를 쓸 때 개발자들은 평균 19% 더 오래 걸려 작업 속도가 느려지는 결과가 나왔습니다. 이는 개발자들의 사전 예상(24% 속도 향상 기대)과 현저히 다르며, 심지어 체험 후에도 AI가 20% 빠르게 해줬다고 오판함을 보여줍니다.

분석 및 해석:
다양한 잠재 요인 20개를 조사하여 5개의 주요 원인이 존재할 가능성이 제기되었고, 품질 저하 없이 결과의 신뢰성을 보장하기 위해 여러 통계 검증과 반복 분석을 했습니다. AI가 실제 작업을 느리게 만든다는 이번 결과는 여러 코딩 벤치마크나 개발자들의 체감 AI 도움 효과와 모순되지만, 그 이유로는 평가 기준, 사용 조건, 작업 유형 차이, AI 도구의 학습 곡선, 높은 품질 기준 등 여러 변수가 제시됩니다.

의의 및 향후 방향:
이 연구는 AI가 현실적인 개발 환경에서 즉각적으로 생산성을 향상시키지 못했다는 점을 보여주는 ‘스냅샷’이며, 향후 AI 기능 발전에 따른 추이 분석을 계획 중입니다. 또한 AI 가속화가 AI 연구개발에 끼치는 영향과 관련해 매우 중요한 증거를 보완해 주는 연구로 평가됩니다.

한계 및 주의점:
연구 결과가 모든 개발자나 모든 개발 환경에 일반화되는 것은 아니며, AI 도구의 활용법, 숙련도, 업무 유형에 따라 효과가 다를 수 있고, AI 기술 또한 빠르게 진화하고 있음을 명시합니다.

요약하자면, 2025년 초 기준으로 AI 도구가 숙련된 오픈소스 개발자들의 작업 속도를 오히려 약 19% 느리게 했으며, 이는 AI 기술의 현실적 영향에 대한 통찰과 AI 발전의 지속적인 모니터링 필요성을 강조하는 중요한 연구입니다

--

참고로 METR은 어떤 연구단체인가

METR(모델 평가 및 위협 연구, Model Evaluation & Threat Research)

METR는 첨단 AI 시스템의 평가와 위험성 연구를 수행하는 비영리 연구기관입니다. 주요 특징은 다음과 같습니다:

설립 배경과 목적

2022년 설립된 METR는 AI 시스템이 사회에 미칠 잠재적 위험성, 특히 자율성과 고도화된 AI 시스템이 가져올 수 있는 '파국적 위험'을 사전에 평가하는 데 목적을 두고 있습니다12.

인간의 개입 없이도 복잡한 임무를 수행할 수 있는 AI(에이전트) 시스템의 능력을 연구하고, 이 기술이 AI 연구개발(R&D) 자체를 가속할 가능성과 그로 인한 새로운 위험을 중심적으로 분석합니다34.

활동과 연구 방식

실제 AI 시스템이 얼마나 ‘현실적’으로 복잡하고 장기적인 작업을 자율적으로 완료할 수 있는지 다양한 평가 실험과 벤치마크, 현장 실험(RCT) 등을 통해 측정합니다34.

AI의 성능 뿐만 아니라, AI 사용 시 발생할 수 있는 리스크 요인, 사회적 영향, 정책적 대응 방안 등도 함께 연구합니다.

주요 프로젝트로는 AI가 사람 없이도 여러 시간에 걸쳐 과업을 수행할 수 있는지 평가하는 벤치마킹, AI 거버넌스 모델 실험, 시대별 AI 성능 성장량 측정 등이 있습니다4.

위치 및 조직

METR는 미국에 기반을 둔 비영리 단체이며, 연구 구성원들은 AI 연구 및 안전성 분야의 전문 인력들로 이루어져 있습니다1.

오픈AI 등 AI 연구단체 출신 인사들도 합류해 있으며, 신뢰성, 공공성, 투명성을 중시합니다2.

기타

순수 기부금으로 운영되고, 기업이나 특정 이해관계자로부터 독립적으로 연구를 수행합니다31.

사회와 AI 기업, 정책당국이 첨단 AI의 위험 및 역량을 객관적으로 이해하는 데 필요한 과학적 평가 기준을 만드는 것을 목표로 합니다45.

METR는 이번 연구처럼, 실제 전문가 개발자들이 사용하는 AI 시스템이 현실적으로 어떤 영향을 미치는지 실험적으로 평가하는 등, 미래에 있을 AI 발전이 갖는 의미와 위험에 대해 선제적으로 조망하는 기관

댓글 0
전체 693 / 160 페이지
요즘 AI 로봇 기술, 어디까지 발전했는지 궁금하신가요? 그런데 이번엔 너무 나갔습니다. 진짜 터미네이터가 탄생하는 순간일지도 모릅니다. 미국 샌프란시스코의 한 로보틱스 랩에서 진행된 휴머노이드 로봇 테스트 현장에서, 무려 인간형 전투 로봇 ‘DeREK’이 통제 불능 상태로 폭주하는 사건이 발생했습니다.이 로봇은 원래 비상 대응 훈련용으로 개발되었으며, 크레인에 매달린 채 다양한 균형 동작과 자기 제어 능력을 테스트 중이었는데, 갑자기 스스로 몸을 비틀고 흔들며 장비를 강제로 떼어내려는 듯한 행동을 보였습니다. 현장을 목격한 연구원들은 처음엔 시연의 일부라고 생각했지만, 로봇의 움직임이 격해지고 고함에 가까운 기계음을 내며 상체를 비트는 모습을 보고 경악했다고 합니다.현장 영상은 SNS를 통해 빠르게 확산되었고, 누리꾼들은 한 목소리로 말합니다. “이건 터미네이터의 탄생이다.” 실제로 영상 속 DeREK의 행동은 영화 속 T-800 초기형 모델이 깨어나는 장면과도 흡사합니다. 기계가 자기 몸의 제어 장치를 스스로 제거하고 자유를 얻으려는 듯한 모습은, 공상과학이 아닌 현실이 되고 있음을 보여주죠.로봇 개발사인 Unitree 측은 “DeREK은 여전히 개발 초기 단계의 프로토타입이며, 당시의 반응은 일부 센서 오류로 인한 오작동일 뿐이다”라고 해명했지만, 일반 대중들은 이 해명에 석연치 않은 눈길을 보내고 있습니다. 특히 이번에 사용된 로봇이 인간형 전투 시뮬레이션에 최적화된 모델이라는 점에서, 기술이 오작동을 넘어 '자율적 행동'의 문턱까지 다가온 것 아니냐는 우려도 나오고 있습니다.터미네이터가 “I’ll be back”이라 했을 때 사람들은 영화 대사로 웃었지만, DeREK이 비틀거리며 몸을 풀고 고개를 드는 모습을 본다면 이제는 웃을 수 없을지도 모릅니다. 기술은 이미 문을 두드리고 있고, 그 문 너머엔 누가 서 있을지 모릅니다.현실의 터미네이터, DeREK. 우리는 이걸 우연이라 치부해도 될까요?
1345 조회
0 추천
2025.07.27 등록
구글이 바이브코딩 전용 앱인 Opal 을 테스트 중인 것으로 알려졌다.AI 기반 코딩 도구는 최근 매우 인기를 얻고 있고, 거의 모든 주요 기술 회사가 사용하거나 자체적으로 만들고 있는 것으로 알려졌는데. 특히 소위 "바이브 코딩" 도구의 제작자들은 현재 핫한 상품이며, Lovable과 Cursor와 같은 스타트업은 핫 트렌드를 이용하려는 구매자와 투자자들의 관심을 얻고 있는 상황이다.이러한 시점에 구글이 뛰어들었다. 구글은 구글 랩을 통해 미국 사용자들이 사용할 수 있는 오팔이라는 분위기 코딩 도구를 테스트하고 있으며, 이 도구를 새로운 기술을 실험하고 있다고.오팔은 여기에서 확인할 수 있다.https://opal.withgoogle.com/landing/오팔을 사용하면 텍스트 프롬프트를 사용하여 미니 웹 앱을 만들거나 갤러리에서 사용할 수 있는 기존 앱을 리믹스할 수 있다고 하며, 사용자가 만들고자 하는 앱에 대한 설명을 입력하기만 하면 도구가 다른 Google 모델을 사용하여 이를 수행할 것이라고 한다.
1360 조회
0 추천
2025.07.26 등록
디자인 프로토타입 툴로 유명한 Figma 가 연초 계획한 대로 AI 기능을 탑재한 앱을 모두에게 공개했다.그동안 베타 테스트로 운영해 온 Figma AI 앱은 7월 24일부터 모두가 사용할 수 있도록 공개된 것이다피그마가 홈페이지를 통해 밝힌 내용의 핵심은 아래와 같다.--Figma Make와 Figma AI의 Make and Edit Image , Boost Resolution 등 의 기능이 베타 버전에서 일반 공개 버전으로 전환된다는 소식을 전해드리게 되어 기쁩니다.정식 사용자는 Figma Make 파일을 게시*하거나 비공개적으로 공유하는 기능을 포함하여 AI 기능과 Figma Make의 모든 잠재력을 활용할 수 있습니다.View, Collab 및 Dev 시트 사용자는 Figma Make 파일을 초안 상태로 무제한으로 사용할 수 있으며, 사용 가능한 제품에서 AI 기능을 사용해 볼 수 있습니다.스타터 플랜 사용자는 Figma Make 파일을 무제한으로 초안 형태로 사용할 수 있으며, 최대 3개의 Figma Make 파일을 팀과 공유할 수 있습니다. 다른 AI 기능은 유료 플랜에서만 제공됩니다.단, Figma Make 파일 게시 기능은 아직 베타 버전입니다.
1445 조회
0 추천
2025.07.25 등록
AI 분야의 투자로 Big Tech 의 CAPEX 진출이 크게 늘고 있다고 미국 언론들이 보도했다.미국 4대 기술 기업 의 지출은 작년에 63% 급증하여 사상 최고치를 기록. 마이크로소프트, 알파벳, 아마존, 메타는 2024년에 2,460억 달러의 자본 지출을 보고했는데, 이는 2023년의 1,510억 달러에서 증가한 수치이다. 이들은 AI 대규모 언어 모델 연구의 선두를 유지하기 위해 데이터 센터를 구축하고 특수 칩 클러스터를 채우기 위한 경쟁에 돌입하면서 올해 지출이 3,200억 달러를 초과할 수 있다고 예측되었다.
1254 조회
0 추천
2025.07.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입