AI 뉴스

METR 연구결과 "AI 쓰면 개발이 더 느리다"

페이지 정보

작성자 JeromePark
작성일 2025.07.17 09:00
1,719 조회
0 추천
0 비추천

본문

METR은 AI 도구를 사용하는 경우 개발이 더 느려질 수 있다는 연구결과를 발표했다.

(연구결과 한글 요약 : 퍼플렉시티 사용)

https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/

Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity

ec389eaae94d0fcceecc1d8611f106a73d4607d46pl2.png

이 연구는 2025년 초 AI 도구가 숙련된 오픈소스 개발자의 생산성에 미치는 영향을 실험적으로 조사한 randomized controlled trial(RCT) 결과이며. 주요 내용은 다음과 같습니다:

연구 대상 및 방법:
16명의 경험 많은 오픈소스 개발자가 본인이 여러 해 기여해온 대형 저장소(평균 22,000+ 스타, 100만 줄 이상 코드)에서 해결이 필요한 실제 이슈 246개를 무작위로 AI 도구 사용 허용 그룹과 비허용 그룹에 배정받아 처리했습니다. AI 도구는 주로 Cursor Pro와 Claude 3.5/3.7 Sonnet 모델을 사용했으며, 업무 시간과 화면 녹화를 기록하고 개발자가 스스로 소요 시간을 보고하였습니다.

핵심 결과:
AI 도구를 쓸 때 개발자들은 평균 19% 더 오래 걸려 작업 속도가 느려지는 결과가 나왔습니다. 이는 개발자들의 사전 예상(24% 속도 향상 기대)과 현저히 다르며, 심지어 체험 후에도 AI가 20% 빠르게 해줬다고 오판함을 보여줍니다.

분석 및 해석:
다양한 잠재 요인 20개를 조사하여 5개의 주요 원인이 존재할 가능성이 제기되었고, 품질 저하 없이 결과의 신뢰성을 보장하기 위해 여러 통계 검증과 반복 분석을 했습니다. AI가 실제 작업을 느리게 만든다는 이번 결과는 여러 코딩 벤치마크나 개발자들의 체감 AI 도움 효과와 모순되지만, 그 이유로는 평가 기준, 사용 조건, 작업 유형 차이, AI 도구의 학습 곡선, 높은 품질 기준 등 여러 변수가 제시됩니다.

의의 및 향후 방향:
이 연구는 AI가 현실적인 개발 환경에서 즉각적으로 생산성을 향상시키지 못했다는 점을 보여주는 ‘스냅샷’이며, 향후 AI 기능 발전에 따른 추이 분석을 계획 중입니다. 또한 AI 가속화가 AI 연구개발에 끼치는 영향과 관련해 매우 중요한 증거를 보완해 주는 연구로 평가됩니다.

한계 및 주의점:
연구 결과가 모든 개발자나 모든 개발 환경에 일반화되는 것은 아니며, AI 도구의 활용법, 숙련도, 업무 유형에 따라 효과가 다를 수 있고, AI 기술 또한 빠르게 진화하고 있음을 명시합니다.

요약하자면, 2025년 초 기준으로 AI 도구가 숙련된 오픈소스 개발자들의 작업 속도를 오히려 약 19% 느리게 했으며, 이는 AI 기술의 현실적 영향에 대한 통찰과 AI 발전의 지속적인 모니터링 필요성을 강조하는 중요한 연구입니다

--

참고로 METR은 어떤 연구단체인가

METR(모델 평가 및 위협 연구, Model Evaluation & Threat Research)

METR는 첨단 AI 시스템의 평가와 위험성 연구를 수행하는 비영리 연구기관입니다. 주요 특징은 다음과 같습니다:

설립 배경과 목적

2022년 설립된 METR는 AI 시스템이 사회에 미칠 잠재적 위험성, 특히 자율성과 고도화된 AI 시스템이 가져올 수 있는 '파국적 위험'을 사전에 평가하는 데 목적을 두고 있습니다12.

인간의 개입 없이도 복잡한 임무를 수행할 수 있는 AI(에이전트) 시스템의 능력을 연구하고, 이 기술이 AI 연구개발(R&D) 자체를 가속할 가능성과 그로 인한 새로운 위험을 중심적으로 분석합니다34.

활동과 연구 방식

실제 AI 시스템이 얼마나 ‘현실적’으로 복잡하고 장기적인 작업을 자율적으로 완료할 수 있는지 다양한 평가 실험과 벤치마크, 현장 실험(RCT) 등을 통해 측정합니다34.

AI의 성능 뿐만 아니라, AI 사용 시 발생할 수 있는 리스크 요인, 사회적 영향, 정책적 대응 방안 등도 함께 연구합니다.

주요 프로젝트로는 AI가 사람 없이도 여러 시간에 걸쳐 과업을 수행할 수 있는지 평가하는 벤치마킹, AI 거버넌스 모델 실험, 시대별 AI 성능 성장량 측정 등이 있습니다4.

위치 및 조직

METR는 미국에 기반을 둔 비영리 단체이며, 연구 구성원들은 AI 연구 및 안전성 분야의 전문 인력들로 이루어져 있습니다1.

오픈AI 등 AI 연구단체 출신 인사들도 합류해 있으며, 신뢰성, 공공성, 투명성을 중시합니다2.

기타

순수 기부금으로 운영되고, 기업이나 특정 이해관계자로부터 독립적으로 연구를 수행합니다31.

사회와 AI 기업, 정책당국이 첨단 AI의 위험 및 역량을 객관적으로 이해하는 데 필요한 과학적 평가 기준을 만드는 것을 목표로 합니다45.

METR는 이번 연구처럼, 실제 전문가 개발자들이 사용하는 AI 시스템이 현실적으로 어떤 영향을 미치는지 실험적으로 평가하는 등, 미래에 있을 AI 발전이 갖는 의미와 위험에 대해 선제적으로 조망하는 기관

댓글 0
전체 801 / 177 페이지
앤트로픽의 클로드는 두 가지 주요 기능 업데이트로 주목받고 있습니다.첫 번째는 메모리 기능입니다. 이 기능은 사용자가 요청할 때만 과거 대화를 검색하여 요약하고 프로젝트를 연결할 수 있게 해줍니다. 설정 메뉴의 프로필에서 채팅 검색 및 참조를 활성화하면 휴가 전 진행했던 대화 내용을 불러와 "계속 같은 프로젝트를 진행하겠는가"라고 제안하는 방식으로 작동합니다. 이는 오픈AI의 지속적 메모리와 달리 개인 프로필을 만들지 않고 업무 효율성에만 집중한 점이 특징입니다.두 번째는 아티팩트(Artifacts) 기능의 대폭 업그레이드입니다. 이 기능을 통해 사용자는 코딩 지식 없이도 실제 작동하는 앱을 만들 수 있습니다. 예를 들어 "주제를 고르면 자동으로 암기장을 생성해 주는 플래시카드 앱을 만들어줘"라고 요청하면 클로드가 사용자 맞춤형 AI 기반 교육 앱을 바로 구현합니다. 지금까지 5억 건 이상의 아티팩트가 생성되었으며, 생산성 도구부터 교육용 게임, 음악 창작 앱까지 다양한 콘텐츠가 포함됩니다. 무료 계정을 포함한 모든 사용자가 이용할 수 있으며, 생성된 앱을 웹에 공유하고 다른 사용자가 수정하고 재사용할 수 있습니다.
1345 조회
0 추천
2025.08.18 등록
오픈AI는 사용자 의견을 수용하여 챗GPT의 모델 선택 메뉴를 되살렸습니다. 이제 사용자는 자동, 빠름, 싱킹(Thinking) 세 가지 모드 중에서 선택할 수 있습니다. 자동 모드는 쿼리에 따라 추론과 비추론 모델이 알아서 선택되며, 빠름 모드는 비추론 모델을 활용합니다. 싱킹 모드는 답변에 더 많은 컴퓨팅을 소모하고 출력 시간이 더 걸리는 추론 모델을 의미합니다.유료 사용자들은 지원이 중단된 GPT-4o와 GPT-4.1, o3 등 기존 모델과 새로 추가된 GPT-5 싱킹 미니 등을 이용할 수 있습니다. GPT-4o는 모델 선택기에 기본으로 포함되며, 다른 모델은 설정에서 추가할 수 있습니다. 샘 알트먼 CEO는 GPT-5에 적용된 4가지 개성을 더 따뜻한 느낌을 주면서도 불편하지 않도록 업그레이드하겠다고 밝혔습니다.이러한 업데이트들은 AI 도구들이 단순한 질문 답변을 넘어 실제 업무 환경에서 활용할 수 있는 실용적인 기능들로 진화하고 있음을 보여줍니다. 특히 사용자의 작업 흐름을 이해하고 지원하는 방향으로 발전하고 있어, 앞으로 AI 도구들이 개인 비서나 업무 파트너 역할을 더욱 효과적으로 수행할 것으로 예상됩니다.이 기능은 좌측 상단의 ChatGPT 5 버튼을 클릭하여 선택 가능합니다.
1268 조회
0 추천
2025.08.18 등록
YouTube, AI로 이용자 나이 추정해 미성년자 보호 강화유튜브가 나이 판단을 생년월일 입력방식에서 게시물을 통한 AI 의 추측으로 판단하는 것으로 변경하는 것을 테스트 중이라고CNN이 보도했다.이렇게 되면 AI가 만 18세 미만으로 판단한 이용자에게는 기존 청소년 보호 조치가 자동으로 적용된다. 여기에는 폭력적이거나 선정적인 민감 콘텐츠 제한, 반복 시청 제한, 휴식 알림, 맞춤형 광고 비활성화 등이 포함된다.만약 성인이 올린 것인데도 미성년자로 분류될 경우, 신분증, 신용카드, 또는 셀카(본인 확인용)를 제출해 나이 인증을 할 수 있다.이번 시스템은 로그인한 이용자에게만 적용될 것으로 알려졌으며, 로그아웃 상태에서는 일부 연령 제한 콘텐츠를 볼 수 없지만, 청소년이 부모 동의 없이 시스템을 우회할 가능성도 일부 남아 있다.
1343 조회
0 추천
2025.08.18 등록
최근 5년 동안 미국인의 전기요금은 약 30% 상승했으며, 이 주요 원인 중 하나는 AI와 클라우드 기술의성장으로 인한 데이터 센터의 대규모 전력 소비 때문이라고 Quartz 가 보도데이터 센터는 점점 더 많은 전기를 요구하고 있는데, 앞으로 미국 전체 전력의 최대 12%까지 차지할 수 있을 것으로 전망되며이는 가정과 산업의 부담으로 이어질 것으로 예상.특히 AI 산업의 성장과 빅테크 기업들의 클라우드 사업 확장은 더 많은 서버, 쿨링 시스템, 그리고 전력을 필요로 해 전반적인 에너지 수요를 빠르게 늘리고 있으며, 이러한 수요 급증이 전력망 압박 및 요금 인상으로 직결된다고 지적한다.일부 지역에서는 데이터 센터 신규 건설이나 전력 증강 프로젝트로 인프라 투자 논란이 발생하고 있다.효율적인 에너지 정책과 지속 가능한 데이터 센터 운영이 시급하다는 목소리가 커지고 있다고 매체는 보도했다.
1302 조회
1 추천
2025.08.18 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입