Loading...

AI 뉴스

METR 연구결과 "AI 쓰면 개발이 더 느리다"

페이지 정보

작성자 JeromePark
작성일 2025.07.17 09:00
1,591 조회
0 추천
0 비추천

본문

METR은 AI 도구를 사용하는 경우 개발이 더 느려질 수 있다는 연구결과를 발표했다.

(연구결과 한글 요약 : 퍼플렉시티 사용)

https://metr.org/blog/2025-07-10-early-2025-ai-experienced-os-dev-study/

Measuring the Impact of Early-2025 AI on Experienced Open-Source Developer Productivity

ec389eaae94d0fcceecc1d8611f106a73d4607d46pl2.png

이 연구는 2025년 초 AI 도구가 숙련된 오픈소스 개발자의 생산성에 미치는 영향을 실험적으로 조사한 randomized controlled trial(RCT) 결과이며. 주요 내용은 다음과 같습니다:

연구 대상 및 방법:
16명의 경험 많은 오픈소스 개발자가 본인이 여러 해 기여해온 대형 저장소(평균 22,000+ 스타, 100만 줄 이상 코드)에서 해결이 필요한 실제 이슈 246개를 무작위로 AI 도구 사용 허용 그룹과 비허용 그룹에 배정받아 처리했습니다. AI 도구는 주로 Cursor Pro와 Claude 3.5/3.7 Sonnet 모델을 사용했으며, 업무 시간과 화면 녹화를 기록하고 개발자가 스스로 소요 시간을 보고하였습니다.

핵심 결과:
AI 도구를 쓸 때 개발자들은 평균 19% 더 오래 걸려 작업 속도가 느려지는 결과가 나왔습니다. 이는 개발자들의 사전 예상(24% 속도 향상 기대)과 현저히 다르며, 심지어 체험 후에도 AI가 20% 빠르게 해줬다고 오판함을 보여줍니다.

분석 및 해석:
다양한 잠재 요인 20개를 조사하여 5개의 주요 원인이 존재할 가능성이 제기되었고, 품질 저하 없이 결과의 신뢰성을 보장하기 위해 여러 통계 검증과 반복 분석을 했습니다. AI가 실제 작업을 느리게 만든다는 이번 결과는 여러 코딩 벤치마크나 개발자들의 체감 AI 도움 효과와 모순되지만, 그 이유로는 평가 기준, 사용 조건, 작업 유형 차이, AI 도구의 학습 곡선, 높은 품질 기준 등 여러 변수가 제시됩니다.

의의 및 향후 방향:
이 연구는 AI가 현실적인 개발 환경에서 즉각적으로 생산성을 향상시키지 못했다는 점을 보여주는 ‘스냅샷’이며, 향후 AI 기능 발전에 따른 추이 분석을 계획 중입니다. 또한 AI 가속화가 AI 연구개발에 끼치는 영향과 관련해 매우 중요한 증거를 보완해 주는 연구로 평가됩니다.

한계 및 주의점:
연구 결과가 모든 개발자나 모든 개발 환경에 일반화되는 것은 아니며, AI 도구의 활용법, 숙련도, 업무 유형에 따라 효과가 다를 수 있고, AI 기술 또한 빠르게 진화하고 있음을 명시합니다.

요약하자면, 2025년 초 기준으로 AI 도구가 숙련된 오픈소스 개발자들의 작업 속도를 오히려 약 19% 느리게 했으며, 이는 AI 기술의 현실적 영향에 대한 통찰과 AI 발전의 지속적인 모니터링 필요성을 강조하는 중요한 연구입니다

--

참고로 METR은 어떤 연구단체인가

METR(모델 평가 및 위협 연구, Model Evaluation & Threat Research)

METR는 첨단 AI 시스템의 평가와 위험성 연구를 수행하는 비영리 연구기관입니다. 주요 특징은 다음과 같습니다:

설립 배경과 목적

2022년 설립된 METR는 AI 시스템이 사회에 미칠 잠재적 위험성, 특히 자율성과 고도화된 AI 시스템이 가져올 수 있는 '파국적 위험'을 사전에 평가하는 데 목적을 두고 있습니다12.

인간의 개입 없이도 복잡한 임무를 수행할 수 있는 AI(에이전트) 시스템의 능력을 연구하고, 이 기술이 AI 연구개발(R&D) 자체를 가속할 가능성과 그로 인한 새로운 위험을 중심적으로 분석합니다34.

활동과 연구 방식

실제 AI 시스템이 얼마나 ‘현실적’으로 복잡하고 장기적인 작업을 자율적으로 완료할 수 있는지 다양한 평가 실험과 벤치마크, 현장 실험(RCT) 등을 통해 측정합니다34.

AI의 성능 뿐만 아니라, AI 사용 시 발생할 수 있는 리스크 요인, 사회적 영향, 정책적 대응 방안 등도 함께 연구합니다.

주요 프로젝트로는 AI가 사람 없이도 여러 시간에 걸쳐 과업을 수행할 수 있는지 평가하는 벤치마킹, AI 거버넌스 모델 실험, 시대별 AI 성능 성장량 측정 등이 있습니다4.

위치 및 조직

METR는 미국에 기반을 둔 비영리 단체이며, 연구 구성원들은 AI 연구 및 안전성 분야의 전문 인력들로 이루어져 있습니다1.

오픈AI 등 AI 연구단체 출신 인사들도 합류해 있으며, 신뢰성, 공공성, 투명성을 중시합니다2.

기타

순수 기부금으로 운영되고, 기업이나 특정 이해관계자로부터 독립적으로 연구를 수행합니다31.

사회와 AI 기업, 정책당국이 첨단 AI의 위험 및 역량을 객관적으로 이해하는 데 필요한 과학적 평가 기준을 만드는 것을 목표로 합니다45.

METR는 이번 연구처럼, 실제 전문가 개발자들이 사용하는 AI 시스템이 현실적으로 어떤 영향을 미치는지 실험적으로 평가하는 등, 미래에 있을 AI 발전이 갖는 의미와 위험에 대해 선제적으로 조망하는 기관

댓글 0
전체 672 / 134 페이지
SWITCHBOT이 IFA2025에서 귀여운 AI 로봇 반려동물 'Kata friends' 을 소개했다.귀엽고 털복숭이한 로봇들은 카메라와 내장형 대형 언어 모델(LLM)을 탑재해 자연어 명령을 이해하고물체 인식이 가능하며, 저지연(on-device low-latency)으로 항상 사용자의 곁에 있어주는동반자 역할을 목표로 한다. Noa와 Niko라는 이름의 이 로봇들은 주로 반려용으로 설계되었다고Kata friends는 가족 구성원을 인식하고, 몸짓과 감정에 반응하며, 행복, 슬픔, 심지어 질투 같은 감정도 표현한다.시간이 지남에 따라 사용자의 일상과 기억을 학습해 진화하는 존재가 된다고 SwitchBot은 설명한다.심지어 이 로봇들이 질투를 느낄 수 있다는 점은 다소 신기하고 신선한 개념이라고 체험을 한 GIZMODO 기자는 소개한다.로봇들은 작은 바퀴를 가지고 있어 스스로 움직일 수 있으며, 이것이 더 많은 상호작용과 자유로운 행동을 가능하게 한다.그러나 아직 출시 일정이나 가격 정보는 공개되지 않았다. 따라서 현재로선 정확히 언제 만나볼 수 있을지는 미지수이지만,SwitchBot은 과거에 혁신적인 로봇 제품들을 실제로 출시한 전력이 있어 기대를 모은다
988 조회
1 추천
2025.09.05 등록
워너 브라더스 디스커버리(Warner Bros. Discovery)가 AI 이미지 생성 플랫폼 미드저니(Midjourney)를 상대로 저작권 침해 소송을 제기했다고 헐리우드리포터가 보도했다. 소송은 미드저니가 워너 브라더스의 캐릭터들을 무단으로 복제해 이미지와 비디오를 생성, 이를 이용자들에게 제공하며 불법적으로 수익을 창출하고 있다고 주장한다. 미드저니는 배트맨, 슈퍼맨, 벅스 버니, 스쿠비 두 등 워너 브라더스의 저작권 캐릭터들을 포함한 다양한 콘텐츠를 무단으로 사용했다는 혐의를 받고 있다워너 브라더스는 미드저니가 저작권자의 허가나 승인 없이 워너 브라더스의 지적 재산권을 상업적으로 이용하며 "법 위에 군림한다"고 비판했다. 특히 미드저니가 저작권 보호를 위한 안전장치를 고의적으로 제공하지 않았으며, 최근에는 영상 생성 모델에서 저작권 침해를 방지하려던 조치를 철회했다고 소송에서 지적했다. 이러한 행위는 저작권 침해가 명백하며, 이로 인해 워너 브라더스가 엄청난 경제적 손실을 입었다고 강조한다.이번 소송은 앞서 디즈니와 유니버설이 미드저니를 상대로 제기한 저작권 소송과 맥락을 같이 한다. 이들 스튜디오는 미드저니가 자체 AI 시스템 훈련에 영화 및 TV 프로그램 등 자사 저작물을 무단으로 활용했다고 주장하며, "무한한 불법 복제물을 생성하는 가상 자판기"라고 비판했다. 워너 브라더스 또한 자사 콘텐츠와 창작자들을 보호하기 위해 이번 법적 대응에 나섰다소송 문서에는 미드저니가 배트맨과 같은 특정 캐릭터 이름을 명시하지 않아도 저작권 침해 이미지와 영상을 생성할 수 있다고 적시돼 있다. 예를 들어 "클래식 만화 슈퍼히어로 배틀"과 같은 일반적인 문구를 사용해도 워너 브라더스 캐릭터들이 복제된 이미지가 만들어질 수 있다고 한다. 따라서 미드저니가 저작권 침해의 범위와 심각성을 인지하면서도 이를 고의적으로 방치하고 있다는 점이 강조된다.워너 브라더스는 이번 소송을 통해 저작권 침해에 따른 손해 배상과 미드저니의 저작권 침해 행위 중단을 요구하고 있으며, 미드저니가 적절한 저작권 보호 조치를 도입할 때까지 AI 이미지 생성 서비스 제한을 요청하고 있다. 현재까지 미드저니 측은 이 소송에 대한 공식 입장을 밝히지 않았다
994 조회
0 추천
2025.09.05 등록
(퍼플렉시티가 정리한 기사입니다)구글의 최신 업데이트에서 돋보이는 기능은 Gemini 2.5 Flash Image로, 개발 코드명인 "Nano Banana"로 잘 알려져 있습니다. 구글 개발자 블로그에 따르면, 이 모델은 사용자가 간단한 텍스트 프롬프트만으로 이미지를 편집할 수 있게 하며, 인물의 일관성과 얼굴 세부 사항을 유지할 수 있습니다. 이 도구를 통해 여러 이미지를 혼합하거나, 배경을 변경하고, 옷을 수정하며, 심지어 연예인과 직접 만난 적 없이 셀피를 만들 수도 있습니다.TechCrunch에 따르면, "이 모델은 LMArena에서 'nano-banana'라는 익명 가명을 사용하여 사용자들에게 공개되었고, 곧 최첨단 이미지 편집기로 인정받게 되었습니다." 소셜 미디어 이용자들은 해당 도구의 사실적인 편집 능력을 극찬했으며, 한 튜토리얼에서는 자연스러운 결과로 셀피를 변화시키는 방법을 보여주었습니다.
1019 조회
0 추천
2025.09.05 등록
(퍼플렉시티에서 정리한 기사입니다.)알리바바는 경쟁이 치열한 AI 하드웨어 시장에 진출하며 신용카드 크기의 디바이스인 딩톡 A1 보이스 레코더를 출시했습니다. 이 제품은 미국 기반의 Plaud와 같은 기존 업체에 직접적으로 도전장을 내미는 제품으로, 8월 말 딩톡의 10주년 행사에서 공개되었고 9월 2일에 공식 출시되었습니다. 이번 출시로 중국의 기술 대기업인 알리바바가 처음으로 물리적 AI 하드웨어 시장에 본격적으로 진입하게 되었습니다.딩톡 A1은 499위안(약 70달러)과 799위안(약 112달러)의 두 가지 모델로 출시되었으며, 이는 플로드(Plaud)에서 새롭게 출시한 노트 프로(Note Pro)의 179달러에 비해 훨씬 저렴한 가격입니다. 이러한 공격적인 가격 전략은 중국의 제조 비용 우위, 특히 세계 전자제품의 약 90%를 생산하는 선전(Shenzhen)과 같은 전자 생산 허브에서 비롯된 것입니다.컨설팅 업체 런투(Runto)에 따르면, 중국의 AI 하드웨어 시장은 2025년 1.1조 위안(1,530억 달러) 규모에 이를 것으로 전망되며, 2030년에는 2.5조 위안으로 두 배 이상 성장할 것으로 예상됩니다. 이러한 빠른 성장세는 정부의 정책적 지원, 기술 자립에 대한 중국의 강한 의지, 그리고 전통 산업 전반에서의 AI의 광범위한 도입에 힘입은 것입니다.DingTalk A1은 알리바바의 Tongyi AI 연구소와의 협력을 통해 개발된 첨단 기술을 도입했습니다. 이 기기의 음성 전사 시스템은 1억 시간 이상의 오디오 콘텐츠로 훈련되어 100개 이상의 언어와 30개 중국 방언을 실시간으로 번역할 수 있습니다.2025년 3월, 스타트업 HHO를 창업한 뒤 플랫폼으로 복귀한 DingTalk의 CEO 첸항은 출시 행사에서 이 기기의 전문적인 기능을 강조했습니다. A1에는 6개의 마이크로 이루어진 배열과 골전도 기술이 탑재되어 있어, 8미터의 초장거리 오디오 픽업과 45시간 연속 녹음을 지원합니다. 3.8mm의 얇은 두께와 자석 부착 방식은 스마트폰이나 기타 표면에 쉽게 부착할 수 있을 만큼 휴대성을 높여줍니다.이 기기는 초기 물량이 매진되며 AI 통합 하드웨어에 대한 강한 소비자 수요를 알렸습니다. 이번 출시로 인해 이미 Mobvoi의 TicNote 녹음기와 같은 중국 경쟁업체뿐만 아니라 Plaud를 넘어선 국제 업체들까지 포함된 시장의 경쟁이 더욱 치열해지고 있습니다.업계 분석가들은 알리바바의 하드웨어 진출의 전략적 중요성에 주목합니다. Runto의 Liu Chuang은 예상되는 시장 성장과 함께 “복수의 플레이어가 공존하며 빠른 제품 사이클, 기능 경쟁, 그리고 AI 하드웨어 생태계의 혁신을 이끌 것으로 예상된다”고 밝혔습니다.딩톡 A1의 출시는 알리바바가 경영진이 역사적 성장 기회로 규정한 더 큰 AI 전략을 뒷받침하고 있습니다. 1분기 실적이 기대에 미치지 못했음에도 불구하고, 분석가들은 생성형 AI와 클라우드 인프라에서의 경쟁 우위 등 내재된 강점을 꼽았습니다. AI 하드웨어 진출은 독자적인 AI 칩과 오픈소스 프로젝트에 3년간 530억 달러를 투자한다는 알리바바의 계획과 부합하며, 이는 미국 공급 업체에 대한 의존도를 줄이고 지역 AI 생태계를 육성하는 데 목적이 있습니다.
1036 조회
0 추천
2025.09.05 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입