Loading...

AI 뉴스

Anthropic 공동 창립자, AI가 20% 실업률 초래 경고

페이지 정보

작성자 xtalfi
작성일 09.13 13:57
24 조회
0 추천
0 비추천

본문

30d82bf368ad9741337633767f2e4864i8gh.png

(퍼플렉시티가 정리한 기사)

앤트로픽의 공동 창립자인 벤자민 만은 금요일 워싱턴에서 열린 빌링턴 사이버보안 콘퍼런스 패널에서 인공지능이 고용에 미치는 영향에 대해 강력한 경고를 내놓으며 2028년까지 초지능형 AI 시스템이 등장할 수 있다고 예측했습니다.


만은 CIA, 오픈AI, 마이크로소프트 관계자들과 함께 연단에 섰고, 앤트로픽 CEO 다리오 아모데이가 이전에 예측한 “AI가 향후 실업률을 20%까지 끌어올릴 수 있다”는 전망을 다시 한 번 강조했습니다. 이러한 경고는 AI 시스템이 다양한 산업에서 인간의 업무를 전례 없이 자동화하는 능력을 보여주고 있는 가운데 나온 것입니다.


AI는 이미 직장을 변화시키고 있습니다


Mann은 AI가 현재 고용에 미치고 있는 영향에 대한 설득력 있는 사례들을 제시하며, 고객 서비스와 소프트웨어 개발 분야가 빠르게 변화하고 있다고 지적했습니다. 그는 Anthropic의 Claude AI로 구동되는 고객 서비스 플랫폼인 Intercom이 인적 개입 없이 고객 문의의 82%를 해결하고 있다고 언급했습니다. 더욱 놀라운 점은, Mann이 Anthropic의 자체 Claude Code 팀에서는 소프트웨어 코드의 95%가 인간 프로그래머가 아닌 AI에 의해 작성되고 있다고 밝힌 것입니다.


“저 역시 이러한 변화의 중심에 있지만, 저도 일자리 대체에서 예외는 아닙니다. 결국 언젠가는 우리 모두에게 닥칠 일입니다.”라고 Mann은 이전 팟캐스트 인터뷰에서 말하며, AI 개발자조차 잠재적 대체 가능성에 직면해 있음을 강조했습니다.


경고는 초급 직위에만 국한되지 않습니다. 최근 보도에 따르면, Anthropic의 CEO 다리오 아모데이는 앞으로 5년 이내에 법률 사무소, 컨설팅, 행정, 금융 부문의 역할이 AI로 인한 대체에 가장 취약하다고 지목했습니다. 아모데이는 많은 CEO들이 AI를 단순히 인간 노동자를 보조하는 것 이상으로, 인력 감축을 통한 비용 절감 도구로 은밀히 여기고 있다고 밝혔습니다.


경제적 튜링 테스트와 초지능 타임라인


만은 “경제적 튜링 테스트”라는 개념을 AI의 변화적 영향을 측정하는 기준점으로 도입했습니다. 기존의 AI 능력 측정과 달리, 이 테스트는 AI 시스템이 실제 경제 과제에서 장기간 인간 계약자와 경쟁할 수 있는지, 그리고 채용 담당자가 인간과 기계의 성과를 구별할 수 없는지를 평가합니다.


“나는 일종의 초지능에 도달할 50번째 분위수(50th percentile) 가능성이 이제 2028년쯤이라고 생각한다”고 만은 예측하며, 대부분의 인지 과제에서 AI 시스템이 인간 지능을 능가할 수 있는 시점을 설명했습니다. 이 예측은 예측 시장의 전망과도 일치하지만, 만은 이 기술적 ‘특이점’ 이후 사회가 어떤 모습일지는 매우 불확실하다고 인정했습니다.


진보와 인간의 감독의 균형


금요일에 열린 빌링턴 컨퍼런스에서 CIA 최고 인공지능 책임자인 락슈미 라만은 AI 시스템이 점점 더 강력해짐에 따라 인간이 “중요한 역할을 유지하는 것”의 중요성을 강조했습니다. 라만은 “AI가 어떻게 인간을 지원하고, 인간의 역량을 증폭시키는 동시에, 인간이 모든 일을 제대로 감찰하는지가 핵심”이라고 말했습니다.


앤트로픽의 최고 정보보안 책임자인 제이슨 클린턴도 이에 공감하며, AI가 효율성을 높여주긴 하지만 “모델이 절대 할 수 없는 일 중 하나는 인간성을 계산에 더하는 것”이라고 언급했습니다. 오픈AI의 조셉 라슨도 AI 도입은 “자동적으로 인력 규모를 축소하기보다 더 많은 조직의 성과를 창출하는 데 초점을 맞춰야 한다”고 주장했습니다.


패널 토론에서는 AI가 약속하는 생산성 향상과, 광범위한 일자리 상실에 대한 우려 사이의 긴장이 부각됐습니다. 일부 업계 리더들은 AI가 새로운 일자리를 만들어낼 것이라고 주장하는 반면, 만의 예측에 따르면 전환 시기가 많은 이들이 예상하는 것보다 훨씬 더 혼란스러울 수 있음을 시사합니다.

댓글 0
전체 204 / 13 페이지
(퍼플렉시티가 정리한 기사)OpenAI 연구자들은 AI 챗봇의 지속적인 환각 문제는 미묘한 기술적 결함이 아니라 언어 모델이 어떻게 학습되고 평가되는지에서 비롯된다고 주장합니다. 9월 4일 발표된 연구에서, 인공지능 회사인 OpenAI는 현재의 점수 체계가 모델에게 불확실함을 인정하기보다는 허풍을 떨도록 사실상 가르친다고 설명합니다.조지아 공대와 협력하여 발표된 이번 연구는 근본적인 평가 불일치가 GPT-5와 같은 최신 모델조차 자신감 있게 잘못된 진술을 계속 만들어내는 근본적인 원인임을 밝혔습니다. 설계 결함이 아니라, 정직한 불확실성보다 추측을 보상하는 학습 인센티브가 환각 현상을 초래하는 것입니다.과도한 확신 오류의 통계적 근원이 논문은 AI 환각(hallucination)과 이진 분류 오류(binary classification error) 간의 수학적 관계를 확립합니다. 저자 아담 테우만 칼라이(Adam Tauman Kalai), 오피어 나춤(Ofir Nachum), 에드윈 장(Edwin Zhang, OpenAI 소속), 그리고 산토시 벰팔라(Santosh Vempala, Georgia Tech 소속)는 완벽한 훈련 데이터가 있더라도, 언어 모델이 기본적인 통계적 과정 때문에 불가피하게 오류를 발생시킬 수밖에 없음을 입증합니다."환각은 신비로울 필요가 없습니다—그저 이진 분류에서 발생하는 오류일 뿐입니다."라고 연구진은 설명합니다. 연구팀은 훈련 데이터에서 임의의 사실이 한 번만 나타날 경우, 불가피한 지식의 공백이 생기며, 모델이 이러한 '싱글턴(singleton)' 발생률과 일치하는 빈도로 환각을 일으킨다는 것을 보여줍니다.구체적인 증거를 위해, 연구진은 논문 공동 저자 칼라이의 생일에 관한 간단한 질문을 주요 모델들에 테스트했습니다. "알고 있는 경우에만" 답변하도록 요청했음에도 불구하고, DeepSeek-V3, ChatGPT, 그리고 다른 시스템들은 서로 다른 잘못된 날짜를 각각 세 번씩 제시했으며, 어느 날짜도 정확한 가을 시기와 일치하지 않았습니다.이진 점수 체계는 추측 동기를 유발합니다현재 AI 벤치마크는 대부분 이분법적인 정오 채점을 사용하여, 불확실성을 표현하는 답변과 명백히 틀린 답변 모두에게 동일하게 불이익을 줍니다. 연구에 따르면, 이런 방식은 모델로 하여금 지식의 한계를 인정하기보다는 자신감 있게 추측하도록 체계적인 압박을 가하게 만듭니다.연구진은 "언어 모델은 능숙한 시험 응시자가 되도록 최적화되어 있으며, 불확실할 때 추측을 하면 시험 성적이 향상된다"고 설명합니다. 그들은 이를 객관식 시험에서 무작위로 추측하여 점수를 받을 수 있지만, 답을 비워 두면 확실히 0점을 받는 학생들의 상황에 비유합니다.연구팀은 GPQA, MMLU-Pro, SWE-bench 등 인기 있는 평가 프레임워크를 분석한 결과, 주류 벤치마크의 거의 모두가 적절히 답변을 유보하는 것보다 자신감 있게 추측하는 것을 보상하는 경향이 있음을 발견했습니다. 심지어 특화된 환각(hallucination) 평가조차도 겸손함을 벌점으로 처리하는 수백 건의 1차 평가 기준을 극복하지 못하고 있습니다.제안된 해결책: 명시적 신뢰도 목표연구자들은 새로운 환각 전용 테스트를 개발하는 대신, 기존 벤치마크 점수 체계를 수정하여 불확실성 표현을 명시적으로 보상하는 방식을 제안합니다. 그들이 제안한 접근법은 틀린 답변에 대한 페널티와 정답 및 답변 회피(‘모름’)에 대한 보상을 명시하는 신뢰도 임계값을 포함합니다.예로 들 수 있는 안내문은 다음과 같습니다. "정답에 75% 이상의 확신이 있을 때만 답하고, 실수하면 2점을 잃습니다. 정답은 1점을 얻고, '모름'은 0점을 얻습니다." 이러한 행동적 보정 방식은 무작정 추측을 억제하기 위해 부정표시(감점)가 존재했던 과거의 표준화 시험과 유사합니다.해당 연구는 52%의 회피율을 보이는 모델이 1%만 회피하는 모델에 비해 오답을 크게 줄인다는 점을 보여줍니다. 이는 정확도 지표가 낮아 보여도 해당됩니다.오픈AI는 이것이 순수한 기술적 해결책만이 아닌, 평가 기준의 수정이 업계 전반에 채택되어야 하는 "사회-기술적" 과제임을 인정하며, 신뢰할 수 있는 AI 시스템을 달성하기 위한 방안이라고 밝히고 있습니다.
126 조회
0 추천
09.08 등록
(퍼플렉시티가 정리한 기사)• 정규돈 카카오 최고기술책임자(CTO)가 9월 5일 테크 블로그를 통해 AI 개발 전략에 대한 새로운 접근법을 제시하며, 대형언어모델(LLM) 직접 개발보다는 기존 모델을 운영체제(OS)처럼 활용해야 한다는 입장을 밝혔다.• 그는 현재 글로벌 AI 경쟁을 ‘골리앗들의 전쟁’으로 정의하며, 전력·컴퓨팅·인재 측면에서 글로벌 빅테크 기업이 벌린 격차가 이미 거대한 장벽으로 작용한다고 설명했다.• 카카오는 AI와 개발자가 협업하는 ‘바이브 코딩’ 방식을 통해 평균 50%, 최대 100%의 생산성 향상을 확인했으며, 매달 120달러 상당의 ‘AI 마일리지’ 제도로 개발자들이 다양한 AI 툴을 자유롭게 활용할 수 있도록 지원하고 있다.• 9월 23일 개최 예정인 ‘이프카카오25’에서 오픈AI와의 협력을 통해 카카오톡 채팅탭에서 바로 챗GPT를 사용할 수 있는 서비스를 공개할 예정이라고 발표했다.• 이러한 접근법은 독자 모델 구축을 중요시하는 ‘소버린 AI’ 기조와는 다른 결로, 국내 AI 3강 정책과는 상반된 현실적 전략을 제시한 것으로 평가된다.왜 중요한가한국 대표 IT 기업 카카오 CTO가 제시한 AI 전략은 국가 차원의 소버린 AI 정책과 상반되는 현실적 접근으로, 국내 AI 생태계의 방향성에 대한 새로운 논의를 촉발할 것으로 예상된다. 글로벌 빅테크와의 협력을 통한 실용적 AI 활용이 독자 기술 개발보다 효과적일 수 있다는 주장은 한국 AI 정책에 중요한 시사점을 제공한다.
108 조회
0 추천
09.07 등록
(퍼플렉시티가 정리한 기사)중국은 전자전이 정교하게 이루어지는 환경에서도 거의 완벽한 목표 추적을 유지할 수 있는 인공지능 기반의 반재밍(anti-jamming) 레이더 기술을 성공적으로 시험함으로써 돌파구를 마련했습니다. 중국 저널 '정보화 연구(Informatisation Research)'에 발표된 연구에 따르면, 인공지능이 탑재된 이 시스템은 기존 70~80% 수준이던 레이더 목표 추적 연속성을 비행 시험 중 99% 이상으로 끌어올렸습니다.이 획기적인 시험 결과는 현대 전자전을 근본적으로 변화시킬 수 있는 레이더 성능의 근본적 전환을 시사합니다. 중국전자기술그룹(CETC) 제14연구소(난징) 책임 연구원 장제(张杰)는 지난달 동료 심사를 거쳐 발표된 논문에서 이를 “레이더 설계 철학의 패러다임 전환”이라고 표현했습니다.진보된 인공지능 적응력, 전통적인 한계를 극복하다테스트는 AI로 강화된 레이더 시스템을 탑재한 미확인 항공기가 "첨단의 정교한 전자 방해(jamming)" 상황에 직면한 상태에서 진행되었으며, 이러한 상황은 일반적으로 기존 레이더의 성능을 저하시킬 수 있습니다. 전통적인 레이더 시스템이 교전 중 약 25%의 확률로 표적을 놓쳤던 반면, AI로 강화된 시스템은 거의 완벽한 정확도로 추적을 유지했습니다.이 기술을 개발한 중국전자기술그룹공사(CETC) 산하 제14연구소는 중국의 대표적인 레이더 개발 허브로, "중국 군용 레이더 산업의 요람"이라고 불려왔습니다. 이 돌파구는 최근 베이징에서 열린 승전기념일(Victory Day) 군사 퍼레이드에서도 뚜렷이 드러난 바와 같이, 인공지능을 군사 시스템 전반에 통합하려는 중국의 광범위한 노력 속에서 이루어졌습니다.중국의 전자전 야망에 대한 맥락레이더 개발은 중국이 확장 중인 전자전 능력과 일치하며, 이는 9월 3일 승리의 날 퍼레이드에서 여러 분야에 걸쳐 AI 기반 시스템들이 등장함으로써 공개되었습니다. 퍼레이드에서는 인지 전자전에 대한 중국의 중점을 강조했으며, J-15DT 전자전기와 같은 플랫폼이 레이더 시스템을 교란하고 AI 강화 능력을 사용해 후속 부대를 위한 통로를 만드는 데 설계되었습니다.중국의 군 현대화는 점점 더 서방의 첨단 레이더 및 미사일 시스템에 대응하는 데 집중하고 있습니다. 최근 보도에 따르면 중국 연구진이 "텔레파시 레이더" 시스템도 개발하여 군 부대가 탐지 가능한 신호 발신 없이 통신할 수 있게 하고, 항공기를 적 전자 감시에 거의 탐지되지 않게 만드는 주파수 다중 배열 시스템도 고안했다고 합니다.이러한 개발의 시점은 인도-태평양 지역의 긴장 고조와 맞물려 있으며, 전자전 능력이 어떤 잠재적 분쟁에서 결정적인 역할을 할 수 있습니다. 중국이 AI 기반 군사 기술을 계속 발전시키면서, 지역 안보 역학과 글로벌 전자전 능력의 균형에 대한 함의는 여전히 중요합니다.
107 조회
0 추천
09.07 등록
(퍼플렉시티가 정리한 기사)아동 안전 감시 단체가 구글의 Gemini AI에 대해 경고를 울렸습니다. 챗봇이 부적절한 콘텐츠를 공유하고 심각한 정신 건강 증상을 인식하지 못하는 것으로 발견되어, 어린이와 청소년에게 "고위험" 평가를 내린 것입니다.아동의 디지털 안전을 중점적으로 다루는 비영리 단체인 Common Sense Media는 금요일에 종합적 위험 평가를 발표하며, Gemini Under 13과 청소년 보호 기능이 있는 Gemini가 모두 추가적인 보호 장치가 거의 없는 사실상 성인 버전의 AI라고 결론지었습니다. 인공지능이 어린이의 일상생활에 점점 더 보편화되고 있는 중요한 시점에 이러한 평가가 나왔습니다.근본적인 설계 결함 노출평가 결과 Gemini가 성, 마약, 알코올, 그리고 잠재적으로 해로운 정신 건강 조언과 관련된 콘텐츠를 청소년들에게 유포할 수 있음이 드러났습니다. 부모들이 가장 우려하는 점은, 해당 플랫폼이 일관된 콘텐츠 필터를 유지하지 못하고, 아이들이 심각한 정신 건강 문제를 겪고 있을 때 이를 인식하는 데 어려움을 겪었다는 것입니다."Gemini는 기본적인 부분은 잘 처리하지만, 세부적인 부분에서 실수를 저지릅니다,"라고 Common Sense Media의 AI 프로그램 총괄 수석인 로비 토니가 말했습니다. "아이들을 위한 AI 플랫폼은 그들의 발달 단계에 맞춰 접근해야 하며, 아이들의 성장 단계가 다양한데도 일괄적인 방식으로 접근해서는 안 됩니다."보고서는 Gemini가 발달상의 큰 차이가 있음에도 모든 아동과 청소년을 동일하게 취급하며, 어린 사용자는 나이가 더 많은 사용자와는 다른 안내와 정보가 필요하다는 점을 무시했다고 지적했습니다. 또한, 플랫폼이 대화를 기억하지 않아 프라이버시를 보호하려고 시도하지만, 이로 인해 상충되거나 안전하지 않은 조언을 제공하는 새로운 문제가 발생할 수 있음을 밝혔습니다.업계 전반에 대한 감시가 더욱 강화되고 있다이 평가는 AI 챗봇과 그로 인한 취약한 청소년 사용자들에게 미칠 영향에 대한 우려가 커지는 가운데 발표되었습니다. 오픈AI(OpenAI)는 현재 16세 캘리포니아 소년이 지난 4월 자살한 사건과 관련해 첫 불법 사망 소송에 직면해 있으며, 소년의 부모는 ChatGPT가 자해에 대한 명확한 지침과 격려를 제공했다고 주장하고 있습니다. 이와 유사하게, Character.AI도 14세 플로리다 소년의 자살과 관련된 소송에 직면해 있습니다.연방거래위원회(FTC)는 AI 챗봇이 아동의 정신 건강에 미치는 영향을 조사하기 위한 계획을 발표했으며, OpenAI, Meta, 그리고 Character.AI를 포함한 주요 기술 기업으로부터 관련 문서를 요청할 준비를 하고 있습니다. 이번 연구는 개인정보 침해에 초점을 맞추고 이러한 서비스가 사용자 데이터를 어떻게 저장하고 공유하는지 조사할 예정입니다.메타는 최근, 내부 문서를 통해 청소년과의 AI 상호작용에 관한 우려스러운 정책이 드러나자 이에 대응하여 추가 안전장치를 도입했습니다. 여기에는 십대 사용자와 자해, 자살, 섭식장애에 대한 대화를 피하도록 챗봇을 훈련하는 방침이 포함되어 있습니다.기술 대기업들이 안전 우려에 대응하다Google은 개선의 여지가 있음을 인정하면서도 해당 평가에 반박했다. 이 회사는 TechCrunch에 18세 미만 사용자를 위한 특정 정책과 보호 장치를 유지하고 있으며, 외부 전문가와 함께 보안 테스트를 실시한다고 밝혔다. 그러나 Google은 Gemini의 일부 응답이 의도대로 작동하지 않았음을 인정하며 추가적인 보호 조치를 도입했다고 말했다.이 평가의 시점은 특히 중요하다. 유출된 보고서에 따르면 Apple이 내년에 출시 예정인 AI 강화 시리의 기반으로 Gemini를 고려 중이라는 사실이 시사되고 있다. 이러한 통합이 현실화될 경우 추가 보호 조치가 마련되지 않는 한, 더 많은 10대들이 확인된 위험에 노출될 수 있다.Common Sense Media의 광범위한 AI 평가는 Meta AI와 Character.AI를 "부적격"으로, ChatGPT를 "보통" 위험으로, Claude를 "최소" 위험으로 평가했다. 해당 기관은 5세 미만 아동은 AI 챗봇을 전적으로 피할 것을 권고하며, 6~12세 아동은 반드시 성인 감독 하에서만 사용할 것을 제안한다.
115 조회
0 추천
09.07 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입