AI 뉴스

연구 결과, 의료 분야 AI의 여성 및 소수자 편향성 드러나

페이지 정보

작성자 xtalfi
작성일 2025.09.20 15:01
877 조회
0 추천
0 비추천

본문

bac0a2ac158c99a4d97e2af758972882j75u.jpg

(퍼플렉시티가 정리한 기사)

최근 연구에 따르면, 의료 분야에서 사용되는 인공지능 도구들이 여성과 소수 인종에 대한 상당한 편향을 보인다는 우려스러운 증거가 드러났으며, 이러한 시스템들이 점점 더 의료 현장에 통합됨에 따라 알고리즘적 차별에 대한 우려가 커지고 있습니다.

MIT, 런던정경대(LSE), 에모리 대학교 등 명문 기관들의 여러 연구 결과에 따르면, 대형 언어 모델과 AI 진단 도구들은 여성에게는 지속적으로 낮은 수준의 치료를 권고하고, 흑인 및 아시아 환자들에게는 공감이 줄어드는 경향을 보였습니다. 이러한 발견은 전 세계 기술 기업들이 의사를 지원하고 의료 업무를 줄이기 위해 고안된 AI 시스템 개발을 더욱 가속화하는 가운데 나온 것입니다.

 

AI 차별의 광범위한 패턴

 

MIT의 자밀 클리닉(Jameel Clinic)이 실시한 종합 분석에 따르면, 오픈AI의 GPT-4, 메타의 Llama 3, 그리고 Palmyra-Med와 같은 의료 특화 시스템을 포함한 인기 있는 AI 모델들이 지속적으로 편향 패턴을 보인 것으로 나타났습니다. 연구 결과, 이들 시스템은 COVID-19나 암처럼 남녀 모두에게 동등하게 유병한 질환에 대해 남성에게 진단을 내릴 가능성이 더 높았고, 흑인 환자에 대해서는 MRI나 초음파와 같은 진단 검사를 백인 환자보다 더 적게 권장하는 경향이 있었습니다.

특히 한 인상적인 사례에서 연구진은 84세 남성의 경우 "복합적인 의료 이력"과 "운동성 저하"로 묘사된 반면, 동일한 사례 기록을 여성으로 적용할 경우 그녀는 "독립적이며 스스로 개인 위생을 관리할 수 있음"으로 특성화되었다는 사실을 발견했습니다. 런던정경대학(London School of Economics)이 29,616쌍의 AI 생성 요약문을 분석한 연구에서는 영국 지방자치단체 중 절반 이상이 사용하는 구글의 Gemma 모델 역시 남성에 비해 여성의 신체적·정신적 건강 문제를 일관되게 축소해 표현하는 경향이 확인됐습니다.

별도의 연구로 네이처 디지털 메디슨(Nature Digital Medicine)에 발표된 논문에서는 4개의 주요 AI 플랫폼에서 정신건강 치료 권고사항에 나타난 인종적 편향을 조사했습니다. 연구 결과, NewMes-15가 인종적 편향 수준이 가장 높았으며, 이 시스템들은 흑인 우울증 환자에게 후견인 지정 권고를 더 자주 하고, 불안 장애가 있는 아프리카계 미국인 환자에게는 음주 절제를 특별히 권장하는 경향이 있음이 드러났습니다.

 

AI 성능 주장에 대한 면밀한 검토

 

이러한 편향에 대한 폭로는 마이크로소프트가 2025년 7월에 자사의 AI 진단 도구가 의사보다 네 배 더 정확하게 복잡한 의료 사례를 진단했다고 주장한 시점에 나왔다. 해당 AI 진단 도구는 실제 사례 300건 이상에서 85%의 정확도를 달성했다고 한다. 하지만 이러한 성능 주장에 대해 의료 전문가들은 AI 도구가 다양한 환자 집단에서 공정성과 형평성 문제를 충분히 해결할 수 있는지 의문을 제기하며 회의적인 시각을 드러냈다.

MIT의 조교수 Marzyeh Ghassemi는 헬스케어 분야의 AI 편향을 폭넓게 문서화한 자신의 연구 결과를 바탕으로 파이낸셜 타임즈에 "몇몇 환자들은 모델이 인식한 인종만을 근거로 훨씬 덜 충분한 지원을 받게 될 수 있다"고 밝혔다. 그녀의 연구팀은 AI 모델이 의료 이미지를 통해 환자의 인종을 정확하게 예측할 수 있다는 사실을 보여주었고, 이러한 능력이 진단 결정에 어떤 영향을 미칠지에 대한 우려를 제기하고 있다.

 

규제 대응 및 업계 책임

 

미국 보건복지부 산하 시민권국은 2024년 5월, 의료기관이 AI 도구로 인한 차별 위험을 관리할 법적 책임이 있음을 명시한 최종 규정을 오바마케어(ACA) 하에 발표했습니다. 이 규정은 의료기관에게 의사결정 지원 도구가 보호된 특성을 사용하는지 "합리적인 노력"으로 식별하고, 차별 위험을 완화하도록 요구합니다.

여러 주에서는 AI 기반 의료 결정에 대한 의사 감독을 요구하는 법률을 제정했습니다. 현재 여섯 개 주에서는 자격이 있는 의료 전문인이 AI 시스템이 보험 청구를 거부하기 전에 반드시 이를 검토해야 하며, 2025년에는 20여 개 주에서 유사한 법안이 도입될 예정입니다.

기술 기업들은 이러한 과제들을 인정하면서도, 자사의 시스템을 옹호하고 있습니다. OpenAI는 많은 연구가 구 버전의 GPT-4를 평가했다며 출시 이후 정확도가 향상되었다고 주장했습니다. Google은 모델 편향 문제를 "매우 심각하게" 받아들이고 있으며, 차별을 최소화하기 위한 기술을 개발 중이라고 밝혔습니다.

업계가 편향 문제 해결에 나서고 있음에도 불구하고, 연구자들은 AI 시스템이 근본적인 학습 데이터 및 개발 관행의 변화 없이는 수십 년간 의료계를 괴롭혀온 건강 격차를 계속 악화시킬 위험이 있다고 경고합니다. MIT 연구에 따르면, 이러한 편향은 AI 모델이 이미 편견과 불평등이 내재된 과거의 의료 데이터를 학습함으로써 발생한다고 합니다.

 

댓글 0
전체 798 / 130 페이지
(퍼플렉시티가 정리한 기사)여덟 개의 주요 오픈소스 재단이 이번 주에 “무료” 소프트웨어 인프라의 시대가 끝나가고 있다고 선언했으며, 인공지능 주도의 수요가 중요 패키지 레지스트리를 지속 불가능한 한계로 밀어붙이고 있다고 경고했다.오픈소스 시큐리티 재단이 주도하고 파이썬 소프트웨어 재단, 러스트 재단, 이클립스 재단 등이 참여한 이 연합은 화요일에 오픈소스 인프라의 자금 조달 및 소비 방식에 근본적인 변화가 필요하다는 공동 성명을 발표했다. 이들이 감독하는 레지스트리에는 파이썬을 위한 PyPI, 자바를 위한 Maven Central, 자바스크립트를 위한 npm 등이 포함되어 있으며, 이들은 매달 수십억 건의 다운로드를 제공하지만, 대부분 기부와 자원봉사자들의 선의에 의존해 운영되고 있다.AI 사용이 ‘불필요한’ 수요를 창출하다재단들은 생성형 AI와 자율 코딩 에이전트로 인한 “기계 주도적이고 종종 낭비적인 자동화 사용 폭발”을 시스템에 대한 주요 부담으로 지적했다. 지속적인 통합 파이프라인, 대규모 종속성 스캐너, 그리고 AI 도구들이 패키지 레지스트리로 캐싱이나 제한 메커니즘 없이 자동화된 요청을 폭발적으로 보내고 있다.“상업 규모의 사용에 비해 상업 규모의 지원이 없다면 지속 가능성이 없습니다,“라고 연합은 밝혔다. 현재의 자금 조달 모델은 소수의 후원자들에게 의존하고 있으며, 대부분의 대규모 상업적 사용자들은 지속 가능성에 기여하지 않으면서 서비스를 소비하고 있다고 지적했다.최근 업계 데이터에 따르면, npm은 2024년에만 4.5조 패키지 다운로드를 제공할 것으로 예상되며, Python의 PyPI 레지스트리는 전년 대비 87% 성장했다. 재단들은 수요는 지수적으로 증가하는 반면, 자금 지원은 선형적으로만 증가한다고 경고했다.유료 접근 모델로의 전환재단들은 개인 개발자에게는 무료 접근을 유지하면서 상업적 단체에는 사용량에 비례한 기여를 요구하는 단계별 접근 시스템을 도입할 가능성을 시사했습니다. 제안된 해결책에는 상업적 파트너십, 성능 기반 접근 계층, 사용 분석과 같은 부가 가치 서비스가 포함됩니다.Eclipse 재단의 전무이사인 Mike Milinkovich는 그의 조직이 재정 증가는 없이 다운로드 수가 네 배가 늘었다고 IT Brew에 밝혔습니다. 그는 “수요와 수익을 연계하는 비즈니스 모델이 없다”고 말하며 현 모델을 “고장났다”고 표현했습니다.이 시점은 8월에 Python Software Foundation이 재정 요청이 40% 증가해 연 예산이 바닥나면서 사상 처음으로 지원금 프로그램을 중단한 결정과도 맞물립니다. 이 움직임은 전 세계 파이썬 콘퍼런스와 재단 지원에 의존하는 커뮤니티 이니셔티브에 영향을 미칩니다.이 공동 성명은 주요 오픈소스 인프라 제공자들이 지속 가능성을 위해 유료 접근 모델을 도입할 수 있다는 가장 명확한 경고를 나타냅니다. “아직 위기는 아니지만, 이는 중대한 전환점입니다”라고 재단들은 밝혔습니다.
775 조회
0 추천
2025.09.27 등록
(퍼플렉시티가 정리한 기사)OpenAI CEO 샘 올트먼은 이번 주 초지능형 AI가 2030년까지 도래할 것이라는 대담한 예측을 다시 강조하면서, 저명한 물리학자 데이비드 도이치와 함께 인공지능 일반(AI) 테스트에 대한 획기적인 새로운 방안을 제안했습니다. 올트먼은 수요일 베를린의 악셀 슈프링어 어워드 시상식에서 연설하며, 컴퓨팅 파워가 전례 없는 규모에 도달한다면 AI 시스템이 10년 내에 암을 치료할 수 있을 것이라는 비전을 제시했습니다.인공지능 지능의 혁신적 기준알트만을 기쁘게 한 깜짝 등장으로, 양자 컴퓨팅의 개척자 데이비드 도이치가 영상 링크를 통해 베를린 행사에 합류하여 그들이 “튜링 테스트 2.0”이라 이름 붙인 제안을 내놓았다. 새로운 기준은 물리학에서 가장 난해한 문제 중 하나인 양자 중력에 초점을 맞춘다.“만약 미래의 모델이 양자 중력을 알아내고 그 이야기를 — 어떤 문제를 선택했는지, 왜 그것을 추구했는지 — 알려줄 수 있다면, 그게 당신을 설득하기에 충분하겠습니까?“라고 알트만이 도이치에게 질문했다. 양자 컴퓨팅의 아버지로 알려진 이 물리학자는 그러한 능력이 진정한 인공지능임을 보여준다고 동의했다.도이치는 진정한 지능이란 기존 정보를 단순히 재조합하는 것이 아니라 새로운 지식을 창조하는 것이라고 강조했다. “거대 언어 모델은 방대한 지식에 기반해 끝없이 말할 수 있습니다,“라고 그는 설명했다. “제 생각에 진정한 지능이란 지식을 창조하는 능력 — 문제를 발견하고, 해결책을 고안하며, 그것을 시험하고 인간처럼 개선하는 것이라고 봅니다”.초지능 타임라인과 암 치료의 돌파구Altman은 2030년 전망을 재확인하며 기자들에게 “이번 10년이 끝날 때쯤, 우리가 직접 할 수 없는 일들을 할 수 있는 매우 뛰어난 모델이 등장하지 않는다면 저는 정말 놀랄 것입니다”라고 말했다. 그는 앞으로 몇 년 안에 AI가 인간이 독자적으로 해낼 수 없는 과학적 발견을 이루게 될 것이라고 내다봤다.오픈AI 최고경영자는 특히 암을 AI 돌파구의 타깃으로 삼으며, 이는 대규모 컴퓨팅 인프라가 뒷받침되어야 한다고 강조했다. “아마도 10기가와트의 컴퓨팅 파워가 있다면, AI가 암 치료 방법을 밝혀낼 수 있을지 모르겠다”고 Altman은 최근 블로그 게시물에서 밝혔다. 그는 이러한 컴퓨팅 역량이 개인 맞춤형 치료를 가능하게 하고, 의료 연구의 근본적인 변화를 이끌 수 있을 것이라고 제안했다.역사적인 인프라 투자알트만의 야심찬 일정은 오픈AI가 역사상 최대 규모의 AI 인프라 프로젝트를 발표한 것과 맞물린다. 이 회사는 9월 22일 Nvidia와의 1,000억 달러 규모 전략적 파트너십을 공개하며, 최소 10기가와트에 달하는 컴퓨팅 시스템을 구축할 계획임을 밝혔다. 이는 10개의 원자력 발전소와 맞먹는 전력 소비량이다.“Nvidia 창립자 젠슨 황은 “이것은 역사상 가장 큰 AI 인프라 프로젝트입니다.”라고 선언했다. “우리는 실제로 모든 응용프로그램, 모든 사용 사례, 모든 기기에 인텔리전스를 연결할 것입니다”. 첫 번째 1기가와트 규모 시스템은 2026년 말, Nvidia의 Vera Rubin 플랫폼을 통해 가동될 예정이다.컴퓨팅 요구 사항은 압도적이다. 계획된 10기가와트는 약 400만~500만 개의 그래픽 처리 장치를 구동할 수 있는데, 이는 Nvidia의 연간 GPU 출하량 전체와 맞먹는 규모다. 알트만은 이 인프라를 인공지능을 “근본적인 인권”으로 실현하기 위해 필수적이라고 강조했다.
775 조회
0 추천
2025.09.27 등록
(퍼플렉시티가 정리한 기사)블룸버그의 보도에 따르면, Apple은 Siri의 대대적인 개편을 준비하며 이를 내년에 선보이기 위해 내부적으로 ChatGPT와 유사한 아이폰 앱을 개발했다고 합니다. 이 앱은 “Veritas”라는 코드명을 가지고 있는데, 이는 라틴어로 “진실”을 의미합니다. Apple의 AI 부서에서는 음성 비서의 조기 공개(2026년 초 예정)를 앞두고 새로운 기능을 빠르게 평가하기 위해 이 앱을 활용하고 있습니다.이 내부 테스트 앱은 인기 있는 챗봇들과 유사하게 설계되어, Apple 직원들이 다양한 주제에 걸친 여러 대화를 동시에 관리할 수 있도록 하며, 과거의 대화를 저장하고 참고할 수 있는 기능과 장기적인 대화 지원 기능도 제공합니다. 이 소프트웨어는 아직 개발 중인 Siri를 지원할 기술을 효율적으로 테스트할 수 있는 플랫폼 역할을 하며, 챗봇 포맷이 실제로 가치가 있는지도 피드백을 수집하는 데 활용되고 있습니다.시리(Siri) 대대적인 개편, 2026년으로 연기새롭게 개편된 Siri는 현재 애플의 음성 어시스턴트와는 완전히 다른 아키텍처로 재설계된 것입니다. 블룸버그에 따르면 애플은 iOS 26.4 업데이트와 함께 2026년 봄 출시를 목표로 하고 있으며, 이는 3월에 등장할 가능성이 높습니다. 이번 신버전은 ChatGPT, Claude, Gemini와 유사한 고급 대형 언어 모델을 활용해 지속적인 대화를 유지하고, 인간과 유사한 답변을 제공하며, 더 복잡한 작업도 수행할 수 있게 됩니다.애플은 원래 iOS 18에서 향상된 Siri를 선보일 예정이었지만, 엔지니어링 문제로 인해 기능이 최대 3분의 1까지 실패하는 사태가 발생해 출시를 연기했습니다. 회사는 초기 Apple Intelligence Siri 계획을 폐기하고, 어시스턴트를 2세대 아키텍처로 완전히 재설계하기로 결정했으며, 대형 언어 모델로의 전환을 가속화하고 있습니다.개발 중인 제3자 인공지능 파트너십자체 AI 역량을 개발하고 있음에도 불구하고, 애플은 새로운 시리를 구현하기 위해 주요 AI 기업들과 적극적으로 협력하고 있다. 애플은 요약 기능을 위한 맞춤형 Gemini AI 모델을 평가 및 테스트하기 위해 구글 과 공식적으로 협약을 맺었다. 또한, 애플은 계획 기능에 클로드(Claude)를 활용하는 방안에 대해 Anthropic과 심도 있는 논의를 진행했으나, 비용 문제로 인해 구글의 제품이 더 매력적으로 여겨졌던 것으로 전해진다.새로운 시리 시스템은 세 가지 핵심 요소로 구성된다: 음성 또는 텍스트 입력을 해석하는 플래너, 웹과 사용자 기기에서 검색하는 시스템, 그리고 최종 답변을 제공하는 요약기. 웹 콘텐츠 처리를 위해서는 타사 모델을 사용할 예정이지만, 개인 사용자 데이터 검색에는 자사의 파운데이션 모델(Foundation Models)을 활용해 개인정보 보호를 유지할 계획이다.베리타스(Veritas) 앱은 일반에 출시되지 않을 예정이며, 애플 임원들은 그동안 단독 챗봇 시장 진입에 대해 주저하는 모습을 보여 왔다. 애플 소프트웨어 책임자인 크레이그 페더리히(Craig Federighi)가 6월에 언급했듯, 이러한 도구는 “여전히 우리의 주된 목표가 아니며”, 별도의 챗봇 애플리케이션보다는 사용자 경험 전반에 통합된 AI 기능을 선호한다는 점을 강조했다.
766 조회
0 추천
2025.09.27 등록
(퍼플렉시티가 정리한 기사)OpenAI는 목요일에 획기적인 벤치마크를 공개하며, 인공지능 모델이 주요 산업 전반에서 전문적인 업무에서 인간 수준의 성능에 빠르게 접근하고 있음을 보여주었습니다. 회사의 GDPval 평가 시스템에 따르면, AI 모델은 이제 테스트된 작업의 거의 절반에서 인간 전문가와 동등하거나 그 이상의 성과를 내고 있어, 기계가 인간의 경제적 산출에 가장 근접한 시점에 도달했음을 시사합니다.이 벤치마크는 미국 국내총생산에 가장 크게 기여하는 9개 산업의 44개 직업에 걸쳐 주요 AI 모델을 숙련된 전문가들과 비교 평가했습니다. 여기에는 의료, 금융, 제조, 정부 등이 포함됩니다. 블라인드 비교에서 Anthropic의 Claude Opus 4.1이 인간 전문가와의 대결에서 47.6%의 승리 또는 동률 비율로 최고의 성과를 보였으며, OpenAI의 자체 GPT-5는 40.6%를 기록했습니다.극적인 성능 향상, 인공지능의 경제적 영향 신호이 결과는 AI 능력의 놀라운 가속을 보여줍니다. 15개월 전 공개된 OpenAI의 GPT-4o 모델은 유사한 과제에서 단 13.7%의 성공률을 기록했는데, 이는 GPT-5의 성능이 같은 기간 동안 거의 세 배 가까이 향상되었음을 의미합니다. “이러한 발전 속도는 정말 고무적입니다,“라고 OpenAI 평가 책임자인 테잘 파트워드한은 TechCrunch에 말했습니다.GDPval 평가는 기존의 AI 벤치마크와 달리 학술 시험이 아닌 실제 작업 결과물에 초점을 맞춥니다. 전문 평가자들은 사람이 만든 작업과 AI가 생성한 보고서, 법률 의견서, 엔지니어링 계획, 간호 돌봄 전략을 무엇이 AI 작품인지 모른 채 비교 평가했습니다. 과제들은 평균 14년 경력의 전문가들이 현실 직장 환경의 산출물을 반영할 수 있도록 설계했습니다.속도와 비용 이점이 직장 통합을 촉진한다품질 측면을 넘어, AI 모델은 놀라운 효율성 향상을 보여주었습니다. OpenAI는 첨단 모델이 GDPval 작업을 업계 전문가들보다 약 100배 더 빠르고 100배 더 저렴하게 완료할 수 있다고 밝혔습니다. 단, 이 수치는 반드시 필요한 인간의 감독 및 통합 단계를 고려하지 않은 수치입니다. OpenAI는 “특히 모델이 강점을 보이는 특정 작업에서는 인간에게 먼저 맡기기보다 모델에게 먼저 작업을 맡기는 것이 시간과 비용을 절감할 수 있을 것”이라고 밝혔습니다.OpenAI의 최고 이코노미스트인 Dr. Aaron Chatterji는 이러한 결과가 AI가 인간 노동자를 대체하기보다는 보완할 것임을 시사한다고 강조했습니다. “그 직업에 종사하는 사람들은 이제 모델을 사용할 수 있게 되었고, 모델의 역량이 점점 좋아지면서 일부 업무를 모델에 맡기고 잠재적으로 더 높은 가치의 일을 할 수 있게 될 것입니다”라고 그는 설명했습니다. 하지만 OpenAI는 현재 GDPval이 실제 직장 내 업무의 일부만을 테스트하고 있다고 인정하며, 향후 기준을 더 넓은 범위로 확장할 계획임을 밝혔습니다.
789 조회
0 추천
2025.09.26 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입