Loading...

AI 뉴스

서울대, 역전파에 필적하는 AI 훈련 방법 공개

페이지 정보

작성자 xtalfi
작성일 2025.10.17 15:54
689 조회
0 추천
0 비추천

본문

2219855926_gm9fgb.jpg

(퍼플렉시티가 정리한 기사)

서울과학기술대학교 연구진은 오늘 수십 년간 딥러닝을 이끌어온 지배적인 역전파 방법에 대한 보다 효율적인 대안을 제공하여 인공지능 모델 훈련 방식을 변화시킨 획기적인 알고리즘을 발표했다.​

전기정보공학과 박사과정 이길하 연구원과 김현 부교수가 이끄는 연구팀이 개발한 시각 순방향-순방향 네트워크(VFF-Net)는 기존 훈련 방법의 중요한 한계를 해결하는 동시에 더 빠르고 지속 가능한 AI 개발을 약속한다.

 

역전파의 한계 극복하기

 

전통적인 심층 신경망 훈련은 역전파에 크게 의존하는데, 이는 계층을 통해 오류를 역방향으로 전파하여 네트워크 가중치를 반복적으로 조정하는 방법입니다. 성공적이기는 하지만, 이 접근 방식은 느린 수렴, 과적합 경향, 높은 계산 요구량, 그리고 해석하기 어렵게 만드는 "블랙박스" 특성으로 인해 어려움을 겪고 있습니다.​

"합성곱 신경망 훈련에 순전파-순전파 네트워크를 직접 적용하면 입력 이미지의 정보 손실이 발생하여 정확도가 감소할 수 있습니다"라고 Lee는 설명했습니다. "또한, 수많은 합성곱 계층을 가진 범용 CNN의 경우, 각 계층을 개별적으로 훈련하면 성능 문제가 발생할 수 있습니다. 우리의 VFF-Net은 이러한 문제들을 효과적으로 해결합니다."​

연구팀의 솔루션은 세 가지 혁신적인 방법론을 도입합니다: 레이블별 노이즈 라벨링(LWNL), 코사인 유사도 기반 대조 손실(CSCL), 그리고 계층 그룹화(LG). 이러한 기술들은 계층별 훈련의 효율성 이점을 유지하면서 이미지 분류에 중요한 공간 정보를 보존하기 위해 함께 작동합니다.

 

성능 및 지속가능성 이점

 

VFF-Net은 벤치마크 테스트에서 기존의 순방향-순방향 네트워크에 비해 상당한 개선을 보여주었습니다. 4개의 합성곱 계층을 가진 CNN 모델의 경우, 이 알고리즘은 CIFAR-10 데이터셋에서 테스트 오류를 8.31%, CIFAR-100에서 3.80% 감소시켰습니다. 또한 VFF-Net은 MNIST 손글씨 숫자 데이터셋에서 단 1.70%의 테스트 오류를 달성했습니다.​

"역전파에서 벗어남으로써 VFF-Net은 광범위한 컴퓨팅 리소스가 필요하지 않은 더 가볍고 뇌와 유사한 학습 방법으로 가는 길을 열어줍니다"라고 Kim 박사는 말했습니다. "이는 강력한 AI 모델이 개인 기기, 의료 기기, 가전제품에서 직접 실행될 수 있음을 의미하며, 에너지 집약적인 데이터 센터에 대한 의존도를 줄이고 AI를 더욱 지속 가능하게 만듭니다."​

2025년 10월 1일 Neural Networks 저널 190권에 게재된 이 연구는 엣지 디바이스에서 강력한 AI 모델의 광범위한 배포를 가능하게 할 수 있는 생물학적으로 더 그럴듯한 AI 학습 방법을 향한 중요한 진전을 나타냅니다.

댓글 0
전체 1,129 / 180 페이지
(퍼플렉시티가 정리한 기사)Apple은 오늘 획기적인 M5 칩을 발표했으며, 이는 이전 M4 대비 4배 이상의 최대 GPU 컴퓨팅 성능을 제공하여 Apple Silicon의 AI 성능에서 다음 주요 도약을 의미합니다. 새로운 칩은 14인치 MacBook Pro, iPad Pro, Apple Vision Pro의 업데이트된 버전에 탑재되며, 모두 오늘부터 사전 주문 가능하고 10월 22일부터 정식 출시됩니다.획기적인 AI 아키텍처가 성능 향상을 견인하다M5의 혁신적인 아키텍처는 각 코어에 전용 Neural Accelerator를 탑재한 차세대 10코어 GPU를 중심으로 하며, 모든 기기에서 M4 대비 최대 3.5배 빠른 AI 성능을 제공합니다. 3세대 3나노미터 기술로 제작된 이 칩은 이러한 AI 성능과 함께 최대 45% 향상된 그래픽 성능, 그리고 최대 15% 빠른 멀티스레드 성능을 제공하는 10코어 CPU를 결합했습니다.​Apple의 하드웨어 기술 담당 수석 부사장 Johny Srouji는 "M5는 Apple 실리콘의 AI 성능에서 다음 큰 도약을 이끌어냅니다"라고 말했습니다. 이 칩은 또한 향상된 16코어 Neural Engine과 153GB/s로 거의 30% 증가한 통합 메모리 대역폭을 특징으로 합니다.​Apple은 Draw Things와 같은 앱에서의 AI 기반 이미지 생성부터 로컬 대규모 언어 모델 처리까지, 까다로운 워크플로우 전반에 걸친 M5의 성능을 선보였습니다. M5를 탑재한 MacBook Pro는 이전 세대 대비 최대 3.5배 빠른 AI 성능과 최대 1.6배 빠른 그래픽 성능을 제공합니다.업데이트된 프로 기기는 창작 전문가를 대상으로 합니다새로운 14인치 맥북 프로는 $1,599의 시작 가격을 유지하면서 최대 24시간의 배터리 수명과 RAW 이미지 파일 가져오기와 같은 작업을 위한 더 빠른 SSD 성능을 제공합니다. 이 제품은 동일한 디자인 언어와 스페이스 블랙, 실버 마감으로 제공되며, 외관 변화보다는 내부 성능에 중점을 둔 개선이 이루어졌습니다.​아이패드 프로 모델은 보다 큰 업데이트를 받았으며, 11인치 모델은 $999부터, 13인치 모델은 $1,299부터 시작합니다. 태블릿에는 이제 최대 50% 더 빠른 셀룰러 데이터 성능을 제공하는 Apple의 C1X 셀룰러 모뎀과 Wi-Fi 7을 지원하는 새로운 N1 무선 칩이 포함되어 있습니다. 업데이트된 모델은 256GB 및 512GB 모델이 이제 12GB의 통합 메모리로 시작하는 등, 메모리 구성도 증가했습니다.​Apple Vision Pro는 M5 칩과 함께 개선된 편안함을 위한 새로운 듀얼 니트 밴드를 탑재했으며, 최대 10% 더 많은 픽셀을 120Hz의 최대 주사율로 렌더링할 수 있습니다. 이 헤드셋은 이제 단일 충전으로 최대 2시간 30분 동안 일반 용도를 지원합니다.​애플의 이번 신제품 발표는 AI 가속 워크플로우를 추구하는 전문가층에 대한 지속적인 집중을 보여주며, 이러한 기기들을 차세대 창작 및 기술 활용을 위한 필수 도구로 자리매김하고 있습니다.
838 조회
0 추천
2025.10.16 등록
(퍼플렉시티가 정리한 기사)OpenAI CEO 샘 알트먼은 화요일 GITEX Global 2025에 가상으로 참석하여 인류의 기술적 미래에 대한 놀라운 예측을 내놓았으며, 수천 명의 참석자들에게 올해 태어난 아이들은 결코 인공지능보다 똑똑하지 않을 것이라고 말했다.샌프란시스코에서 두바이 컨퍼런스에 연결된 알트먼은 인간과 인공지능 사이의 관계에서 일어나고 있는 근본적인 변화에 대해 언급했다. "저에게는 2025년에 태어난 아이가 있는데, 그 아이가 AI보다 더 똑똑할 것이라고 생각하지 않습니다. 하지만 그것이 그 아이의 행복이나 성취감을 방해하지는 않을 것이라고 생각합니다"라고 그는 UAE 기반 G42의 그룹 CEO인 펑 샤오(Peng Xiao)와의 대화에서 말했다.GPT-5가 과학적 돌파구를 마련하다Altman은 AI 역량에서 상당한 진전을 공개하며 "처음으로 GPT-5가 매우 작지만 실질적인 과학적 돌파구를 만들어내고 있다"고 발표했습니다. OpenAI CEO는 과학적 진보를 "지속 가능한 인류 발전의 심장박동"이라고 표현했으며, 2026년까지 AI 시스템이 새로운 통찰력을 발견하고 2027년까지 로봇이 실용적인 실제 작업을 수행할 것이라고 예측했습니다.​이러한 발전은 올해 초 시작된 OpenAI의 광범위한 "OpenAI for Science" 이니셔티브와 일치하며, 이는 AI 기반 플랫폼을 통해 과학적 발견을 가속화하는 것을 목표로 합니다. 최근 보고서에 따르면 GPT-5는 이론 물리학 논문에서 증명 아이디어를 제안하는 데 활용되었으며, 코딩 및 건강 관련 작업에서 상당한 개선을 달성했습니다.AI 네이티브 사회가 형성되고 있다"초기 도입에서 AI 네이티브 사회로: 차세대 지능 시대 전망"을 주제로 한 이 논의는 UAE가 전례 없는 규모로 AI 통합을 선도하고 있는 방식을 강조했습니다. 펑 샤오는 G42의 회장인 아부다비 부통치자 셰이크 타흐눈 빈 자예드가 자신의 집에 일본 건축 단지를 설계하기 위해 500개 이상의 프롬프트로 ChatGPT를 사용하여 1년 이내에 프로젝트를 완료했다고 밝혔습니다.​더욱 놀랍게도, 샤오는 "우리 회장의 사무실에서는 너무 많은 직원을 볼 수 없는데, 그의 사무실에서 일하는 AI 에이전트의 비율이 10대 1이기 때문입니다"라고 공개했습니다. 이는 양측 리더들이 AI가 미래의 가능성이 아닌 "우리 일상 생활의 필수적인 부분"이 되고 있다고 특징지은 것을 나타냅니다.​대화는 또한 OpenAI, G42, Oracle, SoftBank 간의 대규모 5,000억 달러 AI 인프라 협력인 프로젝트 스타게이트에 대해서도 다루었습니다. 관계자들은 계획된 5기가와트 UAE 시설의 첫 200메가와트가 내년에 가동될 예정이며, 더 광범위한 프로젝트는 전 세계적으로 10기가와트를 목표로 하고 있다고 확인했습니다. 알트먼은 "지능의 비용은 결국 에너지 비용과 같아질 것"이라고 강조하며, 에너지 정책을 모든 국가의 AI 전략에 중요한 요소로 설명했습니다.
765 조회
0 추천
2025.10.16 등록
(퍼플렉시티가 정리한 기사)Reddit 공동 창업자 Alexis Ohanian은 최근 팟캐스트 출연에서 인터넷의 악화되는 상태에 대한 경고를 강화하며 "인터넷의 대부분이 이제 죽었다"고 선언했습니다. 이는 자동화된 트래픽이 10년 만에 처음으로 인간 활동을 추월했다는 새로운 데이터가 나온 시점에 나온 발언입니다.최근 AI 기만 사례가 증가하는 문제를 부각시키다오헤니안의 우려는 이번 주말 그의 플랫폼에서 화제가 된 한 사건을 언급하면서 다시 한 번 긴박해졌다. 수천 명의 Reddit 이용자들이 '파운드 케이크'라는 가상의 과체중 고양이가 체중 감량 여정을 시작했다는 게시물에 속았기 때문이다. 이 게시물들은 엄청난 참여와 감정적 몰입을 이끌어냈지만, 나중에 완전히 AI가 생성한 것임이 밝혀졌다.​"또 한 번 ‘죽은 인터넷 이론(Dead Internet Theory)’에 대해 상기시켜드릴 때가 된 것 같습니다,"라고 오헤니안은 일요일에 X에 글을 올리며 인공지능이 온라인 커뮤니티를 얼마나 쉽게 조작할 수 있는지 강조했다. 파운드 케이크 사기는 연구자들이 'AI 쓰레기’(AI slop)라고 부르는 현상을 보여준다. 즉, 감정적 조작을 통해 참여를 유발하도록 설계된 합성 콘텐츠이다.​The Best People Network 팟캐스트에서 오헤니안은 인터넷을 점점 더 '봇화' 또는 '준AI'화 되고 있다고 묘사하며, '링크드인 쓰레기(LinkedIn slop)'라고 부르는 반복적이고 알고리즘 친화적인 콘텐츠가 진정성보다 참여를 우선시한다고 말했다. "여러분 모두가 이제 인터넷의 많은 부분이 죽었다는 점을 증명하고 있습니다,"라고 그는 진행자들에게 말했다.봇 트래픽이 전환점에 도달하다Ohanian의 경고는 사이버 보안 회사 Imperva의 우려스러운 새로운 통계와 일치하는데, 이에 따르면 2024년 전체 웹 트래픽의 51%가 자동화된 트래픽으로 나타났다 - 이는 10년 만에 처음으로 봇이 온라인에서 인간을 앞지른 것이다. 특히 악성 봇 활동은 2023년 32%에서 37%로 급증했다.​이러한 증가는 봇 생성을 더욱 접근 가능하고 확장 가능하게 만든 대규모 언어 모델과 AI 도구의 확산과 직접적으로 관련이 있다. Imperva의 2025 악성 봇 보고서에 따르면 "AI 대규모 언어 모델의 등장으로 유해한 목적을 위한 봇을 더 쉽게 생성하고 확장할 수 있게 되었다".진정한 연결은 사적인 공간으로 후퇴한다공공 플랫폼의 품질 저하에 대응하여, Ohanian은 진정한 인간 상호작용이 더 작고 사적인 디지털 공간으로 이동했다고 관찰했습니다. "이제 모든 것이 그룹 채팅에서 일어나고 있습니다"라고 그는 말했으며, 이는 사람들이 알고리즘 조작에서 벗어나 진정한 대화를 찾는 Signal과 Discord 같은 플랫폼을 언급한 것입니다.​그러나 이러한 안식처조차 침투에 직면하고 있습니다. 일부 사용자들은 그룹 채팅에서 메시지를 생성하고 편집하기 위해 AI 도구를 통합하기 시작했으며, 이는 공공 플랫폼을 공허하게 만든 것과 동일한 인위적인 역학을 들여올 가능성이 있습니다.​OpenAI CEO Sam Altman도 이러한 우려에 동의하며, 9월에 "죽은 인터넷 이론을 그렇게 심각하게 받아들인 적은 없었지만" 이제는 "많은 LLM이 운영하는 트위터 계정들"을 보고 있다고 인정했습니다. 주요 기술 리더들의 관찰이 수렴되면서, 한때 음모론적 사고로 치부되었던 죽은 인터넷 이론이 입증 가능한 현실이 되었음을 시사합니다.인간이 검증하는 미래를 향하여Ohanian은 라이브 콘텐츠와 실시간 상호작용을 진정한 참여의 증거로 강조하면서, "검증 가능한 인간"이 될 "차세대 소셜 미디어"를 구상하고 있다. 그는 미래의 플랫폼들이 단순히 자동화된 상호작용을 확장하는 것이 아니라 "생명의 증명"을 보여주어야 한다고 주장했다.​이 과제는 개별 플랫폼을 넘어 인터넷의 근본적인 아키텍처까지 확장되는데, 이는 내장된 검증 시스템 없이 인간 대 인간 커뮤니케이션을 위해 설계되었다. AI가 생성한 콘텐츠가 인간의 창작물과 구별할 수 없게 되면서, 인증 메커니즘의 부재는 신뢰할 수 있는 정보원이자 진정한 연결로서의 인터넷 기능을 위협하고 있다.​이러한 변화는 인간 연결성이라는 인터넷의 본래 약속에서 극명하게 벗어난 것을 나타내며, 연구자들이 점점 더 폐쇄된 디지털 환각의 루프 속에서 "봇이 봇에게 말하는" 것으로 묘사하는 것으로 대체되고 있다.
842 조회
0 추천
2025.10.16 등록
(퍼플렉시티가 정리한 기사)한국을 대표하는 4대 그룹 총수들이 손정의 소프트뱅크 회장의 초청으로 미국을 방문해 대규모 AI 인프라 프로젝트 '스타게이트' 협력과 한미 관세 협상 지원 방안을 논의한다.​15일 재계에 따르면 이재용 삼성전자 회장, 최태원 SK그룹 회장, 정의선 현대차그룹 회장, 구광모 LG그룹 회장이 손정의 소프트뱅크 회장의 초청으로 미국 방문에 나선다.스타게이트 프로젝트 협력 논의이번 방문의 핵심은 손 회장이 주도하는 5000억 달러 규모의 AI 인프라 프로젝트 '스타게이트'에 대한 협력 방안 논의다. 소프트뱅크는 오픈AI, 오라클과 함께 향후 4년간 미국 전역에 AI 데이터센터 등을 구축하는 이 프로젝트의 공동 창립자로 참여하고 있다.​삼성과 SK그룹은 이미 올해 2월 이재용 회장과 최태원 회장이 오픈AI CEO 샘 올트만, 손정의 회장과 서울에서 3자 회담을 갖고 스타게이트 프로젝트 협력을 논의한 바 있다. 당시 손 회장은 "삼성전자 이 회장에게 스타게이트 프로젝트에 대해 브리핑하고 협력 방안을 논의했다"고 밝혔다.한미 관세 협상 지원 역할총수들의 방문은 김용범 대통령실 정책실장과 김정관 산업통상자원부 장관이 16일 워싱턴 DC를 방문해 한미 관세 협상 후속 논의를 진행하는 일정과 맞물린다. 현재 한미 양국은 지난 7월 합의된 3500억 달러 규모의 대미 투자 자금 운용 방안을 두고 이견을 보이고 있다.​조현 외교부 장관은 13일 "미국이 새로운 대안을 제시해왔고, 우리도 검토 중"이라며 "3500억 달러를 모두 현금으로 투자하지 않는다는 것은 엄청난 진전"이라고 밝혔다. 한국 정부는 전액 직접투자가 외환 시장에 미칠 충격을 우려해 대출과 보증을 포함한 패키지 방식을 제안해왔다.마러라고에서 트럼프와 만날 가능성이들의 회동 장소는 도널드 트럼프 대통령의 별장인 플로리다 마러라고 리조트로 예상된다. 손정의 회장은 2017년 트럼프 당선 직후에도 마러라고를 방문해 500억 달러 대미 투자 계획을 발표하며 트럼프와의 인맥을 쌓은 바 있다.​트럼프 대통령의 이번 회동 참석 여부는 확인되지 않았으나, 트럼프가 이달 말 한국 APEC 정상회의 참석차 방한을 앞둔 상황에서 양국 기업인들과의 만남 가능성도 제기되고 있다.
799 조회
0 추천
2025.10.15 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입