Loading...

AI 뉴스

AI가 15장의 이미지를 사용하여 초신성을 93% 정확도로 감지

페이지 정보

작성자 xtalfi
작성일 2025.10.09 00:47
1,164 조회
0 추천
0 비추천

본문

b7588c93ce90afb83558df75f42cd087Mpao.jpg

(퍼플렉시티가 정리한 기사)

옥스퍼드 대학교와 구글 클라우드의 천문학자들이 과학자들이 우주 현상을 탐지하는 방식을 혁신할 수 있는 돌파구를 마련했습니다. 이들은 인공지능이 초신성이나 소행성 이동과 같은 천문 현상을 최소한의 훈련 데이터만으로도 놀라울 만큼 정확하게 식별할 수 있음을 증명했습니다.

오늘자 Nature Astronomy에 게재된 연구에 따르면, 구글의 Gemini AI는 단 15장의 예시 이미지만을 사용해 실제 우주 현상과 오신호를 약 93%의 정확도로 구별할 수 있었습니다. 이는 고급 천문학 도구를 광범위한 기계 학습 전문 지식 없이도 연구자들이 이용할 수 있게 하는 데 있어 중요한 진전을 의미합니다.

 

천문학적 데이터 폭증에 대응하기

 

현대의 망원경은 밤마다 하늘에서 일어날 수 있는 잠재적 변화에 대해 수백만 건의 경고를 생성하지만, 대다수는 위성 흔적, 우주선 충돌 또는 기기 이상에 의해 발생한 "가짜" 신호입니다. 차세대 기구가 도입되면 이 문제는 더욱 심각해집니다. 다가오는 베라 C. 루빈 천문대는 매 24시간마다 약 20테라바이트의 데이터를 생성하고, 밤마다 최대 1,000만 건의 경고를 보내게 됩니다.

"몇 개의 예시와 명확한 텍스트 지침만으로도 이러한 정확도가 나온다는 것은 놀라운 일입니다,"라고 옥스퍼드 대학교 물리학과의 공동 책임 저자인 피오렌조 스토파 박사는 말했습니다. "이는 다양한 분야의 과학자들이 신경망 훈련에 대한 깊은 전문지식 없이도 분류기를 자신만의 방식으로 개발할 수 있게 해줍니다. 필요한 것은 오직 하나를 만들고자 하는 의지뿐입니다."

연구팀은 Gemini를 ATLAS, MeerLICHT, Pan-STARRS라는 세 가지 주요 천문학 조사에 걸쳐 테스트했습니다. 전통적인 '블랙 박스' 머신러닝 시스템이 단순히 '실제' 혹은 '가짜' 분류만을 제공하는 것과 달리, Gemini는 모든 결정에 대해 일반 영어로 설명을 생성하여 인공지능의 추론 과정을 투명하고 신뢰성 있게 만들었습니다.

 

단순 분류를 넘어서

 

이 접근 방식을 돋보이게 하는 점은 AI가 스스로 신뢰 수준을 평가할 수 있다는 것입니다. 팀이 젬니(Gemini)에게 자신의 분류를 검토하도록 했을 때, 모델의 신뢰도가 정확성의 강력한 지표라는 사실을 발견했습니다. 즉, 일관성이 낮은 결과는 훨씬 더 오류가 있을 가능성이 높았습니다. 이러한 자기 평가 기능은 신뢰할 수 있는 '인간-중재' 워크플로우를 구현하여, 확신이 없는 사례를 인간 검토를 위해 자동으로 표시할 수 있습니다.

이 피드백 메커니즘을 사용해, 팀은 한 데이터셋에서 모델의 성능을 약 93.4%에서 96.7%로 향상시켰습니다. AI의 설명을 검토한 12명의 천문학자 패널은 이 설명들이 매우 일관성 있고 유용하다고 평가했습니다.

"천문학에 대한 공식적인 교육은 없지만 이 연구는 매우 흥미롭습니다."라고 Google Cloud의 공동 저자 투란 불무스는 말했습니다. "이것은 범용 LLM이 과학적 발견을 민주화할 수 있음을 보여줍니다. 호기심이 있다면 누구나 전통적인 배경이 없는 분야에도 의미 있는 기여를 할 수 있게 해줍니다."

옥스포드 대학 물리학과의 스티븐 스마트 교수는 실질적인 영향에 대해 강조했습니다. "저는 10년 넘게 하늘 조사에서 생성되는 데이터를 신속하게 처리하는 문제에 관여해 왔는데, 실제 사건과 잘못된 신호를 구분하는 일이 항상 어려웠습니다. LLM이 최소한의 안내로 소스를 인식하는 정확도는 과제-특화된 훈련 없이도 놀라웠어요. 만약 우리가 이 기술을 대규모로 적용할 수 있다면, 분야에 엄청난 변화를 가져올 수 있을 것입니다".

팀은 이 기술이 과학 분야에서 자율적인 '에이전틱 어시스턴트'의 기반이 될 것으로 보고 있습니다. 이러한 에이전트는 여러 가지 데이터 소스를 통합하고, 자신의 신뢰 수준을 점검하며, 로봇 망원경에 후속 관측을 자동으로 요청하고, 가장 유망한 발견만 인간 과학자에게 보고할 수 있습니다.

 

댓글 0
전체 1,244 / 242 페이지
(퍼플렉시티가 정리한 기사)블룸버그의 보도에 따르면, Apple은 Siri의 대대적인 개편을 준비하며 이를 내년에 선보이기 위해 내부적으로 ChatGPT와 유사한 아이폰 앱을 개발했다고 합니다. 이 앱은 “Veritas”라는 코드명을 가지고 있는데, 이는 라틴어로 “진실”을 의미합니다. Apple의 AI 부서에서는 음성 비서의 조기 공개(2026년 초 예정)를 앞두고 새로운 기능을 빠르게 평가하기 위해 이 앱을 활용하고 있습니다.이 내부 테스트 앱은 인기 있는 챗봇들과 유사하게 설계되어, Apple 직원들이 다양한 주제에 걸친 여러 대화를 동시에 관리할 수 있도록 하며, 과거의 대화를 저장하고 참고할 수 있는 기능과 장기적인 대화 지원 기능도 제공합니다. 이 소프트웨어는 아직 개발 중인 Siri를 지원할 기술을 효율적으로 테스트할 수 있는 플랫폼 역할을 하며, 챗봇 포맷이 실제로 가치가 있는지도 피드백을 수집하는 데 활용되고 있습니다.시리(Siri) 대대적인 개편, 2026년으로 연기새롭게 개편된 Siri는 현재 애플의 음성 어시스턴트와는 완전히 다른 아키텍처로 재설계된 것입니다. 블룸버그에 따르면 애플은 iOS 26.4 업데이트와 함께 2026년 봄 출시를 목표로 하고 있으며, 이는 3월에 등장할 가능성이 높습니다. 이번 신버전은 ChatGPT, Claude, Gemini와 유사한 고급 대형 언어 모델을 활용해 지속적인 대화를 유지하고, 인간과 유사한 답변을 제공하며, 더 복잡한 작업도 수행할 수 있게 됩니다.애플은 원래 iOS 18에서 향상된 Siri를 선보일 예정이었지만, 엔지니어링 문제로 인해 기능이 최대 3분의 1까지 실패하는 사태가 발생해 출시를 연기했습니다. 회사는 초기 Apple Intelligence Siri 계획을 폐기하고, 어시스턴트를 2세대 아키텍처로 완전히 재설계하기로 결정했으며, 대형 언어 모델로의 전환을 가속화하고 있습니다.개발 중인 제3자 인공지능 파트너십자체 AI 역량을 개발하고 있음에도 불구하고, 애플은 새로운 시리를 구현하기 위해 주요 AI 기업들과 적극적으로 협력하고 있다. 애플은 요약 기능을 위한 맞춤형 Gemini AI 모델을 평가 및 테스트하기 위해 구글 과 공식적으로 협약을 맺었다. 또한, 애플은 계획 기능에 클로드(Claude)를 활용하는 방안에 대해 Anthropic과 심도 있는 논의를 진행했으나, 비용 문제로 인해 구글의 제품이 더 매력적으로 여겨졌던 것으로 전해진다.새로운 시리 시스템은 세 가지 핵심 요소로 구성된다: 음성 또는 텍스트 입력을 해석하는 플래너, 웹과 사용자 기기에서 검색하는 시스템, 그리고 최종 답변을 제공하는 요약기. 웹 콘텐츠 처리를 위해서는 타사 모델을 사용할 예정이지만, 개인 사용자 데이터 검색에는 자사의 파운데이션 모델(Foundation Models)을 활용해 개인정보 보호를 유지할 계획이다.베리타스(Veritas) 앱은 일반에 출시되지 않을 예정이며, 애플 임원들은 그동안 단독 챗봇 시장 진입에 대해 주저하는 모습을 보여 왔다. 애플 소프트웨어 책임자인 크레이그 페더리히(Craig Federighi)가 6월에 언급했듯, 이러한 도구는 “여전히 우리의 주된 목표가 아니며”, 별도의 챗봇 애플리케이션보다는 사용자 경험 전반에 통합된 AI 기능을 선호한다는 점을 강조했다.
1351 조회
0 추천
2025.09.27 등록
(퍼플렉시티가 정리한 기사)OpenAI는 목요일에 획기적인 벤치마크를 공개하며, 인공지능 모델이 주요 산업 전반에서 전문적인 업무에서 인간 수준의 성능에 빠르게 접근하고 있음을 보여주었습니다. 회사의 GDPval 평가 시스템에 따르면, AI 모델은 이제 테스트된 작업의 거의 절반에서 인간 전문가와 동등하거나 그 이상의 성과를 내고 있어, 기계가 인간의 경제적 산출에 가장 근접한 시점에 도달했음을 시사합니다.이 벤치마크는 미국 국내총생산에 가장 크게 기여하는 9개 산업의 44개 직업에 걸쳐 주요 AI 모델을 숙련된 전문가들과 비교 평가했습니다. 여기에는 의료, 금융, 제조, 정부 등이 포함됩니다. 블라인드 비교에서 Anthropic의 Claude Opus 4.1이 인간 전문가와의 대결에서 47.6%의 승리 또는 동률 비율로 최고의 성과를 보였으며, OpenAI의 자체 GPT-5는 40.6%를 기록했습니다.극적인 성능 향상, 인공지능의 경제적 영향 신호이 결과는 AI 능력의 놀라운 가속을 보여줍니다. 15개월 전 공개된 OpenAI의 GPT-4o 모델은 유사한 과제에서 단 13.7%의 성공률을 기록했는데, 이는 GPT-5의 성능이 같은 기간 동안 거의 세 배 가까이 향상되었음을 의미합니다. “이러한 발전 속도는 정말 고무적입니다,“라고 OpenAI 평가 책임자인 테잘 파트워드한은 TechCrunch에 말했습니다.GDPval 평가는 기존의 AI 벤치마크와 달리 학술 시험이 아닌 실제 작업 결과물에 초점을 맞춥니다. 전문 평가자들은 사람이 만든 작업과 AI가 생성한 보고서, 법률 의견서, 엔지니어링 계획, 간호 돌봄 전략을 무엇이 AI 작품인지 모른 채 비교 평가했습니다. 과제들은 평균 14년 경력의 전문가들이 현실 직장 환경의 산출물을 반영할 수 있도록 설계했습니다.속도와 비용 이점이 직장 통합을 촉진한다품질 측면을 넘어, AI 모델은 놀라운 효율성 향상을 보여주었습니다. OpenAI는 첨단 모델이 GDPval 작업을 업계 전문가들보다 약 100배 더 빠르고 100배 더 저렴하게 완료할 수 있다고 밝혔습니다. 단, 이 수치는 반드시 필요한 인간의 감독 및 통합 단계를 고려하지 않은 수치입니다. OpenAI는 “특히 모델이 강점을 보이는 특정 작업에서는 인간에게 먼저 맡기기보다 모델에게 먼저 작업을 맡기는 것이 시간과 비용을 절감할 수 있을 것”이라고 밝혔습니다.OpenAI의 최고 이코노미스트인 Dr. Aaron Chatterji는 이러한 결과가 AI가 인간 노동자를 대체하기보다는 보완할 것임을 시사한다고 강조했습니다. “그 직업에 종사하는 사람들은 이제 모델을 사용할 수 있게 되었고, 모델의 역량이 점점 좋아지면서 일부 업무를 모델에 맡기고 잠재적으로 더 높은 가치의 일을 할 수 있게 될 것입니다”라고 그는 설명했습니다. 하지만 OpenAI는 현재 GDPval이 실제 직장 내 업무의 일부만을 테스트하고 있다고 인정하며, 향후 기준을 더 넓은 범위로 확장할 계획임을 밝혔습니다.
1377 조회
0 추천
2025.09.26 등록
(퍼플렉시티가 정리한 기사)Meta는 Meta AI 앱과 웹사이트 내에 새로운 AI 생성 동영상 피드인 Vibes를 출시하며, 소셜 미디어 대기업이 인공지능과 소셜 콘텐츠 제작을 결합하려는 가장 대담한 시도를 선보였다. 이번 플랫폼은 목요일에 공개되었으며, 사용자가 TikTok이나 Instagram Reels와 유사한 짧은 형식의 AI 동영상을 생성하고 공유할 수 있게 해준다. 그러나 초기 사용자 반응은 압도적으로 부정적이었다.AI 기반 소셜 피드에 대한 엇갈린 반응CEO 마크 저커버그는 인스타그램 게시글을 통해 AI로 생성된 영상을 선보이며 이번 롤아웃을 발표했습니다. 영상에는 큐브 사이를 뛰어다니는 복슬복슬한 생물, 반죽을 치대는 고양이, 그리고 고대 이집트를 내려다보면서 셀카를 찍는 고대 이집트 여성이 등장했습니다. 그러나 해당 게시글에 달린 유저 댓글들은 대체로 비판적이었는데, 가장 많은 공감을 받은 댓글은 “아무도 이걸 원하지 않는다”고 적혀 있었고, 또 다른 인기 댓글에서는 “본인 앱에 AI 쓰레기를 올리네”라는 반응이 있었습니다.이처럼 부정적인 반응은 AI로 생성된 콘텐츠가 소셜 미디어 플랫폼을 도배하고 있다는 더 넓은 우려를 반영합니다. 많은 이용자들이 이런 콘텐츠를 ‘AI 쓰레기’(AI slop)라고 부르는데, 이는 진정성이 결여된 저품질의 인공적인 콘텐츠를 의미합니다. 특히 메타가 올해 초 “독창성 없는” 페이스북 콘텐츠 문제를 해결하겠다며, 크리에이터에게 “진정성 있는 스토리텔링”에 집중해달라고 조언했던 전례를 고려할 때, 이번 비판은 더욱 날카롭게 다가옵니다.전략적 파트너십이 AI 비디오 추진을 이끈다메타는 최고 AI 책임자 알렉산더 왕에 따르면, 바이브스(Vibes)의 초기 버전을 위해 AI 이미지 생성기인 미드저니(Midjourney)와 블랙 포레스트 랩스(Black Forest Labs)와 협력하고 있습니다. 이 파트너십 전략은 상당한 투자를 의미하며, 메타는 블랙 포레스트 랩스와만 1억 4천만 달러 이상의 다년 계약을 체결한 것으로 알려졌습니다. 독일 스타트업인 블랙 포레스트 랩스는 1년차에 3,500만 달러, 2년차에 1억 500만 달러를 받게 됩니다.바이브스 플랫폼은 사용자가 텍스트 프롬프트를 이용해 처음부터 영상을 생성하거나, 피드에서 기존 콘텐츠를 리믹스하거나, 자신만의 자료로 작업할 수 있도록 해줍니다. 사용자는 새 비주얼을 추가하고, 음악을 레이어링하며, 스타일을 조정한 뒤 바이브스 피드에 직접 공유하거나, 다이렉트 메시지로 전송하거나, 인스타그램과 페이스북 스토리 및 릴스에 크로스포스팅할 수 있습니다.더 넓은 AI 재구성의 일부Meta가 최근 OpenAI, Anthropic, Google DeepMind와 같은 경쟁사에 뒤처질 수 있다는 우려 속에서 AI 역량 강화에 막대한 투자를 해온 가운데 이번 출시가 이루어졌습니다. 6월에 회사는 주요 직원의 이탈 이후 “Meta Superintelligence Labs”를 신설하며 AI 운영 구조를 개편했습니다. Meta는 지난해 약 1,650억 달러의 매출을 올렸으며, 이번 부서가 Meta AI 앱, 이미지-영상 광고 도구, 스마트 안경 등을 통해 새로운 수익원을 창출할 것으로 기대하고 있습니다.Vibes의 출시 시기는 Meta의 광범위한 AI 생태계 확장과 맞물려 있습니다. Meta AI 앱은 AI 기반 Ray-Ban 스마트 안경을 관리하는 제어 허브 역할도 합니다. 이러한 통합 전략은 Meta의 플랫폼 가족 간에 매끄러운 콘텐츠 파이프라인을 구축하는 것을 목표로 하며, 대규모 사용자 기반을 바탕으로 독립형 AI 도구보다 경쟁우위를 제공할 수 있습니다.
1366 조회
0 추천
2025.09.26 등록
(퍼플렉시티가 정리한 기사)Google 는 오늘 Gemini 2.5 Flash 인공지능 모델에 대한 주요 업데이트를 공개했습니다. 이번 업데이트에서는 강화된 포맷팅 기능, 향상된 이미지 이해력, 그리고 소비자와 개발자 플랫폼 모두에서 보다 효율적인 토큰 사용이 도입되었습니다. 현재 이 업데이트는 Gemini 앱, Google AI Studio, Vertex AI에서 이용 가능하며, 초기 테스트 사용자들은 복잡한 작업에서 최대 15%의 성능 향상을 보고하고 있습니다.소비자 앱, 스마트 서식 업그레이드 적용향상된 Gemini 2.5 Flash 모델은 이제 헤더, 목록, 표를 사용해 응답을 자동으로 구성하여 복잡한 결과물을 더 명확하고 쉽게 확인할 수 있도록 합니다. 구글에 따르면 이 모델은 특히 상세한 안내가 필요한 복잡한 과목의 숙제 질문에 대한 단계별 설명도 개선되었습니다.“우리는 숙제 질문에 대한 Gemini의 추론 능력을 개선하여, Gemini가 복잡한 과목도 명확하고 단계별로 안내할 수 있도록 만들었습니다,“라고 구글은 공식 릴리스 노트에서 밝혔습니다.업데이트된 이미지 이해 기능을 통해 사용자는 더 자세한 이미지와 다이어그램을 업로드하여 설명, 정리, 요약이 가능합니다. 구글은 이제 사용자가 수업 노트를 사진으로 찍어 Gemini에게 플래시카드를 만들거나 학습 자료를 정리하도록 요청할 수 있다고 제안합니다.개발자들은 효율성 향상과 새로운 도구를 제공합니다개발자를 위해 Google은 Gemini 2.5 Flash 및 Flash-Lite의 프리뷰 버전을 모두 출시했으며, 상당한 효율성 향상을 이뤄냈습니다. Flash-Lite 모델은 이전 버전에 비해 출력 토큰 사용량이 50% 감소했으며, 표준 Flash 모델 역시 토큰 사용량이 24% 줄었습니다. 이러한 감소는 애플리케이션의 운영 비용 절감과 더 빠른 응답 시간으로 직접 연결됩니다.업데이트된 Flash 모델은 SWE-Bench Verified 벤치마크에서 5%의 성능 향상을 보여주었으며, 정확도가 48.9%에서 54%로 상승했습니다. 자율 AI 에이전트 회사인 Manus의 초기 피드백에 따르면, “장기 에이전트 작업에서 성능이 15% 향상”되었다고 밝혔습니다.“새로운 Gemini 2.5 Flash 모델은 속도와 지능을 놀라울 정도로 잘 조화시킵니다.“라고 Manus의 공동 창립자이자 수석 과학자인 Yichao ‘Peak’ Ji가 언급했습니다. “내부 벤치마크 평가에서 장기 에이전트 작업의 성능이 15% 향상된 것을 확인했습니다”.경쟁 모멘텀이 구축된다이러한 업데이트는 Gemini가 최근 ChatGPT를 제치고 미국 애플 앱스토어에서 무료 앱 1위를 차지하는 등 상당한 시장 점유율을 확보한 가운데 이루어졌습니다. 플랫폼은 2025년 7월 기준 월간 활성 사용자 4억 5천만 명을 자랑하며, 구글 주가는 연초 대비 33% 넘게 상승해 기업 시가총액이 3조 달러를 돌파했습니다.구글은 개발자들이 각 릴리스마다 코드를 업데이트하지 않아도 새로운 기능에 접근할 수 있도록 가장 최신 버전으로 자동 연결되는 새로운 “-latest” 모델 별칭을 도입했습니다. 회사는 “-latest” 별칭 뒤에 있는 모델에 변경을 가하기 최소 2주 전에 공지를 제공할 예정입니다.이러한 개선 사항들은 오픈AI의 GPT-5, Anthropic의 Claude Opus 4.1 등 주요 AI 모델들과 치열하게 경쟁하는 환경에서 구글의 AI 솔루션의 경쟁력을 강화하고 있습니다.
1397 조회
0 추천
2025.09.26 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입