Loading...

AI 뉴스

애플, AI 편집 개선을 위해 40만 장의 이미지 데이터셋 공개

페이지 정보

작성자 xtalfi
작성일 2025.10.30 01:40
1,587 조회
0 추천
0 비추천

본문

apple_reuters_1754290388226.jpg

(퍼플렉시티가 정리한 기사)


Apple 연구진이 텍스트 프롬프트를 기반으로 인공지능 시스템이 사진을 편집하는 방식을 개선하기 위해 설계된 400,000개의 선별된 이미지를 포함하는 포괄적인 데이터셋인 Pico-Banana-400K를 공개했다고 이번 주 발표된 연구 논문에서 밝혔습니다.​

이 대규모 데이터셋은 Apple이 현재 AI 이미지 편집 훈련에서 중요한 격차로 설명하는 문제를 해결하는 것을 목표로 하며, 실제 사진으로 구축된 부적절한 데이터셋으로 인해 발전이 제약받아 왔습니다. GPT-4o와 같은 시스템이 인상적인 편집을 수행할 수 있지만, 연구진은 대규모의 고품질 훈련 데이터 부족이 이 분야의 발전을 제한해왔다고 말합니다.​


품질과 다양성에 대한 체계적 접근

Pico-Banana-400K를 이전 데이터셋과 구별하는 것은 Apple의 체계적인 품질 관리 접근 방식과 포괄적인 범위입니다. 이미지는 색상 변경과 같은 기본 조정부터 사람을 픽사 스타일 캐릭터나 레고 피겨로 변환하는 것과 같은 복잡한 변형에 이르기까지 8개 카테고리에 걸쳐 35가지 편집 유형으로 구성되어 있습니다.​

Apple은 Google의 Gemini-2.5-Flash-Image 모델(Nano-Banana로도 알려짐)을 사용하여 편집을 생성하고, Gemini-2.5-Pro를 자동화된 품질 관리 시스템으로 활용하여 지시 준수 및 기술적 품질을 기반으로 결과를 평가했습니다. 데이터셋의 각 이미지는 포함되기 전에 이러한 엄격한 AI 기반 검수 프로세스를 거쳤습니다.​

데이터셋에는 세 가지 특화된 하위 집합이 포함되어 있습니다: 기본 훈련을 위한 258,000개의 단일 편집 예제, 성공한 편집과 실패한 편집을 비교하는 56,000개의 선호도 쌍, 그리고 여러 연속 편집을 통해 이미지가 어떻게 진화하는지 보여주는 72,000개의 다중 턴 시퀀스.​


현재 AI의 한계 드러내기

애플의 연구는 현재 이미지 편집 모델의 중요한 한계를 드러냈습니다. 전역 스타일 변경은 93%의 성공률을 보인 반면, 객체 재배치나 텍스트 편집과 같은 정밀한 작업은 60% 미만의 성공률로 어려움을 겪었습니다. 이러한 발견은 AI 이미지 편집이 여전히 사용자 기대에 미치지 못하는 부분에 대한 귀중한 통찰을 제공합니다.​

전체 Pico-Banana-400K 데이터셋은 GitHub에서 비상업적 연구 목적으로 무료로 제공되며, 개발자와 연구자들이 더 유능한 이미지 편집 AI 시스템을 훈련시키는 데 사용할 수 있습니다. 연구자들에 따르면, 이 데이터셋은 "차세대 텍스트 기반 이미지 편집 모델을 훈련하고 벤치마킹하기 위한 견고한 기반"을 확립합니다.

댓글 0
전체 1,366 / 142 페이지
(퍼플렉시티가 정리한 기사)Google는11월10일,기기내개인정보보호표준을유지하면서강력한Gemini모델기능을제공하도록설계된클라우드기반AI처리플랫폼인PrivateAICompute를공개했습니다.이시스템은인공지능분야에서점점커지는과제,즉사용자데이터보안을침해하지않으면서스마트폰처리한계를초과하는정교한AI기능을제공하는방법을해결합니다.​이플랫폼은Google의맞춤형TensorProcessingUnit과TitaniumIntelligenceEnclave를사용하는하드웨어격리환경에서실행되며,회사가설명하는"안전하고강화된공간"을생성하여민감한데이터가암호화된상태로유지되고Google자체도액세스할수없도록합니다.이아키텍처는AMD의SEV-SNP기술을사용하여서버메모리를승인된가상머신만액세스할수있는암호화된세그먼트로분할하여하이퍼바이저나운영체제의무단액세스를방지합니다.​픽셀기기에클라우드파워제공하기PrivateAICompute는초기에Pixel기기에서두가지기능을지원합니다.Pixel10시리즈의MagicCue는이제이메일과캘린더의개인정보를처리하면서클라우드기반Gemini모델을활용하여"더시의적절한제안"을제공합니다.Recorder앱은Pixel8및최신모델부터시작하여영어,중국어(만다린),힌디어,이탈리아어,프랑스어,독일어,일본어등7개언어로녹취록을요약하는기능을제공합니다.​이시스템은원격증명과종단간암호화를사용하여기기를보안된클라우드환경에연결합니다.Google에따르면,PrivateAICompute를통해처리되는데이터는즉각적인작업에만사용되며다른목적으로저장되거나액세스할수없습니다.Google은이플랫폼이사용자가기기내처리에서기대하는것과동일한개인정보보호를클라우드기반AI작업으로확장한다고강조합니다.​애플의영향력과산업에미치는영향Google의발표는2024년6월Apple의PrivateCloudCompute도입에이어진것으로,이는클라우드처리능력과엄격한개인정보보호보장을유사하게결합합니다.두시스템모두하드웨어보안엔클레이브와증명프로토콜을사용하여클라우드처리중사용자데이터를보호합니다.​Google의AI혁신및연구부사장인JayYagnik은블로그게시물에서"이것은시작에불과합니다"라고썼습니다."PrivateAICompute는가장민감한사용사례에온디바이스모델과고급클라우드모델을모두사용할수있게됨에따라유용한AI경험을위한새로운가능성을열어줍니다."​이플랫폼은2025년11월Google의PixelFeatureDrop의일부로출시되었으며,알림요약,스캠감지개선및GoogleMaps의절전모드도포함됩니다.
1415 조회
0 추천
2025.11.12 등록
(퍼플렉시티가정리한기사)토스증권이12일인공지능(AI)기술을활용한시장분석서비스'AI시그널'을출시했다고밝혔다.뉴스와공시데이터를실시간으로분석해주가변동이유를설명하는이서비스는지난5월선보인해외기업어닝콜실시간번역서비스에이어토스증권의두번째AI기반서비스다.​실시간주가변동원인분석AI시그널은투자자가보유하거나관심있는종목의주가가움직일때가격변동이유를핵심요약형태로제공한다.토스증권모바일트레이딩시스템(MTS)의'관심'탭에서확인할수있으며,현재일부사용자를대상으로베타테스트가진행중이다.토스증권은이르면이번주중서비스를정식출시할예정이다.​이서비스는검색증강생성(RAG)기술을활용해국내외기업공시와뉴스등주가변동과연관있는주요시장신호를AI가포착하고,신호가주가에어떤영향을줬을지자체추론해결론을제시한다.48시간이내에발생한뉴스와공시로데이터를제한하고,토스증권이자체개발한뉴스분류모델을활용해단순홍보성기사나불필요한정보를걸러낸다.​세가지자체개발AI기술적용토스증권은이번서비스에뉴스분류,번역,리즈닝(Reasoning)등자체개발한세가지AI기술을적용했다.뉴스분류모델은하루수천건의뉴스와공시중시장에영향을준정보를선별하고관련업종을자동으로분류한다.금융전문용어와수치처리에특화된자체번역모델은해외뉴스및공시정보를빠르고정확하게해석해제공한다.​특히리즈닝기술은다양한출처의정보를AI가비교·검증해주가변동의원인을논리적으로추론하는기능이다.예를들어특정산업이상승한이유를"공급망회복과실적개선기대"같은구체적문장으로제시하고,근거의신뢰도와수치의정확성까지함께검증한다.​토스증권관계자는"이번서비스를통해투자자가범람하는정보속에서정보탐색의피로를줄이고,시장흐름에대한이해도를높이는데도움을줄것으로기대한다"며"앞으로도지속적인AI기술고도화를통해고객이투자의주도권을가질수있는환경을만드는데집중할계획"이라고밝혔다.
1312 조회
0 추천
2025.11.12 등록
(퍼플렉시티가정리한기사)카카오가AI에이전트앱서비스'카나나(Kanana)'의웹버전을출시해PC환경으로서비스접점을확대했다고12일밝혔다.​웹버전카나나는URL(mate.kanana.ai/home)을통해접속할수있으며,기존모바일앱이용자는동일한계정으로로그인해사용가능하다.신규가입자는카카오계정으로가입할수있다.​개인메이트중심기능제공카카오는웹버전출시초기개인메이트중심의기능을제공하며,그룹방기능등은단계적인업데이트를거쳐지원할예정이다.첫화면에서는개인AI메이트'나나'와다양한대화를나눌수있으며,화면왼쪽리스트에서스페셜AI메이트들도선택해이용할수있다.​스페셜AI메이트는지난달모바일앱업데이트를통해신설됐으며,타로,사주,챌린지,스터디코칭,보험상담등총5종으로구성됐다.카카오는이번웹버전에'카나나더알아보기'메뉴를추가해주제별메이트를소개하고다양한기능과새로운소식을전달할계획이다.​AI생태계구축가속화김종한카카오카나나성과리더는"더많은이용자들이카나나서비스를경험할수있도록플랫폼을확장했다"며"순차적으로기능을추가함으로써모바일중심의AI에이전트서비스를더넓은환경으로지속적으로확대해나갈것"이라고밝혔다.​카카오는올해9월연례개발자행사'if(kakao)25'에서카카오톡과결합된AI전략을공개하며,에이전틱AI생태계구현을목표로제시한바있다.향후모바일앱에서지원하는다양한기능들을웹버전에도순차적으로추가할계획이다.
1406 조회
0 추천
2025.11.12 등록
(퍼플렉시티가정리한기사)AdvancedMicroDevicesCEO리사수는화요일,이칩제조업체가AI데이터센터시장이2030년까지1조달러에달할것으로예상한다고발표했으며,뉴욕에서열린회사의금융애널리스트데이에서AMD가급성장하는인공지능인프라시장에서더큰점유율을확보하기위한야심찬성장전략을공개했습니다.​나스닥에서연설한수는향후3~5년동안회사가연간35%이상의매출성장을달성할계획을밝혔으며,데이터센터AI부문은같은기간동안연평균80%의성장률로확대될것으로예상된다고설명했습니다.이번발표는AMD가전년대비36%증가한92억달러의3분기기록적인매출을보고한지일주일후에이루어졌습니다.​엔비디아의지배력에도전하기AMD의1조달러시장전망은Nvidia의추정치와극명한대조를이루며,CEOJensenHuang은더광범위한AI인프라시장이2030년까지3조달러에서4조달러에이를것으로예측하고있습니다.Nvidia는현재90%이상의시장점유율로AI칩분야를지배하고있지만,AMD는꾸준히입지를넓혀가고있습니다.​"데이터센터가가장큰성장기회라는것은의심의여지가없으며,AMD가매우유리한위치에있습니다"라고Su는행사에서말했습니다.이회사는현재약6%로추정되는점유율에서3년에서5년내에AI데이터센터부문에서두자릿수시장점유율을확보하는것을목표로하고있습니다.​AMD의전략은2025년10월OpenAI와의획기적인파트너십을중심으로하며,이AI기업은2026년하반기부터1기가와트의MI450시리즈칩을시작으로6기가와트의AMDGPU를배치할예정입니다.최고재무책임자JeanHu는회사가2027년까지데이터센터AI매출이수백억달러에이를것으로예상한다고밝혔습니다.​AI가속기를넘어서는확장AMD의수정된1조달러시장추정치는Su가6월에언급한5,000억달러의두배로,이제CPU,네트워킹구성요소및AI가속기를포함한더광범위한포트폴리오를포괄합니다.회사는현재40%에서50%이상의서버CPU수익시장점유율달성을목표로하는동시에클라이언트PC시장의40%를목표로하고있습니다.​이칩제조업체는AI역량구축에막대한투자를해왔으며,지난5년동안연구개발에400억달러이상,인수합병에600억달러이상을지출했습니다.여기에는2025년3월에완료된49억달러규모의ZTSystems인수가포함되며,이를통해AMD의포트폴리오에랙규모시스템설계전문성이추가되었습니다.
1412 조회
0 추천
2025.11.12 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입