Loading...

AI 뉴스

애플, AI 편집 개선을 위해 40만 장의 이미지 데이터셋 공개

페이지 정보

작성자 xtalfi
작성일 2025.10.30 01:40
237 조회
0 추천
0 비추천

본문

apple_reuters_1754290388226.jpg

(퍼플렉시티가 정리한 기사)


Apple 연구진이 텍스트 프롬프트를 기반으로 인공지능 시스템이 사진을 편집하는 방식을 개선하기 위해 설계된 400,000개의 선별된 이미지를 포함하는 포괄적인 데이터셋인 Pico-Banana-400K를 공개했다고 이번 주 발표된 연구 논문에서 밝혔습니다.​

이 대규모 데이터셋은 Apple이 현재 AI 이미지 편집 훈련에서 중요한 격차로 설명하는 문제를 해결하는 것을 목표로 하며, 실제 사진으로 구축된 부적절한 데이터셋으로 인해 발전이 제약받아 왔습니다. GPT-4o와 같은 시스템이 인상적인 편집을 수행할 수 있지만, 연구진은 대규모의 고품질 훈련 데이터 부족이 이 분야의 발전을 제한해왔다고 말합니다.​


품질과 다양성에 대한 체계적 접근

Pico-Banana-400K를 이전 데이터셋과 구별하는 것은 Apple의 체계적인 품질 관리 접근 방식과 포괄적인 범위입니다. 이미지는 색상 변경과 같은 기본 조정부터 사람을 픽사 스타일 캐릭터나 레고 피겨로 변환하는 것과 같은 복잡한 변형에 이르기까지 8개 카테고리에 걸쳐 35가지 편집 유형으로 구성되어 있습니다.​

Apple은 Google의 Gemini-2.5-Flash-Image 모델(Nano-Banana로도 알려짐)을 사용하여 편집을 생성하고, Gemini-2.5-Pro를 자동화된 품질 관리 시스템으로 활용하여 지시 준수 및 기술적 품질을 기반으로 결과를 평가했습니다. 데이터셋의 각 이미지는 포함되기 전에 이러한 엄격한 AI 기반 검수 프로세스를 거쳤습니다.​

데이터셋에는 세 가지 특화된 하위 집합이 포함되어 있습니다: 기본 훈련을 위한 258,000개의 단일 편집 예제, 성공한 편집과 실패한 편집을 비교하는 56,000개의 선호도 쌍, 그리고 여러 연속 편집을 통해 이미지가 어떻게 진화하는지 보여주는 72,000개의 다중 턴 시퀀스.​


현재 AI의 한계 드러내기

애플의 연구는 현재 이미지 편집 모델의 중요한 한계를 드러냈습니다. 전역 스타일 변경은 93%의 성공률을 보인 반면, 객체 재배치나 텍스트 편집과 같은 정밀한 작업은 60% 미만의 성공률로 어려움을 겪었습니다. 이러한 발견은 AI 이미지 편집이 여전히 사용자 기대에 미치지 못하는 부분에 대한 귀중한 통찰을 제공합니다.​

전체 Pico-Banana-400K 데이터셋은 GitHub에서 비상업적 연구 목적으로 무료로 제공되며, 개발자와 연구자들이 더 유능한 이미지 편집 AI 시스템을 훈련시키는 데 사용할 수 있습니다. 연구자들에 따르면, 이 데이터셋은 "차세대 텍스트 기반 이미지 편집 모델을 훈련하고 벤치마킹하기 위한 견고한 기반"을 확립합니다.

댓글 0
전체 908 / 78 페이지
(퍼플렉시티가정리한기사)Waymo공동CEO인테케드라마와카나는월요일테슬라와다른자율주행자동차회사들을향해우회적이지만날카로운비판을가했으며,안전기록에대한투명성부족이무인운전시대를향해달려가는업계의신뢰성을훼손하고있다고주장했다.​샌프란시스코에서열린테크크런치디스럽트에서연설한마와카나는테슬라를직접거명하지는않았지만,자율주행차량운영에서얻은상세한안전데이터를공개적으로공유하기를거부하는회사들을향한비판임을분명히했다."투명하게공개하지않는다면,실제로도로를더안전하게만들권리를얻기위해필요한일을하고있지않은것입니다"라고그녀는말했다.​안전데이터격차이논평들은자율주행차량회사들이안전투명성에접근하는방식에서점점커지는격차를강조합니다.Waymo는공개적으로접근가능한"안전허브"에상세한충돌데이터를게시하며,최근자사차량이인간운전자에비해심각한부상을유발하는충돌사고에연루될가능성이91%낮다고주장했습니다.이회사는공공도로에서1억마일이상을주행했습니다.​반면Tesla는초기단계의로보택시프로그램이아닌,고속도로지원기술인Autopilot에초점을맞춘분기별안전보고서만발표합니다.이회사는6월에각차량에안전모니터를배치하여시작한오스틴로보택시서비스에대한공개안전데이터를공개하지않았습니다.컨퍼런스에서Tesla가투명성기준을충족하는지질문을받았을때,Mawakana는직접답변하기를거부하며단순히"어떻게생각하세요?"라고응답했습니다​규제감독이강화되다이러한비판은두회사모두강화되는규제압력에직면하면서제기되었습니다.미국도로교통안전국(NHTSA)은10월7일테슬라의완전자율주행(FullSelf-Driving)시스템에대한새로운조사를개시했으며,신호위반과같은교통법규위반과관련된14건의충돌사고와23건의부상을포함한58건의보고된사고에대해288만대의차량을조사하고있습니다.한편,NHTSA는웨이모차량이정차한스쿨버스를우회한최근사건에대해서도조사하고있습니다.​테슬라CEO일론머스크는회사의3분기실적발표에서2025년말까지오스틴로보택시차량에서안전운전자를제거하여완전무인운행으로나아갈계획이라고발표했습니다.현재테슬라의오스틴서비스는필요시개입할수있는안전모니터와함께운영되고있는반면,웨이모는이미여러도시에서무인차량을운영하고있습니다.​마와카나의신랄한발언은자율주행자동차산업이더광범위한배치로나아가면서투명성이핵심쟁점이될수있음을시사하며,기업들은내부평가가아닌공개데이터로자사기술의안전성주장을입증해야한다는압력에직면하고있습니다.
244 조회
0 추천
2025.10.29 등록
(퍼플렉시티가정리한기사)1XTechnologies는오늘가정집안일을위해설계된키5피트6인치의휴머노이드로봇NEO의사전주문을시작했으며,가격은$20,000또는월$499구독으로책정되었습니다.OpenAI와EQTVentures의지원을받는이회사는NEO를"가정생활을변화시키도록설계된세계최초의소비자용휴머노이드로봇"으로포지셔닝하고있습니다.​66파운드의이로봇은빨래개기,식기세척기비우기,공간정리하기와같은작업을수행할수있으며,배송은2026년에시작될예정입니다.그러나NEO가프로그래밍되지않은복잡한작업의경우,로봇은1X의원격인간운영자에의존하며,이들은로봇의카메라를통해보면서로봇의움직임을안내할수있습니다.​​프라이버시우려가출시를가리다"Chores"라는이름의원격조작기능은캘리포니아에있는1X직원들이NEO의듀얼8메가픽셀카메라를통해고객의집내부를볼수있게함으로써프라이버시우려를불러일으켰습니다.CEOBerntBørnich에따르면,"이제품을구매하신다면,그것은그러한사회적계약에동의하신다는의미입니다.귀하의데이터없이는제품을개선할수없습니다".​​회사는소유자가전문가지원세션을능동적으로예약해야하며통제권을유지한다고강조했으며,원격조작자가연결되면NEO의귀링이흰색에서파란색으로변한다고밝혔습니다.시연중NEO는작업을자율적으로수행하지못했고넘어지는경향을보여어린이와반려동물주변에서의안전문제를제기했습니다.​혼잡한시장진입NEO는2023년18억달러규모로평가되고2028년까지130억달러에달할것으로예상되는점점더경쟁이치열해지는휴머노이드로봇시장에진입합니다.CEO일론머스크는최근자신의회사가치의80%가결국옵티머스로봇에서나올것이라고주장했으며,Unitree와같은중국경쟁업체들은16,000달러부터시작하는휴머노이드로봇을제공합니다.​1XTechnologies는2023년OpenAI의스타트업펀드가주도한2,350만달러규모의시리즈A2와2024년1억달러규모의시리즈B를포함하여1억2,500만달러이상의자금을조달했습니다.이회사는100억달러의기업가치로최대10억달러의신규자금조달을모색하고있는것으로알려졌습니다.
249 조회
0 추천
2025.10.29 등록
(퍼플렉시티가정리한기사)Tesla회장로빈덴홀름(RobinDenholm)은월요일블룸버그인터뷰에서회사가필요시곧출시될사이버캡(Cybercab)로보택시에핸들과페달을추가할준비가되어있다고밝혔으며,이는전통적인조작장치가없는완전자율주행차량이라는CEO일론머스크의원래비전에서크게벗어난것입니다.​덴홀름은블룸버그뉴스에"핸들이필요하다면핸들과페달을장착할수있습니다"라고말하며,차량의생산과배치를제한할수있는잠재적인규제및기술적장애물에대응했습니다.​규제현실대자율주행비전잠재적인디자인변경은테슬라가사이버캡생산을심각하게제한할수있는상당한규제제약에직면하면서나온것입니다.현재연방규정에따르면제조업체는국가도로교통안전국(NHTSA)규칙에따라스티어링휠이나페달이없는차량을연간2,500대만배치할수있습니다.이러한제한은사이버캡을테슬라가구상하는대중시장용차량이아닌틈새제품으로만들것입니다.​테슬라는2026년2분기에텍사스기가팩토리에서사이버캡생산을시작할계획을발표했음에도불구하고,기존제어장치없이차량을생산하기위한필수NHTSA면제신청을아직제출하지않았습니다.현재회사는수리기술자부터제조전문가에이르기까지30개의채용공고를통해사이버캡생산팀을위한대규모채용을진행하고있습니다.​테슬라가2024년10월사이버캡을공개했을때,머스크는차량의자율주행전용디자인에대해단호했습니다."미러도,페달도,스티어링휠도없습니다.분명히말씀드리겠습니다.이차량은순수한로보택시로설계되어야합니다"라고머스크는개발중에밝히며,테슬라가"자율주행에올인"하고있다고강조했습니다.​기술적한계가지속되다테슬라가기존방식의조작장치를추가하려는의지는회사가무감독자율주행을해결하지못했다는현실을반영합니다.테슬라의현재완전자율주행(FullSelf-Driving)시스템은여전히"감독형"으로분류되어운전자의적극적인감시와개입이필요합니다.최근안전데이터에따르면오토파일럿기술을사용하는테슬라차량은2025년3분기에636만마일당1건의충돌을기록한반면,전국평균은70만2천마일당1건의충돌을기록했습니다.​회사는최근완전자율주행시스템에더높은속도와더공격적인차선변경을허용하는"매드맥스(MadMax)"모드를도입했지만,테슬라의자율주행기술에대한연방조사가진행중인상황에서비판을받고있습니다.여러전직테슬라자율주행프로그램책임자들이완전자율주행달성일정에대해공개적으로의문을제기했습니다.​한편,웨이모(Waymo)와같은경쟁사들은수년간의테스트와데이터수집끝에이미여러도시에서무인상업운영에대한규제승인을받았습니다.테슬라는아직캘리포니아와같은주요시장에서필요한허가를신청하지않았으며,최근새로운자율주행차법률이발효된텍사스에서도규제장애물에직면해있습니다.
257 조회
0 추천
2025.10.29 등록
(퍼플렉시티가정리한기사)Google는오늘미국전역에서GeminiforHome음성비서를출시하기시작했으며,이는2016년오리지널GoogleAssistant가출시된이후스마트홈생태계의가장중요한업그레이드입니다.AI기반대체기술은수백만명의Nest기기소유자에게보다자연스러운대화와고급스마트홈제어기능을약속합니다.Google의공식발표에따르면얼리액세스프로그램은지난10년간출시된호환가능한Google및Nest스피커와디스플레이를보유한사용자를대상으로오늘부터시작됩니다.이전업데이트와달리,이번전환은GoogleAssistant를Gemini의보다대화형AI기술로영구적으로교체하며,되돌릴수있는옵션은없습니다.​향상된AI기능이스마트홈제어를변화시키다GeminiforHome은경직된음성명령에서근본적으로전환된두가지독특한상호작용모드를도입합니다.사용자는일상적인작업을위해"HeyGoogle"이라고계속말할수있지만,보다자연스러운언어처리와맥락이해를경험하게됩니다.이제시스템은"사무실조명을제외한모든조명끄기"또는"조명을어둡게하고,온도를72도로설정하고TV켜기"와같은복잡한다중기기명령을처리할수있습니다.​새로운"HeyGoogle,let'schat"명령은GeminiLive를활성화하여반복적인웨이크워드없이연속적인대화를가능하게합니다.이모드를통해사용자는응답을중단하고,후속질문을하며,레시피제안부터숙제도움까지다양한주제에대해자연스러운대화를나눌수있습니다.​GeminiLive,카메라기록검색,음성제어자동화생성을포함한프리미엄기능은월$10부터시작하는GoogleHomePremium구독이필요합니다.월$20의Advanced티어는카메라영상에대한AI생성이벤트설명과검색가능한비디오기록을추가합니다.​스마트홈경쟁에대한전략적대응이번출시로구글은수년간스마트홈음성제어를지배해온Amazon의Alexa생태계와직접경쟁하게되었습니다.업계분석가들은이번출시시기가Amazon의최근AlexaPlus발표에이어진것이라며,스마트홈시장에서AI기반경쟁이심화되고있다고지적합니다.​GoogleHome&Nest의그룹제품관리자인MarkAlexander는"구글은Gemini의고급AI기능이마침내판도를바꿀수있을것으로기대하고있습니다"라고말했습니다.회사는GeminiforHome을"거실이나주방카운터에수천명의전문가가앉아도움을줄준비가되어있는것과같다"고설명합니다.​이서비스는2026년초에국제적으로확대될예정이며,구글은미국조기액세스기간이후더넓은지역에서사용할수있도록계획하고있습니다.호환기기에는지난10년동안제조된모든GoogleHome및Nest스피커와디스플레이가포함되어,기존하드웨어투자를보존하면서차세대AI기능을제공합니다.
244 조회
0 추천
2025.10.29 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입