Loading...

AI 뉴스

애플, AI 편집 개선을 위해 40만 장의 이미지 데이터셋 공개

페이지 정보

작성자 xtalfi
작성일 2025.10.30 01:40
319 조회
0 추천
0 비추천

본문

apple_reuters_1754290388226.jpg

(퍼플렉시티가 정리한 기사)


Apple 연구진이 텍스트 프롬프트를 기반으로 인공지능 시스템이 사진을 편집하는 방식을 개선하기 위해 설계된 400,000개의 선별된 이미지를 포함하는 포괄적인 데이터셋인 Pico-Banana-400K를 공개했다고 이번 주 발표된 연구 논문에서 밝혔습니다.​

이 대규모 데이터셋은 Apple이 현재 AI 이미지 편집 훈련에서 중요한 격차로 설명하는 문제를 해결하는 것을 목표로 하며, 실제 사진으로 구축된 부적절한 데이터셋으로 인해 발전이 제약받아 왔습니다. GPT-4o와 같은 시스템이 인상적인 편집을 수행할 수 있지만, 연구진은 대규모의 고품질 훈련 데이터 부족이 이 분야의 발전을 제한해왔다고 말합니다.​


품질과 다양성에 대한 체계적 접근

Pico-Banana-400K를 이전 데이터셋과 구별하는 것은 Apple의 체계적인 품질 관리 접근 방식과 포괄적인 범위입니다. 이미지는 색상 변경과 같은 기본 조정부터 사람을 픽사 스타일 캐릭터나 레고 피겨로 변환하는 것과 같은 복잡한 변형에 이르기까지 8개 카테고리에 걸쳐 35가지 편집 유형으로 구성되어 있습니다.​

Apple은 Google의 Gemini-2.5-Flash-Image 모델(Nano-Banana로도 알려짐)을 사용하여 편집을 생성하고, Gemini-2.5-Pro를 자동화된 품질 관리 시스템으로 활용하여 지시 준수 및 기술적 품질을 기반으로 결과를 평가했습니다. 데이터셋의 각 이미지는 포함되기 전에 이러한 엄격한 AI 기반 검수 프로세스를 거쳤습니다.​

데이터셋에는 세 가지 특화된 하위 집합이 포함되어 있습니다: 기본 훈련을 위한 258,000개의 단일 편집 예제, 성공한 편집과 실패한 편집을 비교하는 56,000개의 선호도 쌍, 그리고 여러 연속 편집을 통해 이미지가 어떻게 진화하는지 보여주는 72,000개의 다중 턴 시퀀스.​


현재 AI의 한계 드러내기

애플의 연구는 현재 이미지 편집 모델의 중요한 한계를 드러냈습니다. 전역 스타일 변경은 93%의 성공률을 보인 반면, 객체 재배치나 텍스트 편집과 같은 정밀한 작업은 60% 미만의 성공률로 어려움을 겪었습니다. 이러한 발견은 AI 이미지 편집이 여전히 사용자 기대에 미치지 못하는 부분에 대한 귀중한 통찰을 제공합니다.​

전체 Pico-Banana-400K 데이터셋은 GitHub에서 비상업적 연구 목적으로 무료로 제공되며, 개발자와 연구자들이 더 유능한 이미지 편집 AI 시스템을 훈련시키는 데 사용할 수 있습니다. 연구자들에 따르면, 이 데이터셋은 "차세대 텍스트 기반 이미지 편집 모델을 훈련하고 벤치마킹하기 위한 견고한 기반"을 확립합니다.

댓글 0
전체 1,095 / 125 페이지
(퍼플렉시티가정리한기사)1XTechnologies는오늘가정집안일을위해설계된키5피트6인치의휴머노이드로봇NEO의사전주문을시작했으며,가격은$20,000또는월$499구독으로책정되었습니다.OpenAI와EQTVentures의지원을받는이회사는NEO를"가정생활을변화시키도록설계된세계최초의소비자용휴머노이드로봇"으로포지셔닝하고있습니다.​66파운드의이로봇은빨래개기,식기세척기비우기,공간정리하기와같은작업을수행할수있으며,배송은2026년에시작될예정입니다.그러나NEO가프로그래밍되지않은복잡한작업의경우,로봇은1X의원격인간운영자에의존하며,이들은로봇의카메라를통해보면서로봇의움직임을안내할수있습니다.​​프라이버시우려가출시를가리다"Chores"라는이름의원격조작기능은캘리포니아에있는1X직원들이NEO의듀얼8메가픽셀카메라를통해고객의집내부를볼수있게함으로써프라이버시우려를불러일으켰습니다.CEOBerntBørnich에따르면,"이제품을구매하신다면,그것은그러한사회적계약에동의하신다는의미입니다.귀하의데이터없이는제품을개선할수없습니다".​​회사는소유자가전문가지원세션을능동적으로예약해야하며통제권을유지한다고강조했으며,원격조작자가연결되면NEO의귀링이흰색에서파란색으로변한다고밝혔습니다.시연중NEO는작업을자율적으로수행하지못했고넘어지는경향을보여어린이와반려동물주변에서의안전문제를제기했습니다.​혼잡한시장진입NEO는2023년18억달러규모로평가되고2028년까지130억달러에달할것으로예상되는점점더경쟁이치열해지는휴머노이드로봇시장에진입합니다.CEO일론머스크는최근자신의회사가치의80%가결국옵티머스로봇에서나올것이라고주장했으며,Unitree와같은중국경쟁업체들은16,000달러부터시작하는휴머노이드로봇을제공합니다.​1XTechnologies는2023년OpenAI의스타트업펀드가주도한2,350만달러규모의시리즈A2와2024년1억달러규모의시리즈B를포함하여1억2,500만달러이상의자금을조달했습니다.이회사는100억달러의기업가치로최대10억달러의신규자금조달을모색하고있는것으로알려졌습니다.
307 조회
0 추천
2025.10.29 등록
(퍼플렉시티가정리한기사)Tesla회장로빈덴홀름(RobinDenholm)은월요일블룸버그인터뷰에서회사가필요시곧출시될사이버캡(Cybercab)로보택시에핸들과페달을추가할준비가되어있다고밝혔으며,이는전통적인조작장치가없는완전자율주행차량이라는CEO일론머스크의원래비전에서크게벗어난것입니다.​덴홀름은블룸버그뉴스에"핸들이필요하다면핸들과페달을장착할수있습니다"라고말하며,차량의생산과배치를제한할수있는잠재적인규제및기술적장애물에대응했습니다.​규제현실대자율주행비전잠재적인디자인변경은테슬라가사이버캡생산을심각하게제한할수있는상당한규제제약에직면하면서나온것입니다.현재연방규정에따르면제조업체는국가도로교통안전국(NHTSA)규칙에따라스티어링휠이나페달이없는차량을연간2,500대만배치할수있습니다.이러한제한은사이버캡을테슬라가구상하는대중시장용차량이아닌틈새제품으로만들것입니다.​테슬라는2026년2분기에텍사스기가팩토리에서사이버캡생산을시작할계획을발표했음에도불구하고,기존제어장치없이차량을생산하기위한필수NHTSA면제신청을아직제출하지않았습니다.현재회사는수리기술자부터제조전문가에이르기까지30개의채용공고를통해사이버캡생산팀을위한대규모채용을진행하고있습니다.​테슬라가2024년10월사이버캡을공개했을때,머스크는차량의자율주행전용디자인에대해단호했습니다."미러도,페달도,스티어링휠도없습니다.분명히말씀드리겠습니다.이차량은순수한로보택시로설계되어야합니다"라고머스크는개발중에밝히며,테슬라가"자율주행에올인"하고있다고강조했습니다.​기술적한계가지속되다테슬라가기존방식의조작장치를추가하려는의지는회사가무감독자율주행을해결하지못했다는현실을반영합니다.테슬라의현재완전자율주행(FullSelf-Driving)시스템은여전히"감독형"으로분류되어운전자의적극적인감시와개입이필요합니다.최근안전데이터에따르면오토파일럿기술을사용하는테슬라차량은2025년3분기에636만마일당1건의충돌을기록한반면,전국평균은70만2천마일당1건의충돌을기록했습니다.​회사는최근완전자율주행시스템에더높은속도와더공격적인차선변경을허용하는"매드맥스(MadMax)"모드를도입했지만,테슬라의자율주행기술에대한연방조사가진행중인상황에서비판을받고있습니다.여러전직테슬라자율주행프로그램책임자들이완전자율주행달성일정에대해공개적으로의문을제기했습니다.​한편,웨이모(Waymo)와같은경쟁사들은수년간의테스트와데이터수집끝에이미여러도시에서무인상업운영에대한규제승인을받았습니다.테슬라는아직캘리포니아와같은주요시장에서필요한허가를신청하지않았으며,최근새로운자율주행차법률이발효된텍사스에서도규제장애물에직면해있습니다.
323 조회
0 추천
2025.10.29 등록
(퍼플렉시티가정리한기사)Google는오늘미국전역에서GeminiforHome음성비서를출시하기시작했으며,이는2016년오리지널GoogleAssistant가출시된이후스마트홈생태계의가장중요한업그레이드입니다.AI기반대체기술은수백만명의Nest기기소유자에게보다자연스러운대화와고급스마트홈제어기능을약속합니다.Google의공식발표에따르면얼리액세스프로그램은지난10년간출시된호환가능한Google및Nest스피커와디스플레이를보유한사용자를대상으로오늘부터시작됩니다.이전업데이트와달리,이번전환은GoogleAssistant를Gemini의보다대화형AI기술로영구적으로교체하며,되돌릴수있는옵션은없습니다.​향상된AI기능이스마트홈제어를변화시키다GeminiforHome은경직된음성명령에서근본적으로전환된두가지독특한상호작용모드를도입합니다.사용자는일상적인작업을위해"HeyGoogle"이라고계속말할수있지만,보다자연스러운언어처리와맥락이해를경험하게됩니다.이제시스템은"사무실조명을제외한모든조명끄기"또는"조명을어둡게하고,온도를72도로설정하고TV켜기"와같은복잡한다중기기명령을처리할수있습니다.​새로운"HeyGoogle,let'schat"명령은GeminiLive를활성화하여반복적인웨이크워드없이연속적인대화를가능하게합니다.이모드를통해사용자는응답을중단하고,후속질문을하며,레시피제안부터숙제도움까지다양한주제에대해자연스러운대화를나눌수있습니다.​GeminiLive,카메라기록검색,음성제어자동화생성을포함한프리미엄기능은월$10부터시작하는GoogleHomePremium구독이필요합니다.월$20의Advanced티어는카메라영상에대한AI생성이벤트설명과검색가능한비디오기록을추가합니다.​스마트홈경쟁에대한전략적대응이번출시로구글은수년간스마트홈음성제어를지배해온Amazon의Alexa생태계와직접경쟁하게되었습니다.업계분석가들은이번출시시기가Amazon의최근AlexaPlus발표에이어진것이라며,스마트홈시장에서AI기반경쟁이심화되고있다고지적합니다.​GoogleHome&Nest의그룹제품관리자인MarkAlexander는"구글은Gemini의고급AI기능이마침내판도를바꿀수있을것으로기대하고있습니다"라고말했습니다.회사는GeminiforHome을"거실이나주방카운터에수천명의전문가가앉아도움을줄준비가되어있는것과같다"고설명합니다.​이서비스는2026년초에국제적으로확대될예정이며,구글은미국조기액세스기간이후더넓은지역에서사용할수있도록계획하고있습니다.호환기기에는지난10년동안제조된모든GoogleHome및Nest스피커와디스플레이가포함되어,기존하드웨어투자를보존하면서차세대AI기능을제공합니다.
318 조회
0 추천
2025.10.29 등록
(퍼플렉시티가정리한기사)EliLilly는화요일Nvidia와의획기적인파트너십을발표했으며,양사는이것이제약업계에서가장강력한AI슈퍼컴퓨터가될것이라고주장했습니다.이는신약개발을위해인공지능을활용하는경쟁에서중요한전환점이되고있습니다.1,000개이상의NvidiaBlackwellUltraGPU를탑재한이시스템은일반적인10년의신약개발기간을대폭단축하는것을목표로하며,2026년1월에운영을시작할예정입니다.​혁명적인규모와기술이슈퍼컴퓨터는통합네트워킹패브릭에1,000개이상의B300GPU를탑재한NVIDIADGXB300시스템을사용하는세계최초의NVIDIADGXSuperPOD를나타냅니다.이는504개의H100GPU로전세계35위에랭크된RecursionPharmaceuticals의BioHive-2시스템을포함한이전의제약컴퓨팅노력들을압도합니다.Lilly는2025년12월까지건설을완료할것으로예상하며,시스템은기존시설내에서100%재생가능전력으로운영될것입니다.​"우리업계에서우리가하는일을이규모로하는다른회사는없다고생각합니다"라고Lilly의최고정보및디지털책임자인DiogoRau부사장이말했습니다.이슈퍼컴퓨터는데이터수집및학습부터대량추론에이르기까지전체AI라이프사이클을관리하는특수컴퓨팅인프라인"AI팩토리"를구동할것입니다.​TuneLab플랫폼,산업접근성확대이슈퍼컴퓨터는2025년9월에출시된Lilly의TuneLab플랫폼을지원할예정이며,이플랫폼은바이오테크기업들에게10억달러이상의가치를지닌Lilly의연구데이터로훈련된AI모델에대한접근을제공합니다.이플랫폼은연합학습기술을활용하여,기업들이독점데이터를직접공유하지않고도Lilly의AI역량을활용할수있도록합니다.​BioPharmaDive에따르면,CirclePharma,Insitro,FireflyBio,SuperluminalMedicines를포함하여약12개의스타트업이TuneLab에합류했습니다.Lilly에따르면,이플랫폼은"바이오테크기업들이이용할수있는AI시스템을훈련하는데사용된업계에서가장가치있는데이터셋중하나"를나타냅니다.​AI신약개발시장은폭발적인성장을경험하고있으며,GlobalMarketInsights는연평균성장률30.1%로2025년46억달러에서2034년까지495억달러로확대될것으로전망하고있습니다.이러한급속한확장은신약개발가속화에대한압박이증가하고있음을반영하며,AI로설계된약물은PhaseI임상시험에서80-90%의성공률을보이는반면전통적인접근방식은40-65%의성공률을보입니다.
331 조회
0 추천
2025.10.29 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입