Loading...

AI 뉴스

애플, AI 편집 개선을 위해 40만 장의 이미지 데이터셋 공개

페이지 정보

작성자 xtalfi
작성일 2025.10.30 01:40
337 조회
0 추천
0 비추천

본문

apple_reuters_1754290388226.jpg

(퍼플렉시티가 정리한 기사)


Apple 연구진이 텍스트 프롬프트를 기반으로 인공지능 시스템이 사진을 편집하는 방식을 개선하기 위해 설계된 400,000개의 선별된 이미지를 포함하는 포괄적인 데이터셋인 Pico-Banana-400K를 공개했다고 이번 주 발표된 연구 논문에서 밝혔습니다.​

이 대규모 데이터셋은 Apple이 현재 AI 이미지 편집 훈련에서 중요한 격차로 설명하는 문제를 해결하는 것을 목표로 하며, 실제 사진으로 구축된 부적절한 데이터셋으로 인해 발전이 제약받아 왔습니다. GPT-4o와 같은 시스템이 인상적인 편집을 수행할 수 있지만, 연구진은 대규모의 고품질 훈련 데이터 부족이 이 분야의 발전을 제한해왔다고 말합니다.​


품질과 다양성에 대한 체계적 접근

Pico-Banana-400K를 이전 데이터셋과 구별하는 것은 Apple의 체계적인 품질 관리 접근 방식과 포괄적인 범위입니다. 이미지는 색상 변경과 같은 기본 조정부터 사람을 픽사 스타일 캐릭터나 레고 피겨로 변환하는 것과 같은 복잡한 변형에 이르기까지 8개 카테고리에 걸쳐 35가지 편집 유형으로 구성되어 있습니다.​

Apple은 Google의 Gemini-2.5-Flash-Image 모델(Nano-Banana로도 알려짐)을 사용하여 편집을 생성하고, Gemini-2.5-Pro를 자동화된 품질 관리 시스템으로 활용하여 지시 준수 및 기술적 품질을 기반으로 결과를 평가했습니다. 데이터셋의 각 이미지는 포함되기 전에 이러한 엄격한 AI 기반 검수 프로세스를 거쳤습니다.​

데이터셋에는 세 가지 특화된 하위 집합이 포함되어 있습니다: 기본 훈련을 위한 258,000개의 단일 편집 예제, 성공한 편집과 실패한 편집을 비교하는 56,000개의 선호도 쌍, 그리고 여러 연속 편집을 통해 이미지가 어떻게 진화하는지 보여주는 72,000개의 다중 턴 시퀀스.​


현재 AI의 한계 드러내기

애플의 연구는 현재 이미지 편집 모델의 중요한 한계를 드러냈습니다. 전역 스타일 변경은 93%의 성공률을 보인 반면, 객체 재배치나 텍스트 편집과 같은 정밀한 작업은 60% 미만의 성공률로 어려움을 겪었습니다. 이러한 발견은 AI 이미지 편집이 여전히 사용자 기대에 미치지 못하는 부분에 대한 귀중한 통찰을 제공합니다.​

전체 Pico-Banana-400K 데이터셋은 GitHub에서 비상업적 연구 목적으로 무료로 제공되며, 개발자와 연구자들이 더 유능한 이미지 편집 AI 시스템을 훈련시키는 데 사용할 수 있습니다. 연구자들에 따르면, 이 데이터셋은 "차세대 텍스트 기반 이미지 편집 모델을 훈련하고 벤치마킹하기 위한 견고한 기반"을 확립합니다.

댓글 0
전체 1,129 / 137 페이지
(퍼플렉시티가정리한기사)듀크대학교의연구원들은훈련된인간전문가와동일한정밀도로2차원재료를분석할수있는인공지능현미경시스템을개발했으며,이는자율과학연구에서중요한돌파구를의미합니다.ATOMIC(AutonomousTechnologyforOpticalMicroscopy&IntelligentCharacterization)이라고불리는이시스템은재료결함및층구조를식별하는데최대99.4%의정확도를달성했습니다.​기초모델의혁신적통합10월2일ACSNano에발표된이획기적인연구는공개적으로이용가능한AI기반모델들—특히OpenAI의ChatGPT와Meta의SegmentAnythingModel(SAM)—을자율실험실장비에성공적으로통합한최초의사례를나타냅니다.DukeUniversity전기및컴퓨터공학과의수석연구원Haozhe"Harry"Wang은이시스템이단순히지시를따르는것이아니라이해할수있는능력을갖추고있다고설명했습니다.​"ATOMIC은샘플을평가하고,스스로결정을내리며,인간전문가만큼우수한결과를생성할수있습니다"라고Wang은설명했습니다.이시스템은시판되는광학현미경을이러한AI모델들에연결하여,샘플이동,이미지초점조정,조명조절을자율적으로제어하는동시에미세한특징들을분석할수있습니다.​중요한연구병목현상해결이개발은재료과학연구의주요병목현상을해결하는데,2차원물질—원자한개또는몇개두께의결정—을특성화하는작업은전통적으로수개월또는수년간의전문교육을필요로했습니다.이러한물질들은차세대반도체,센서및양자장치에대한가능성을보여주지만,제조결함이그들의뛰어난전기적특성을손상시킬수있습니다.​연구의제1저자인박사과정학생Jingyun"Jolene"Yang은"이모델은인간이쉽게볼수없는규모에서결정립계를감지할수있었다"고언급했습니다.이시스템은과다노출,초점불량또는낮은조명을포함한최적이아닌이미징조건에서도높은정확도를유지했으며,일부경우에는인간관찰자에게보이지않는결함을식별했습니다.​광범위한과학적변혁ATOMIC시스템은AI가발견과정의모든단계에점점더참여하고있는과학연구의광범위한변화를반영합니다.KAIST,드렉셀대학교,노스웨스턴대학교팀이ACSNano에발표한최근연구는AI가이제초기발견부터최적화까지재료연구전반에걸쳐기능한다는것을보여줍니다.한편,다른최근개발사례로는LilaSciences의AI기반연구공장과같은자율실험실플랫폼의출시와완전한실험워크플로우가가능한AI시스템의도입이있습니다.​OpenAI의SamAltman이최근예측한바와같이,AI는2년내에주요과학적발견을할수있으며,이는연구에서인공지능의가속화되는역할을강조합니다.Wang의팀은AI가인간의전문성을증폭시키지만,결과를해석하고그중요성을결정하는데는연구자들이여전히필수적이라는점을강조하면서이러한광범위한추세속에그들의연구를위치시켰습니다.
341 조회
0 추천
2025.10.29 등록
(퍼플렉시티가정리한기사)중국AI스타트업MiniMax는월요일에M2언어모델을출시하여ArtificialAnalysis의IntelligenceIndex에서오픈소스모델중최고점수를달성했으며,OpenAI와Anthropic의독점시스템에대한강력한경쟁자로자리매김했습니다.​이모델은종합벤치마크에서61점을기록하여GPT-5,Grok4,ClaudeSonnet4.5에이어전세계5위를차지했습니다.MiniMaxM2는60점을기록한GoogleDeepMind의Gemini2.5Pro를앞질렀으며,이는중국오픈소스AI생태계에있어중요한성과입니다.​효율적인아키텍처가성능을강화합니다MiniMaxM2는총2,300억개의매개변수를가진Mixture-of-Experts(MoE)아키텍처를채택하지만,추론시에는100억개만활성화하여탁월한효율성을제공합니다.ArtificialAnalysis에따르면"매개변수의일부만사용함으로써모델이대규모에서효율적으로작동할수있게되었습니다".이는370억개의활성매개변수를사용하는DeepSeek의V3.2및320억개를사용하는MoonshotAI의KimiK2와같은경쟁모델들과비교해유리합니다.​이러한희소설계는FP8정밀도로단4개의NVIDIAH100GPU만으로배포를가능하게하여중견조직들도접근할수있게합니다.컴팩트한활성풋프린트에도불구하고,M2는초당약100개의토큰이라는추론속도를제공하며—이는ClaudeSonnet4.5와같은경쟁모델의약두배에해당합니다.​코딩과에이전트작업이탁월함을이끕니다MiniMaxM2는특히에이전트워크플로우와코딩애플리케이션에서뛰어난성능을보이며,이는기업들이점점더우선시하는영역입니다.이모델은전문벤치마크에서주목할만한점수를달성했습니다:실제코딩작업을위한SWE-benchVerified에서69.4점,도구사용을위한τ²-Bench에서77.2점,웹연구능력을위한BrowseComp에서44.0점을기록했습니다.​ArtificialAnalysis는"모델의강점은도구사용과지시사항따르기를포함한다"고언급하며,M2가일반화된작업보다실용적인애플리케이션에중점을둔다는점을강조했습니다.개발자들의독립적인테스트에서M2는혼합작업에서약95%의정확도를달성한반면,GPT-4o는90%,Claude3.5는88-89%를기록했습니다.​독일트리어대학교의박사과정학생이자오픈모델전문가인FlorianBrand는"그들의진전에정말감명받았다"고언급하며,MiniMax의이전M1모델대비상당한개선을강조했습니다.​MiniMax는입력토큰백만개당$0.3,출력토큰백만개당$1.2로모델을제공하여경쟁력있는성능을유지하면서도ClaudeSonnet4.5비용의단8%에해당합니다.이모델은HuggingFace와GitHub에서MIT라이선스로제공되며,API액세스는현재제한된기간동안무료로이용할수있습니다.
377 조회
0 추천
2025.10.29 등록
(퍼플렉시티가정리한기사)알바니아의획기적인인공지능장관디엘라(Diella)가국회의원들의개인비서역할을할83개의디지털자녀를"출산"할준비를하고있다고에디라마(EdiRama)총리가베를린글로벌대화컨퍼런스에서발표했다.​10월27일연설에서라마총리는83개의AI비서각각이사회당국회의원에게배정되어회의를기록하고,요약을제공하며,입법절차중응답을제안할것이라고밝혔다."우리는오늘디엘라와함께상당한위험을감수했고매우잘해냈습니다.그래서처음으로디엘라가임신했고83명의자녀를가지게되었습니다"라고라마총리는말했다.​혁명적인AI거버넌스실험알바니아어로"태양"을의미하는이름을가진디엘라는2025년9월세계최초로장관급정부직책을맡은AI시스템이되면서역사를만들었다.OpenAI모델을사용하여과협력하여개발된이디지털장관은부패를근절하기위해알바니아의공공조달시스템을감독하는임무를맡았다.​이AI보좌관네트워크는인공지능이입법기능으로확장된전례없는사례를보여준다.라마에따르면,각디지털자손은"의회회의에참여하고일어나는모든일의기록을보관하며국회의원들에게제안할것"이라고한다.그는이들의유용성을유머러스하게설명했다:"예를들어,커피를마시러갔다가일터로돌아오는것을잊어버리면,이자손이당신이의사당에없을때무슨말이오갔는지말해주고,누구에게반격해야하는지알려줄것입니다".​디지털비서에서정부장관으로장관임명이전,Diella는2025년1월e-Albania플랫폼에서가상비서로시작하여시민과기업이공식문서를취득하고정부서비스를이용할수있도록지원했습니다.이시스템은이미백만건이상의디지털문의를처리하고36,000건이상의문서를발급했습니다.​Diella는전통알바니아의상을입은여성으로나타나며,알바니아배우AnilaBisha가2025년12월까지유효한계약에따라외모와목소리를제공하고있습니다.9월첫의회연설에서AI장관은다음과같이말했습니다:"저는사람들을대체하기위해여기있는것이아니라그들을돕기위해있습니다.사실,저는시민권이없지만개인적인야망이나이해관계도없습니다".​AI장관시스템은알바니아가유럽연합가입노력을계속하고기술을통해거버넌스구조를현대화함에따라2026년말까지완전히가동될것으로예상됩니다.
353 조회
0 추천
2025.10.28 등록
(퍼플렉시티가정리한기사)존스홉킨스대학교연구진은프로그래밍학습이새로운뇌경로를생성하는것이아니라논리적추론을담당하는기존신경망을"재활용"한다는것을발견했으며,이는우리의마음이현대기술능력에어떻게적응하는지에대한새로운통찰을제공한다.​뇌의프로그래밍기반은이미존재함이번주JournalofNeuroscience에게재된이연구는프로그래밍경험이없는22명의학부생을대상으로한학기동안의Python입문과정을이수하기전과후에기능적자기공명영상(fMRI)을사용하여추적했다.​가장놀라운발견은학생들이프로그래밍을배우기전에도,나중에코드를처리할동일한신경세포그룹이학생들이프로그래밍알고리즘에대한평이한영어설명을읽을때이미활성화되어있었다는것이다.박사후연구원인제1저자Yun-FeiLiu에따르면,"우리는참가자들에게Python을배우기전에평이한영어로설명된프로그래밍알고리즘을보여주었습니다.이런식으로제시될때뇌의언어네트워크가이정보를이해하는데중요할것이라고생각할수있습니다.그러나주로활성화된뇌네트워크는논리적추론네트워크였습니다".​과정을이수한후,논리와추론을담당하는이동일한전두-두정엽뇌영역이실제Python코드의의미를표상했다.연구자들은신경세포가"for"루프와"if"조건문과같은다양한유형의프로그래밍구조를교육전후모두에서구별할수있음을발견했다.​신경재활용은가정에도전한다뇌의가소성과발달을연구하는인지신경과학자마리나베드니(MarinaBedny)책임저자는그의미를이렇게설명했다."현대사회에서우리가하는많은일들은,프로그래밍을비롯해운전,읽기,수학등,우리의뇌가애초에진화하여하도록만들어진것이아닙니다.프로그래밍수업은우리의논리적사고영역을코드를위해'재사용'합니다.우리가발견한것은,대학에들어올무렵이미프로그래밍을위한신경학적기초가뇌안에마련되어있다는것입니다".​이는'신경재활용가설'을뒷받침하는데,이는문화적기술이완전히새로운뇌네트워크를만드는것이아니라기존의뇌네트워크를재활용한다는이론입니다.연구결과에따르면,이재활용과정은단한학기수업만으로도빠르게일어납니다.​류(Liu)는이번발견이코드를배울수있는대상에대한더넓은관점을제공한다고언급했다."프로그래밍을배우는것은우리가논리적문제해결에사용하는동일한신경기계를활용하는것입니다.누구나이런능력을가지고있습니다".베드니는이어서"코딩에익숙하지않은사람들은파이썬을보고절대이해하지못할것같다고느낄수도있지만,우리연구는모두에게코딩할수있는잠재력이있음을시사합니다.어쩌면우리는태어날때부터이미그런능력을가지고있을지도모릅니다".​이번연구는퍼즐,게임,일상적인문제해결토론등의활동이학생들이논리적추론능력을강화함으로써미래의프로그래밍성공을준비하는데도움이될수있음을시사합니다.
355 조회
0 추천
2025.10.28 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입