Loading...

AI 뉴스

알리바바 Qwen image 랜더링 AI 발표

페이지 정보

작성자 JeromePark
작성일 2025.08.05 09:05
2,245 조회
0 추천
0 비추천

본문

알리바바가 텍스트 렌더링 및 정밀 이미지 편집에 특화된 20B MMDiT 이미지 기반 생성 모델 Qwen-Image를 발표했다. 

이 모델은 영어 등 알파벳 언어와 중국어 등 표의문자를 모두 고해상도, 높은 정확도로 이미지 내에 렌더링할 수 있는 강점을 보이며. 다중 행, 문단 레이아웃, 정교한 디테일까지 충실히 재현한다고.

또한 GenEval, DPG, OneIG-Bench 등 이미지 생성 벤치마크와 GEdit, ImgEdit, GSO 등 편집 벤치마크에서 모두 최고 성능을 기록했다. 특히 LongText-Bench, ChineseWord, TextCraft 등 텍스트 렌더링 관련 벤치마크에서 현존 최고 모델들을 크게 앞질렀다고 발표했다.

8ec6d5daac2f013186665fa5f09a3b735sm9.jpg

실제 사례로, 미야자키 애니메이션 스타일의 중국어 간판, 고전 한자 대련(對聯), 서양 언어 기반 서점 포스터, 복잡한 영어 인포그래픽 슬라이드 등 다양한 언어와 스타일의 복합 텍스트 생성에 모두 성공했다.  이미지 내에서 아주 작은 영역이나 복잡한 손글씨, 장문의 텍스트 번역/편집 등도 높은 충실도로 수행하며, 단일 언어뿐 아니라 중국어·영어 혼합 텍스트도 자유롭게 렌더링이 가능하다.

포스터, PPT, 기업용 광고 이미지 등 실무에서 활용이 가능한 수준의 자동 레이아웃, 폰트, 그래픽 효과를 적용하는 고품질 시각작업을 지원한다.

일반 생성형 모델로서의 성능도 뛰어나, 포토리얼, 인상주의, 애니메이션, 미니멀리즘 등 다양한 미술 스타일의 이미지도 유연하게 생성 가능하다고 강조한다. 이미지 편집 면에선 스타일 전환, 오브젝트 증감, 디테일 보강, 인물 자세 변경, 텍스트 편집까지 지원해 전문적인 작업을 평범한 이용자도 쉽게 수행할 수 있게 했다고 설명한다.

Qwen-Image의 궁극적인 목표는 시각 컨텐츠 제작 기술 장벽을 낮추고, 커뮤니티와의 열린 협업을 통해 지속 가능하고 혁신적인 생성형 AI 생태계 구축에 기여하는 것이라고 밝히고 있다.

다양한 이미지 사례는 링크에서 확인할 수 있다.

오픈소스여서 설치형으로도 테스트 가능.

d9d062f9f00c5563c8cfcaf2ba5d94dawjS4.png3d8c040ba4f086ff260a4fe6381323c4sqdS.pngd7fad7538d7d125377a3a97671cf7a335RMv.png
댓글 0
전체 1,262 / 315 페이지
미국 연방법원에서 판사가 메타에게 유리한 판결이 나왔따.미국시각 6월 25일 샌프란시스코 연방법원 판사 Vince Chhabria는 작가 13명이 메타를 상대로 제기한 저작권 침해 소송에서작가들의 소송을 기각하며 요약 판결을 내렸다.이번 판결은메타가 저작권이 있는 서적을 사용하여 AI 모델을 훈련시킨 이 사건은 저작권법의 "공정 사용" 원칙에 해당하므로 합법적이라고 밝혔다.또한 판사는 메타의 이번 사용이 단순히 저작권이 있는 책을 단순히 복제한 것이 아니라 혁신적으로 바꾼 것이라고 말했다.하지만 판사는 이번 판결이 모든 AI 학습이 합법이라고 말하는 것은 아니다라며, 원고들이 잘못된 주장을 했고 원고의 주장을 입증하기 위한 증거가 부족했다는 취즈로 설명했다.Judge Chhabria made clear that this decision does not mean that all AI model training on copyrighted works is legal, but rather that the plaintiffs in this case “made the wrong arguments” and failed to develop sufficient evidence in support of the right ones.
2173 조회
0 추천
2025.06.26 등록
애플이 자사 하드웨어 설계 방식에 AI를 본격 도입한다고 밝혔습니다.Apple의 하드웨어 수석 부사장 Johnny Srouji는 “AI가 세계 최고 수준의 칩 설계 방식을 완전히 혁신할 것”이라고 공식 언급했습니다.???? 핵심 요약- Apple은 M 시리즈 칩 설계에 AI 기술을 접목하는 중- 기존 수작업 기반 설계 과정에서 AI를 통한 자동화·최적화로 전환- "효율성은 물론 품질까지 개선 가능"하다고 주장- 이미 Apple 내부 여러 팀에서 AI가 설계 단계에 실전 투입되고 있음
2204 조회
0 추천
2025.06.26 등록
구글은 제미나이를 터미널에서 로컬로 실행되도록 설계된 에이전트 기반 AI 도구인 Gemini CLI를 출시한다고 발표했다. 이 새로운 도구는 구글의 Gemini AI 모델을 로컬 코드베이스에 연결하며, 개발자가 Gemini CLI에 코드의 복잡한 부분을 설명하거나, 새로운 기능을 작성하거나, 코드를 디버깅하거나, 명령을 실행하는 등 자연어 요청을 할 수 있도록 지원한다. 구글 계정으로 로그인하면 자동으로 '제미나이 코드 어시스트' 라이선스를 받아 이를 이용할 수 있다 제미나이 CLI 깃허브 사이트를 통해 공개 https://github.com/google-gemini/gemini-cli Gemini CLI는 Google의 AI 코딩 어시스턴트인 Gemini Code Assist 와 통합하며, 무료, Standard, Enterprise Code Assist 플랜을 사용하는 모든 개발자가 VS Code와 Gemini CLI에서 모두 신속하고 AI를 우선으로 하는 코딩을 사용할 수 있게 되었다고 구글 블로그를 통해 밝혔다.
2266 조회
0 추천
2025.06.26 등록
국정기획위원회는 디지털 교육 혁신을 위해 초등학교부터 고등학교까지의 정규 교육과정에 AI 교과목을 신설하는 방안을 본격 검토 중입니다. 기존에는 ‘정보’ 과목 안에 AI 기초 개념이나 간단한 체험활동 정도가 포함되어 있었으나, 향후에는 이를 독립 교과목으로 분리해 더 체계적인 교육을 제공하겠다는 취지입니다. 이 교과목은 단순 기술 이해를 넘어서 컴퓨팅 사고력, 데이터 활용 능력, AI 윤리 및 안전성 이해 등도 포함될 예정입니다. 교육계는 이에 대해 "시대 흐름에 맞는 긍정적 시도"라는 환영과"교사 연수, 교과서, 평가체계가 전무하다"는 우려를 동시에 나타내고 있습니다.
2187 조회
0 추천
2025.06.25 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입