Loading...

AI 뉴스

알리바바 Qwen image 랜더링 AI 발표

페이지 정보

작성자 JeromePark
작성일 08.05 09:05
73 조회
0 추천
0 비추천

본문

알리바바가 텍스트 렌더링 및 정밀 이미지 편집에 특화된 20B MMDiT 이미지 기반 생성 모델 Qwen-Image를 발표했다. 

이 모델은 영어 등 알파벳 언어와 중국어 등 표의문자를 모두 고해상도, 높은 정확도로 이미지 내에 렌더링할 수 있는 강점을 보이며. 다중 행, 문단 레이아웃, 정교한 디테일까지 충실히 재현한다고.

또한 GenEval, DPG, OneIG-Bench 등 이미지 생성 벤치마크와 GEdit, ImgEdit, GSO 등 편집 벤치마크에서 모두 최고 성능을 기록했다. 특히 LongText-Bench, ChineseWord, TextCraft 등 텍스트 렌더링 관련 벤치마크에서 현존 최고 모델들을 크게 앞질렀다고 발표했다.

8ec6d5daac2f013186665fa5f09a3b735sm9.jpg

실제 사례로, 미야자키 애니메이션 스타일의 중국어 간판, 고전 한자 대련(對聯), 서양 언어 기반 서점 포스터, 복잡한 영어 인포그래픽 슬라이드 등 다양한 언어와 스타일의 복합 텍스트 생성에 모두 성공했다.  이미지 내에서 아주 작은 영역이나 복잡한 손글씨, 장문의 텍스트 번역/편집 등도 높은 충실도로 수행하며, 단일 언어뿐 아니라 중국어·영어 혼합 텍스트도 자유롭게 렌더링이 가능하다.

포스터, PPT, 기업용 광고 이미지 등 실무에서 활용이 가능한 수준의 자동 레이아웃, 폰트, 그래픽 효과를 적용하는 고품질 시각작업을 지원한다.

일반 생성형 모델로서의 성능도 뛰어나, 포토리얼, 인상주의, 애니메이션, 미니멀리즘 등 다양한 미술 스타일의 이미지도 유연하게 생성 가능하다고 강조한다. 이미지 편집 면에선 스타일 전환, 오브젝트 증감, 디테일 보강, 인물 자세 변경, 텍스트 편집까지 지원해 전문적인 작업을 평범한 이용자도 쉽게 수행할 수 있게 했다고 설명한다.

Qwen-Image의 궁극적인 목표는 시각 컨텐츠 제작 기술 장벽을 낮추고, 커뮤니티와의 열린 협업을 통해 지속 가능하고 혁신적인 생성형 AI 생태계 구축에 기여하는 것이라고 밝히고 있다.

다양한 이미지 사례는 링크에서 확인할 수 있다.

오픈소스여서 설치형으로도 테스트 가능.

d9d062f9f00c5563c8cfcaf2ba5d94dawjS4.png3d8c040ba4f086ff260a4fe6381323c4sqdS.pngd7fad7538d7d125377a3a97671cf7a335RMv.png
댓글 0
전체 105 / 5 페이지
결론부터 보면 LG것과 SKT 것이 비슷한 성능이고 KT가 애매하게 3위..참고로 LG는 LG uplus는 아니고 LG AI 연구소의 것으로 비교한 것입니다
40 조회
1 추천
08.16 등록
이 영상은 Google Genie 3. 의 월드모델에 대한 영상이긴 한데중간에 실제로 영상 편집 현장에서 왜 AI를 안쓰고 있는가, 쓰지 않는 이유는 무엇일까어떤 부분에서 AI를 사용하고 있는가 현직 헐리웃 편집자가 설명하는 부분이 있어서소개합니다.결론부터 말하자면 시안을 만드는 단계에서는 사용을 하는데 실제 작업에는 사람이 작업하는 쪽으 선택하고 있다네요.. 이유는 이 영상을 보시길.
37 조회
1 추천
08.16 등록
AI 영상 편집이 어느 정도까지 되는지 소개하는 유튜브 입니다.
39 조회
0 추천
08.16 등록
Genspark에서 세계 최초의 Apple Watch용 AI 회의 노트 도구인 'Genspark AI Meeting Notes'를 출시했습니다. 이 도구는 iOS 및 Android 앱에서도 사용할 수 있으며, Super Agent와의 긴밀한 통합을 통해 Apple Watch에서 더블 탭 한 번 또는 휴대폰에서 한 번의 클릭만으로 모든 회의를 포괄적이고 전문적인 회의록으로 변환할 수 있습니다.이 도구의 가장 뛰어난 점은 즉시 우수한 회의록을 생성할 수 있다는 것입니다. Apple Watch에서는 더블 탭으로 녹음을 시작하면 백그라운드에서 자동으로 지속됩니다. Google이나 Outlook 캘린더와 통합하여 회의를 탭하면 바로 녹음이 시작되며, Genspark Super Agent와 원활하게 작동하여 향상된 처리 능력을 제공합니다. 고급 AI가 대화를 분석하고 핵심 정보를 추출하여 몇 분 내에 모든 참가자에게 전문적인 노트를 전달합니다.Genspark AI Meeting Notes는 '바이브 워킹(vibe working)'의 미래를 대표합니다. 이는 AI가 일상적인 업무를 처리하여 인간이 창의적 사고, 전략적 협업, 의미 있는 연결에 집중할 수 있게 하는 작업 방식입니다. AI가 문서화의 마찰을 제거함으로써 사람들이 회의에 완전히 집중하고 함께 획기적인 솔루션을 만들 수 있도록 도와줍니다.전체 프로세스는 자동으로 완료되며, 사용자는 완전하고 전문적인 수준의 회의 문서화를 받을 수 있습니다. 이 혁신적인 도구를 통해 회의 생산성의 혁명을 경험하고 회의 관리의 새로운 가능성을 발견할 수 있습니다.
58 조회
0 추천
08.13 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입