Loading...

AI 뉴스

알리바바 Qwen image 랜더링 AI 발표

페이지 정보

작성자 JeromePark
작성일 2025.08.05 09:05
766 조회
0 추천
0 비추천

본문

알리바바가 텍스트 렌더링 및 정밀 이미지 편집에 특화된 20B MMDiT 이미지 기반 생성 모델 Qwen-Image를 발표했다. 

이 모델은 영어 등 알파벳 언어와 중국어 등 표의문자를 모두 고해상도, 높은 정확도로 이미지 내에 렌더링할 수 있는 강점을 보이며. 다중 행, 문단 레이아웃, 정교한 디테일까지 충실히 재현한다고.

또한 GenEval, DPG, OneIG-Bench 등 이미지 생성 벤치마크와 GEdit, ImgEdit, GSO 등 편집 벤치마크에서 모두 최고 성능을 기록했다. 특히 LongText-Bench, ChineseWord, TextCraft 등 텍스트 렌더링 관련 벤치마크에서 현존 최고 모델들을 크게 앞질렀다고 발표했다.

8ec6d5daac2f013186665fa5f09a3b735sm9.jpg

실제 사례로, 미야자키 애니메이션 스타일의 중국어 간판, 고전 한자 대련(對聯), 서양 언어 기반 서점 포스터, 복잡한 영어 인포그래픽 슬라이드 등 다양한 언어와 스타일의 복합 텍스트 생성에 모두 성공했다.  이미지 내에서 아주 작은 영역이나 복잡한 손글씨, 장문의 텍스트 번역/편집 등도 높은 충실도로 수행하며, 단일 언어뿐 아니라 중국어·영어 혼합 텍스트도 자유롭게 렌더링이 가능하다.

포스터, PPT, 기업용 광고 이미지 등 실무에서 활용이 가능한 수준의 자동 레이아웃, 폰트, 그래픽 효과를 적용하는 고품질 시각작업을 지원한다.

일반 생성형 모델로서의 성능도 뛰어나, 포토리얼, 인상주의, 애니메이션, 미니멀리즘 등 다양한 미술 스타일의 이미지도 유연하게 생성 가능하다고 강조한다. 이미지 편집 면에선 스타일 전환, 오브젝트 증감, 디테일 보강, 인물 자세 변경, 텍스트 편집까지 지원해 전문적인 작업을 평범한 이용자도 쉽게 수행할 수 있게 했다고 설명한다.

Qwen-Image의 궁극적인 목표는 시각 컨텐츠 제작 기술 장벽을 낮추고, 커뮤니티와의 열린 협업을 통해 지속 가능하고 혁신적인 생성형 AI 생태계 구축에 기여하는 것이라고 밝히고 있다.

다양한 이미지 사례는 링크에서 확인할 수 있다.

오픈소스여서 설치형으로도 테스트 가능.

d9d062f9f00c5563c8cfcaf2ba5d94dawjS4.png3d8c040ba4f086ff260a4fe6381323c4sqdS.pngd7fad7538d7d125377a3a97671cf7a335RMv.png
댓글 0
전체 345 / 77 페이지
30달러의 요금을 내야 이용할 수 있는 Grok AI의 컴패니언 캐릭터 기능이 하루만에 성적 대화와 폭력성 논란에 휘말리고 있다. 테크 크런치는 실제로 이 캐릭터 기능을 이용하기 위해 결제를 하고 사용한 후기를 남겼는데 여기에 섹스와 폭력을 재미삼아 이야기하는 대화가 가능하다는 것을 밝혔다. 자세한 기사 내용은 아래 테크크런치 기사에서 확인할 수 있다.
803 조회
0 추천
2025.07.16 등록
얼마전 강력한 신규업데이트로 화제를 모은 AI 그록 Grok이 AI 컴패니언을 도입한 것으로 알려졌다. 일론 머스크는 지난 14일 X 게시물을 통해, 월 30달러를 지불하는 "슈퍼 그록" 구독자를 대상으로 그록 앱에서 AI 동반자를 이용할 수 있다고 밝혔다. 머스크가 에 따르면, 사용 가능한 AI 동반자가 적어도 두 가지 종류이고. 애니는 꽉 끼는 코르셋과 스타킹을 입은 짧은 검은색 드레스를 입은 애니메이션 소녀이고, 배드 루디는 3D 여우 생물로 보인다. 일부에서는 이 컴패니언 기능이 채팅 기능으로 발전하여 정서적인 문제를 발생시킬 것인지 우려하고 있다고 테크크런치는 보도했다.
853 조회
1 추천
2025.07.15 등록
Anthropic이 Claude AI와 다양한 업무 도구를 원클릭으로 연결할 수 있는 새로운 커넥터 디렉토리를 발표했다. Notion, Canva, Stripe, Figma, Linear 등의 도구와 연결이 가능해져, Claude가 단순한 AI 어시스턴트에서 실제 업무 환경에 통합된 협업자로 진화했다. 기존에는 매번 프로젝트 세부사항을 설명해야 했지만, 이제는 "Linear의 최신 스프린트로 릴리즈 노트 작성해줘"라고 말하면 실제 티켓을 가져와서 전문적인 릴리즈 노트를 생성해준다. Claude 대화를 Notion 로드맵으로 변환하거나, Figma 파일을 프로덕션 코드로 변환하는 등 다양한 업무 자동화가 가능해졌다. 새로운 디렉토리는 claude.ai/directory에서 이용할 수 있으며, 모든 사용자가 웹과 데스크톱에서 사용 가능하다. 다만 원격 앱 커넥터는 유료 플랜 사용자만 이용할 수 있다.
780 조회
0 추천
2025.07.15 등록
퍼플렉시티가 별도의 브라우저 Comet 을 발표. 아래 링에서 다운로드 가능합니다. 데모를 보면, 구글이나 다른 검색엔진의 결과 에서 헤맬 필요가 없이 결과 내에서 요약이나 비교와 후속질문 까지 할 수 있어요. 아직은 누구나 무료로 사용할수는 없고 퍼플렉시티 Max 사용자만 가능하고 나머지는 대기 상태입니다. Pro 버전을 쓰는 사람도 안되네요.. https://comet.perplexity.ai/
814 조회
0 추천
2025.07.15 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입