Loading...

AI 뉴스

알리바바 Qwen image 랜더링 AI 발표

페이지 정보

작성자 JeromePark
작성일 2025.08.05 09:05
676 조회
0 추천
0 비추천

본문

알리바바가 텍스트 렌더링 및 정밀 이미지 편집에 특화된 20B MMDiT 이미지 기반 생성 모델 Qwen-Image를 발표했다. 

이 모델은 영어 등 알파벳 언어와 중국어 등 표의문자를 모두 고해상도, 높은 정확도로 이미지 내에 렌더링할 수 있는 강점을 보이며. 다중 행, 문단 레이아웃, 정교한 디테일까지 충실히 재현한다고.

또한 GenEval, DPG, OneIG-Bench 등 이미지 생성 벤치마크와 GEdit, ImgEdit, GSO 등 편집 벤치마크에서 모두 최고 성능을 기록했다. 특히 LongText-Bench, ChineseWord, TextCraft 등 텍스트 렌더링 관련 벤치마크에서 현존 최고 모델들을 크게 앞질렀다고 발표했다.

8ec6d5daac2f013186665fa5f09a3b735sm9.jpg

실제 사례로, 미야자키 애니메이션 스타일의 중국어 간판, 고전 한자 대련(對聯), 서양 언어 기반 서점 포스터, 복잡한 영어 인포그래픽 슬라이드 등 다양한 언어와 스타일의 복합 텍스트 생성에 모두 성공했다.  이미지 내에서 아주 작은 영역이나 복잡한 손글씨, 장문의 텍스트 번역/편집 등도 높은 충실도로 수행하며, 단일 언어뿐 아니라 중국어·영어 혼합 텍스트도 자유롭게 렌더링이 가능하다.

포스터, PPT, 기업용 광고 이미지 등 실무에서 활용이 가능한 수준의 자동 레이아웃, 폰트, 그래픽 효과를 적용하는 고품질 시각작업을 지원한다.

일반 생성형 모델로서의 성능도 뛰어나, 포토리얼, 인상주의, 애니메이션, 미니멀리즘 등 다양한 미술 스타일의 이미지도 유연하게 생성 가능하다고 강조한다. 이미지 편집 면에선 스타일 전환, 오브젝트 증감, 디테일 보강, 인물 자세 변경, 텍스트 편집까지 지원해 전문적인 작업을 평범한 이용자도 쉽게 수행할 수 있게 했다고 설명한다.

Qwen-Image의 궁극적인 목표는 시각 컨텐츠 제작 기술 장벽을 낮추고, 커뮤니티와의 열린 협업을 통해 지속 가능하고 혁신적인 생성형 AI 생태계 구축에 기여하는 것이라고 밝히고 있다.

다양한 이미지 사례는 링크에서 확인할 수 있다.

오픈소스여서 설치형으로도 테스트 가능.

d9d062f9f00c5563c8cfcaf2ba5d94dawjS4.png3d8c040ba4f086ff260a4fe6381323c4sqdS.pngd7fad7538d7d125377a3a97671cf7a335RMv.png
댓글 0
전체 325 / 62 페이지
애플이 새로운 시리(Siri) 업그레이드를 준비하고 있으며, 이는 서드파티 앱(Uber, YouTube, Facebook, WhatsApp 등)과 자체 앱(메일, 메시지 등)에서 깊이 있는 통합과 제어가 가능할 것으로 알려졌다..사용자는 음성만으로 사진 검색 및 편집, 인스타그램 댓글 작성, 쇼핑 앱 탐색 및 장바구니 추가 등 앱 내 세부 기능을 조작할 수 있게 된다. 이번 개선의 핵심은 'App Intents' 시스템과 애플의 생성형 AI 'Apple Intelligence'에 있다사실 새로운 시리의 출시는 여러 차례 연기되어 왓다. . 잦은 지연의 원인은 구형 시리 시스템과 신형 LLM(대규모 언어 모델) 아키텍처가 결합된 하이브리드 구조의 버그, 약 1/3 확률의 실패율 등 기술적 문제가 컸던 것으로 알려졌다.
692 조회
1 추천
2025.08.11 등록
GPT-5 가 나왔어요.영상으로 모든 걸 보여줍니다.자막이 있으니 편하게 보세요.
606 조회
1 추천
2025.08.08 등록
AI 전문가 Daniel Lozovsky의 분석에 따르면, 2025년 7월 27일부터 8월 1일까지의 단 5일간이 AI 역사상 가장 극적인 변화를 가져온 기간이었습니다. 빌 게이츠조차 이 급격한 변화의 속도에 놀랐다고 할 정도였습니다.이 기간 동안 구글은 Gemini 2.5 Deep Think라는 월 250달러짜리 프리미엄 AI 모델을 출시했는데, 너무 강력해서 하루에 단 5회만 사용할 수 있도록 제한했습니다. 이 AI는 화학, 생물학, 방사능, 핵 관련 위험한 정보까지 생성할 수 있어서 구글이 안전상의 이유로 직접 사용을 제한한 것입니다.반면 중국의 Zhipu AI는 GLM 4.5라는 모델을 완전 무료로 공개했는데, 이 AI는 정말 놀라운 성능을 보여줬습니다. "새는 진짜가 아니다"라는 음모론에 대한 프레젠테이션을 완벽하게 만들어내거나, 뱀파이어 서바이버라는 게임을 자바스크립트로 완전히 구현해내는 등 유료 모델 못지않은 능력을 발휘했습니다.창작 도구 분야에서도 혁신이 쏟아졌습니다. Runway의 ALF라는 도구는 음성 명령만으로 비디오를 편집할 수 있게 해주고, 구글의 Veo는 이미지에 직접 텍스트를 써넣으면 그대로 비디오를 생성해주는 마법 같은 기능을 선보였습니다. Ideogram의 새로운 기능은 단 한 장의 사진만 있으면 어떤 이미지에든 얼굴을 바꿔넣을 수 있게 해줍니다.경제적으로도 엄청난 변화가 있었습니다. 빅테크 기업들이 올해만 AI에 1,550억 달러를 투자했고, 메타는 AI 투자 발표 후 주식이 11%나 급등했습니다.
689 조회
0 추천
2025.08.08 등록
중국의 한 공장에서 테스트 중이던 휴머노이드 로봇이 갑작스럽게 오작동을 일으켜 작업자들을 위협하는 상황이 발생했습니다. 영상에는 로봇이 크레인에 매달린 채 팔다리를 격렬하게 흔들다가 갑자기 앞으로 돌진해 바닥을 기어가는 충격적인 모습이 담겨있습니다. 이를 지켜본 두 명의 작업자들이 당황하며 뒤로 물러서는 장면도 함께 촬영되어 더욱 화제가 되었습니다.이 사건은 AI 로봇의 안전성에 대한 새로운 우려를 불러일으켰으며, 많은 사람들이 "AI 반란이 시작된 건 아닌가?"라는 걱정스러운 반응을 보였습니다. SF 영화에서나 볼 법한 기괴하고 무서운 광경이 실제 공장에서 벌어진 것입니다.
692 조회
0 추천
2025.08.08 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입