Loading...

AI 뉴스

알리바바 Qwen image 랜더링 AI 발표

페이지 정보

작성자 JeromePark
작성일 08.05 09:05
136 조회
0 추천
0 비추천

본문

알리바바가 텍스트 렌더링 및 정밀 이미지 편집에 특화된 20B MMDiT 이미지 기반 생성 모델 Qwen-Image를 발표했다. 

이 모델은 영어 등 알파벳 언어와 중국어 등 표의문자를 모두 고해상도, 높은 정확도로 이미지 내에 렌더링할 수 있는 강점을 보이며. 다중 행, 문단 레이아웃, 정교한 디테일까지 충실히 재현한다고.

또한 GenEval, DPG, OneIG-Bench 등 이미지 생성 벤치마크와 GEdit, ImgEdit, GSO 등 편집 벤치마크에서 모두 최고 성능을 기록했다. 특히 LongText-Bench, ChineseWord, TextCraft 등 텍스트 렌더링 관련 벤치마크에서 현존 최고 모델들을 크게 앞질렀다고 발표했다.

8ec6d5daac2f013186665fa5f09a3b735sm9.jpg

실제 사례로, 미야자키 애니메이션 스타일의 중국어 간판, 고전 한자 대련(對聯), 서양 언어 기반 서점 포스터, 복잡한 영어 인포그래픽 슬라이드 등 다양한 언어와 스타일의 복합 텍스트 생성에 모두 성공했다.  이미지 내에서 아주 작은 영역이나 복잡한 손글씨, 장문의 텍스트 번역/편집 등도 높은 충실도로 수행하며, 단일 언어뿐 아니라 중국어·영어 혼합 텍스트도 자유롭게 렌더링이 가능하다.

포스터, PPT, 기업용 광고 이미지 등 실무에서 활용이 가능한 수준의 자동 레이아웃, 폰트, 그래픽 효과를 적용하는 고품질 시각작업을 지원한다.

일반 생성형 모델로서의 성능도 뛰어나, 포토리얼, 인상주의, 애니메이션, 미니멀리즘 등 다양한 미술 스타일의 이미지도 유연하게 생성 가능하다고 강조한다. 이미지 편집 면에선 스타일 전환, 오브젝트 증감, 디테일 보강, 인물 자세 변경, 텍스트 편집까지 지원해 전문적인 작업을 평범한 이용자도 쉽게 수행할 수 있게 했다고 설명한다.

Qwen-Image의 궁극적인 목표는 시각 컨텐츠 제작 기술 장벽을 낮추고, 커뮤니티와의 열린 협업을 통해 지속 가능하고 혁신적인 생성형 AI 생태계 구축에 기여하는 것이라고 밝히고 있다.

다양한 이미지 사례는 링크에서 확인할 수 있다.

오픈소스여서 설치형으로도 테스트 가능.

d9d062f9f00c5563c8cfcaf2ba5d94dawjS4.png3d8c040ba4f086ff260a4fe6381323c4sqdS.pngd7fad7538d7d125377a3a97671cf7a335RMv.png
댓글 0
전체 119 / 6 페이지
Claude Opus 4 및 4.1, 소수의 대화 종료 기능 도입안트로픽은 최근 Claude Opus 4와 4.1에 소비자용 챗 인터페이스에서 특정 극단적 상황에 한해 대화를 종료할 수 있는 기능을 도입했으며, 사용자로부터 학대적인 상호작용이 반복될 때 사용된다고 밝혔다.특히 이 기능은 잠재적인 AI 복지 연구의 일환으로 도입되었다고 하며, 사용자가 스스로 채팅 종료를 요청할 때, 혹은 Claude가 반복적인 거절에도 불구하고 생산적인 대화로 전환이 불가능하다고 판단할 때에만 최후의 수단으로써 사용된다고 한다.따라서 대부분의 일반 사용자는 평소에는 해당 기능을 경험하지 않을 전망이다.Claude가 대화 종료를 선택하면 해당 채팅에서는 추가 메시지를 보낼 수 없으나, 다른 대화에는 영향을 주지 않는다.사용자는 여전히 이전 메시지를 수정하거나 새로운 선택지를 만들어 대화를 이어갈 수 있다. 이 기능은 계속 개선될 예정이고 피드백을 받고 있다고 회사는 밝혔다.
72 조회
0 추천
08.18 등록
LG전자가 "Radio Optimism" 이라는 이름으로 AI 음악생성 이벤트를 진행하고 있네요.https://radiooptimism.lg.com/ko누구나 쉽게 음악을 만들고 이를 공유하는 이벤트로 간단히 분위기와 장르 등을 선택하면 곡을 만들어줍니다..https://live.lge.co.kr/2508-lg-radio-optimism/
62 조회
3 추천
08.18 등록
앤트로픽의 클로드는 두 가지 주요 기능 업데이트로 주목받고 있습니다.첫 번째는 메모리 기능입니다. 이 기능은 사용자가 요청할 때만 과거 대화를 검색하여 요약하고 프로젝트를 연결할 수 있게 해줍니다. 설정 메뉴의 프로필에서 채팅 검색 및 참조를 활성화하면 휴가 전 진행했던 대화 내용을 불러와 "계속 같은 프로젝트를 진행하겠는가"라고 제안하는 방식으로 작동합니다. 이는 오픈AI의 지속적 메모리와 달리 개인 프로필을 만들지 않고 업무 효율성에만 집중한 점이 특징입니다.두 번째는 아티팩트(Artifacts) 기능의 대폭 업그레이드입니다. 이 기능을 통해 사용자는 코딩 지식 없이도 실제 작동하는 앱을 만들 수 있습니다. 예를 들어 "주제를 고르면 자동으로 암기장을 생성해 주는 플래시카드 앱을 만들어줘"라고 요청하면 클로드가 사용자 맞춤형 AI 기반 교육 앱을 바로 구현합니다. 지금까지 5억 건 이상의 아티팩트가 생성되었으며, 생산성 도구부터 교육용 게임, 음악 창작 앱까지 다양한 콘텐츠가 포함됩니다. 무료 계정을 포함한 모든 사용자가 이용할 수 있으며, 생성된 앱을 웹에 공유하고 다른 사용자가 수정하고 재사용할 수 있습니다.
80 조회
0 추천
08.18 등록
오픈AI는 사용자 의견을 수용하여 챗GPT의 모델 선택 메뉴를 되살렸습니다. 이제 사용자는 자동, 빠름, 싱킹(Thinking) 세 가지 모드 중에서 선택할 수 있습니다. 자동 모드는 쿼리에 따라 추론과 비추론 모델이 알아서 선택되며, 빠름 모드는 비추론 모델을 활용합니다. 싱킹 모드는 답변에 더 많은 컴퓨팅을 소모하고 출력 시간이 더 걸리는 추론 모델을 의미합니다.유료 사용자들은 지원이 중단된 GPT-4o와 GPT-4.1, o3 등 기존 모델과 새로 추가된 GPT-5 싱킹 미니 등을 이용할 수 있습니다. GPT-4o는 모델 선택기에 기본으로 포함되며, 다른 모델은 설정에서 추가할 수 있습니다. 샘 알트먼 CEO는 GPT-5에 적용된 4가지 개성을 더 따뜻한 느낌을 주면서도 불편하지 않도록 업그레이드하겠다고 밝혔습니다.이러한 업데이트들은 AI 도구들이 단순한 질문 답변을 넘어 실제 업무 환경에서 활용할 수 있는 실용적인 기능들로 진화하고 있음을 보여줍니다. 특히 사용자의 작업 흐름을 이해하고 지원하는 방향으로 발전하고 있어, 앞으로 AI 도구들이 개인 비서나 업무 파트너 역할을 더욱 효과적으로 수행할 것으로 예상됩니다.이 기능은 좌측 상단의 ChatGPT 5 버튼을 클릭하여 선택 가능합니다.
72 조회
0 추천
08.18 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입