Loading...

AI 뉴스

알리바바 Qwen image 랜더링 AI 발표

페이지 정보

작성자 JeromePark
작성일 2025.08.05 09:05
2,137 조회
0 추천
0 비추천

본문

알리바바가 텍스트 렌더링 및 정밀 이미지 편집에 특화된 20B MMDiT 이미지 기반 생성 모델 Qwen-Image를 발표했다. 

이 모델은 영어 등 알파벳 언어와 중국어 등 표의문자를 모두 고해상도, 높은 정확도로 이미지 내에 렌더링할 수 있는 강점을 보이며. 다중 행, 문단 레이아웃, 정교한 디테일까지 충실히 재현한다고.

또한 GenEval, DPG, OneIG-Bench 등 이미지 생성 벤치마크와 GEdit, ImgEdit, GSO 등 편집 벤치마크에서 모두 최고 성능을 기록했다. 특히 LongText-Bench, ChineseWord, TextCraft 등 텍스트 렌더링 관련 벤치마크에서 현존 최고 모델들을 크게 앞질렀다고 발표했다.

8ec6d5daac2f013186665fa5f09a3b735sm9.jpg

실제 사례로, 미야자키 애니메이션 스타일의 중국어 간판, 고전 한자 대련(對聯), 서양 언어 기반 서점 포스터, 복잡한 영어 인포그래픽 슬라이드 등 다양한 언어와 스타일의 복합 텍스트 생성에 모두 성공했다.  이미지 내에서 아주 작은 영역이나 복잡한 손글씨, 장문의 텍스트 번역/편집 등도 높은 충실도로 수행하며, 단일 언어뿐 아니라 중국어·영어 혼합 텍스트도 자유롭게 렌더링이 가능하다.

포스터, PPT, 기업용 광고 이미지 등 실무에서 활용이 가능한 수준의 자동 레이아웃, 폰트, 그래픽 효과를 적용하는 고품질 시각작업을 지원한다.

일반 생성형 모델로서의 성능도 뛰어나, 포토리얼, 인상주의, 애니메이션, 미니멀리즘 등 다양한 미술 스타일의 이미지도 유연하게 생성 가능하다고 강조한다. 이미지 편집 면에선 스타일 전환, 오브젝트 증감, 디테일 보강, 인물 자세 변경, 텍스트 편집까지 지원해 전문적인 작업을 평범한 이용자도 쉽게 수행할 수 있게 했다고 설명한다.

Qwen-Image의 궁극적인 목표는 시각 컨텐츠 제작 기술 장벽을 낮추고, 커뮤니티와의 열린 협업을 통해 지속 가능하고 혁신적인 생성형 AI 생태계 구축에 기여하는 것이라고 밝히고 있다.

다양한 이미지 사례는 링크에서 확인할 수 있다.

오픈소스여서 설치형으로도 테스트 가능.

d9d062f9f00c5563c8cfcaf2ba5d94dawjS4.png3d8c040ba4f086ff260a4fe6381323c4sqdS.pngd7fad7538d7d125377a3a97671cf7a335RMv.png
댓글 0
전체 1,244 / 306 페이지
OpenAI Experiments with Study Feature and New ChatGPT Integrations OpenAI는 교육 및 직장 연구 분야에서 ChatGPT 의 사용 사례를 확장하는 새로운 기능을 개발하는 것으로 알려졌다 최근 테스트 중인 두 가지 업데이트에는 잠재적인 학습 모드와 연구 보조 도구에 대한 추가 통합이 포함된다. 아직 출시되지 않은 기능 중 하나인 '함께 공부하기(Study Together)'는 5월에 처음 발견 되었으며 최근 빌드 에서 확인된다. 현재 작동하지는 않지만, 참고 자료에 따르면 학생들이 친구와 함께 또는 ChatGPT를 학습 도구로 사용하여 시험을 준비할 수 있도록 지원할 수 있을 것으로 보인다. 이 모드는 플랫폼 내에서 더욱 협력적이고 교육적인 활용 사례로의 전환을 시사한다. 출시될 경우, 학생들이 ChatGPT 내에서 직접 학술 자료에 참여할 수 있는 옵션을 제공하게 된다 이와 함께 OpenAI는 사용자 입력을 기반으로 정보를 수집하고 정리하는 과정을 자동화하는 AI 기능인 Deep Research의 업데이트를 테스트하는 것으로 알려졌다.
2135 조회
0 추천
2025.07.08 등록
Cursor의 CEO 마이클 트루엘(Michael Truell)은 회사의 월 20달러 Pro 요금제에 대한 가격 변경 사항이 제대로 전달되지 않은 점에 대해 사과했습니다. 이 요금제는 요청 기반 제한에서 컴퓨트 기반 모델로 전환되었으며, 많은 사용자들이 월 할당량을 빠르게 소진하면서 예상치 못한 추가 비용에 직면하게 되었습니다. 사용자들의 분노를 촉발한 핵심 문제는 특히 고급 AI 모델을 사용할 때 새로운 월 $20 할당량이 너무 빨리 소진된다는 점이었습니다. 많은 사용자들이 Anthropic의 Claude 모델을 사용할 때 몇 번의 프롬프트만으로 요청 한도가 소진된다고 보고했으며, 이 모델은 특히 코딩 작업에 인기가 많습니다12. 상황은 Cursor의 "자동 모드"(용량에 따라 AI 모델을 자동으로 선택하는 기능)만이 Pro 구독자에게 무제한 사용을 계속 제공한다는 사실로 인해 더욱 악화되었습니다 이에 대한 반발로 Cursor는 2025년 6월 16일부터 7월 4일 사이에 예기치 않게 요금이 청구된 모든 사용자에게 전액 환불을 제공하고 있습니다. 해당 사용자는 propricing@cursor.com으로 이메일을 보내 환불을 신청할 수 있습니다34. 회사는 또한 Pro 요금제에 이제 Tab 및 자동 모드의 모델 무제한 사용, 매월 API 가격 기준 $20 상당의 "프론티어 모델" 사용, 그리고 추가 프론티어 모델 사용을 원가로 구매할 수 있는 옵션이 포함된다고 명확히 밝혔습니다4
2302 조회
1 추천
2025.07.08 등록
메타, 애플의 '파운데이션 모델' 팀 엔지니어 영입 기사 요약 - 퍼플렉시티 애플의 인공지능(AI) 파운데이션 모델 팀을 이끌던 루오밍 팡(Ruoming Pang) 엔지니어가 메타로 이직했습니다. 팡은 2021년 구글에서 애플로 합류해 약 100명 규모의 팀을 이끌며, 애플 인텔리전스(Apple Intelligence) 기능에 활용되는 대형 언어 모델(LLM) 개발을 주도했습니다1234. 메타는 팡을 영입하기 위해 연 수십억 원(수백만 달러) 이상의 파격적인 연봉 패키지를 제시한 것으로 알려졌습니다. 이는 마크 저커버그 CEO가 주도하는 AI 슈퍼인텔리전스 랩(Superintelligence Labs) 인재 영입 전략의 일환입니다. 메타는 최근 오픈AI, 앤트로픽 등 경쟁사 인재들도 대거 영입하고 있습니다2345. **팡의 이탈은 애플의 자체 AI 모델 개발에 큰 타격**으로 평가됩니다. 애플은 최근 내부적으로 오픈AI, 앤트로픽 등 외부 모델 도입을 검토하는 등, 자체 모델 개발과 외부 협력 사이에서 방향성을 고민하고 있었습니다. 팡이 이끌던 팀은 앞으로 천즈펑(Chen Zhifeng) 등 새로운 리더십 아래 재편될 예정입니다367. 메타는 AI 경쟁력 강화를 위해 대규모 투자와 인재 영입을 이어가고 있으며, 팡은 메타의 차세대 AI 모델 개발에 핵심 역할을 맡을 전망입니다. 이번 인재 영입은 빅테크 기업 간 AI 인재 쟁탈전이 한층 치열해지고 있음을 보여줍니다45. 핵심 요약 애플 AI 핵심 인재 루오밍 팡, 메타로 이직 메타, 연 수십억 원 규모 파격 연봉 제시 애플 AI 전략 및 조직에 큰 변화 예상 메타, 슈퍼인텔리전스 랩 중심으로 AI 인재 대거 영입 중 https://www.bloomberg.com/news/articles/2025-07-07/apple-loses-its-top-ai-models-executive-to-meta-s-hiring-spreehttps://9to5mac.com/2025/07/07/meta-just-hired-apples-head-of-foundation-models/https://www.capitalbrief.com/briefing/meta-hires-apples-top-executive-in-charge-of-ai-models-bloomberg-0bbf9162-4757-4282-bfe7-edc8cf08c557/https://fortune.com/2025/07/07/apple-top-ai-executive-meta-hiring-spree-superintelligence-team-pay-package/https://www.investing.com/news/stock-market-news/meta-lures-apples-top-ai-executive-in-latest-talent-coup-bloomberg-reports-4125542https://www.macrumors.com/2025/07/07/apple-ai-executive-leaves-for-meta/https://appleinsider.com/articles/25/07/07/meta-poaches-apple-intelligence-executive-amid-larger-leadership-restructurehttps://x.com/9to5mac/status/1942347765633163658https://www.imd.org/entity-profile/meta-platforms-ai-maturity/https://finance.yahoo.com/news/apples-top-ai-executive-ruoming-224044121.htmlhttps://ai.meta.com/blog/building-with-ai-across-all-of-meta/?bxid=5be9d5af2ddf9c72dc1f8e2b&cndid=32424085&esrc=WIRED_CRMSeries&mbid=CRMWIR092120https://news.bloomberglaw.com/daily-labor-report/apple-loses-top-ai-models-executive-to-metas-hiring-spree-1https://www.mk.co.kr/en/it/11362111https://www.cnbc.com/2025/06/30/mark-zuckerberg-creating-meta-superintelligence-labs-read-the-memo.htmlhttps://news.bloomberglaw.com/ip-law/apple-loses-top-ai-models-executive-to-metas-hiring-spree-1https://www.axios.com/2025/05/27/meta-ai-restructure-2025-agi-llamahttps://machash.com/9to5mac/392426/meta-hired-apples-head-foundation-models/https://machinelearning.apple.com/research/apple-foundation-models-2025-updateshttps://www.youtube.com/watch?v=XOIuFIl2-Aohttps://www.theinformation.com/briefings/meta-hires-researcher-apple
2260 조회
0 추천
2025.07.08 등록
D ynamics Lab은 자연어, 키보드, 또는 컨트롤러 입력을 통해 실시간으로 포토리얼리즘의 오픈월드 경험을 생성하는 세계 최초의 실시간 생성형 UGC(사용자 생성 콘텐츠) 게임 엔진인 Mirage를 선보였다.. Mirage는 16FPS로 구동되며, 사전 제작된 에셋 없이도 다양한 장르에서 장시간 플레이가 가능하다. 이는 Urban Chaos와 Coastal Drift 데모를 통해 확인할 수 있으며, 플레이 가능한 데모는 Dynamics Lab 블로그에서 제공 중이다. 아래 주소에서 실제 데모 테스트가 가능하다. https://blog.dynamicslab.ai/ 주요 특징 실시간 생성 및 수정: 플레이 중에 자연어 명령이나 키 입력만으로 환경, 날씨, 오브젝트, 미션 등 게임 세계가 즉시 바뀝니다. 예를 들어 “비가 오게 해줘”라고 입력하면 즉시 게임 내에서 비가 내리기 시작합니다134. 장르 다양성: GTA 스타일의 도시 오픈월드, Forza Horizon 스타일의 레이싱, RPG, 플랫포머 등 다양한 장르를 지원하며, 모두 실시간으로 생성됩니다34. 포토리얼리즘: 기존 AI 생성 게임(예: AI Doom, Genie, AI Minecraft)보다 훨씬 더 사실적이고 고화질의 그래픽을 구현합니다34. 지속적 상호작용: 한 번의 플레이가 10분 이상 이어질 만큼 긴, 일관성 있는 시뮬레이션이 가능합니다34. 멀티모달 입력: 텍스트, 키보드, 컨트롤러 등 다양한 방식으로 명령을 내릴 수 있습니다24. 클라우드 스트리밍: 별도 설치 없이 웹브라우저에서 바로 플레이 가능하며, 16FPS의 실시간 반응 속도를 제공합니다4. 프롬프트 기반 프레임 레벨 제어: 플레이 중 언제든 명령을 입력하면 곧바로 게임 세계가 업데이트됩니다. 매 플레이마다 완전히 새로운 경험이 가능합니다34. 차별점 및 전망 전통적 게임 엔진(유니티, 언리얼 등)과 달리, 코딩 없이 자연어로 게임 세계를 직접 창조할 수 있어, 누구나 게임 개발자이자 플레이어가 될 수 있습니다234. **무한한 리플레이성**과 즉각적 창작이 가능해, 게임 제작과 플레이의 경계가 사라지는 새로운 패러다임을 제시합니다234. Mirage는 현재 GTA 스타일 도시, 레이싱 등 두 가지 데모를 공개 중이며, 미래에는 더 다양한 장르와 기능이 추가될 예정입니다123. “게임의 미래는 전문가가 레벨을 하나씩 만드는 것이 아니라, 누구나 실시간으로 상상하고, 창조하고, 플레이하는 것” — Mirage 개발팀
2355 조회
0 추천
2025.07.07 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입