Loading...

AI 뉴스

마이크로소프트, 최초의 자체 AI 텍스트-투-이미지 모델 공개

페이지 정보

작성자 xtalfi
작성일 10.14 17:52
69 조회
0 추천
0 비추천

본문

125ee6714787ababce7620e24dd5627bWyVz.png

(퍼플렉시티가 정리한 기사)

마이크로소프트(Microsoft Corporation)는 MAI-Image-1을 발표하며, 자체 개발한 최초의 텍스트-이미지 AI 모델을 선보였습니다. 이는 오픈AI(OpenAI)와의 파트너십에 대한 의존도를 줄이려는 회사 전략의 중요한 진전입니다. 이 모델은 이미 LMArena의 경쟁적인 텍스트-이미지 리더보드에서 9위를 차지하며, 마이크로소프트가 독립적인 AI 개발 능력을 점점 더 강화하고 있음을 보여주고 있습니다.


이번 발표는 MAI-Voice-1과 MAI-1-preview(8월 공개)에 이어 마이크로소프트가 자체적으로 만든 세 번째 AI 모델입니다. MAI-Image-1은 자연광 효과와 정교한 풍경이 포함된 사진처럼 사실적인 이미지를 생성하는 데 특화되어 있으며, 많은 대형 시스템보다 더 빠르게 요청을 처리할 수 있습니다.

 

경쟁력 있는 성과 및 기술 중심


MAI-Image-1의 LMArena에서의 상위 10위 랭킹은 이미지 생성 모델이 많은 경쟁 속에서도 뛰어난 경쟁력을 보여줍니다. 사용자들이 2가지 이미지를 비교하여 투표하는 방식인 이 플랫폼에서, 현재 이 모델은 4,000표 이상을 기록하며 9위에 공동으로 올라 있습니다. Microsoft는 이 모델이 많은 AI 이미지 생성기에서 보이는 “반복적이거나 일반화된 스타일의 결과물”을 피하기 위해 크리에이티브 전문가들의 의견을 반영해 개발되었다고 강조했습니다.


이 모델의 빠른 처리 속도는 소비자 수준의 인터랙티브 사용 환경에 적합할 뿐만 아니라, 신속한 반복과 창작 워크플로와의 원활한 통합을 가능하게 합니다. Microsoft는 모델의 아키텍처나 파라미터 수는 공개하지 않았지만, 뛰어난 조명 표현력을 갖춘 사진 실사 합성에 중점을 두었다고 밝혔습니다.

 

OpenAI로부터의 전략적 독립성


이번 출시는 마이크로소프트가 오픈AI 파트너십을 유지하면서도 독립적인 AI 역량을 구축하려는 더 넓은 전략을 강조합니다. 양사는 최근 9월에 개정된 양해각서(MOU)를 체결하여 오픈AI가 인프라 파트너십 측면에서 더 많은 유연성을 확보하는 동시에, 마이크로소프트는 2030년까지 오픈AI 기술에 대한 접근 권한을 유지하게 되었습니다.


마이크로소프트 AI 부문 리더인 무스타파 술레이만은 회사가 “거대한 5년간의 로드맵”을 갖고 모델 개발에 임하고 있다고 밝힌 바 있으며, 이는 앞으로 더 많은 출시가 있을 것임을 시사합니다. 마이크로소프트가 최근 Anthropic의 모델을 일부 Microsoft 365 기능에 통합하면서, 과거 오픈AI에 대한 의존도에서 벗어나 AI 포트폴리오를 다각화하고 있습니다.


MAI-Image-1은 곧 Microsoft Copilot 및 Bing 이미지 크리에이터의 이미지 생성 기능에 적용되어, 회사의 자체 개발 AI 모델 생태계에 합류할 예정입니다. 현재 이 모델은 LMArena에서 테스트용으로 제공되며, 마이크로소프트는 더 넓은 배포에 앞서 사용자 피드백을 수집하고 있습니다. 이는 마이크로소프트가 AI 인프라 제공업체에서 생성형 AI 분야의 직접적인 경쟁자로 진화하는 중대한 전환점을 의미합니다.

댓글 0
전체 427 / 6 페이지
Spotify가 AI 가 제작한 것으로 보이는 음원 7500만 개를 삭제 했다고 발표했다.그리고 AI 음악 금지 정책을 발표하고, 이에 대한 과감한 규제를 시작한다고.———더 강력한 사칭 규칙문제: 우리는 항상 기만적인 콘텐츠에 대한 정책을 가지고 있었습니다. 하지만 AI 도구는 당신이 좋아하는 아티스트의 보컬 딥페이크를 그 어느 때보다 쉽게 생성할 수 있게 해주었습니다.우리가 발표하는 것: 우리는 AI 음성 복제(및 기타 형태의 승인되지 않은 음성 사칭)에 대한 클레임을 처리하는 방법을 명확히 하는 새로운 사칭 정책을 도입하여 아티스트에게 더 강력한 보호와 더 명확한 의지를 제공합니다. 보컬 사칭은 사칭 아티스트가 사용을 승인한 경우에만 Spotify의 음악에서 허용됩니다.우리는 또한 업로더가 스트리밍 서비스를 통해 다른 아티스트의 프로필에 음악을 사기로 전달하는 또 다른 사칭 전술(AI 생성 또는 기타)로부터 보호하기 위해 투자를 늘리고 있습니다. 우리는 주요 아티스트 유통업체와 함께 새로운 예방 전술을 테스트하여 소스에서 이러한 공격을 더 잘 막을 수 있도록 준비하고 있습니다. 우리 쪽에서는 콘텐츠 불일치 프로세스에 더 많은 자원을 투자하여 검토 대기 시간을 줄이고 아티스트가 출시 전 상태에서도 "불일치"를 보고할 수 있도록 할 것입니다.
61 조회
0 추천
10.15 등록
(퍼플렉시티가 정리한 기사)삼성전자가 15일 '흰지팡이의 날'을 맞아 시각장애인과 저시력자를 위한 인공지능(AI) 가전 매뉴얼 '모두를 위한 사용법'을 공개했다고 발표했다. 이번 발표는 시각장애인의 가전제품 접근성을 획기적으로 개선하기 위한 포용적 기술 혁신의 일환이다.스타트업과의 협업으로 탄생한 혁신삼성전자는 올해 초 'C랩 아웃사이드' 스타트업 육성 프로그램에 선정된 시각보조앱 개발 스타트업 투아트(TUAT)와 협업해 이 매뉴얼을 개발했다. 투아트는 200여 개 이상의 국가에서 활용되는 AI 기반 시각보조앱 '설리번 플러스'를 제작한 회사로, 이미지 묘사와 문자 읽기 등 다양한 서비스를 제공하고 있다.새로운 매뉴얼은 삼성닷컴과 AI 기반 시각보조앱 '설리번 플러스'에서 확인할 수 있으며, 화면 읽기 기능과 하단 재생버튼을 통한 음성 설명을 제공한다.혁신적인 접근성 기능들매뉴얼의 가장 큰 특징은 제품 외관과 조작부 위치를 "눈앞에 그리듯" 상세하게 설명한다는 점이다. 예를 들어 '비스포크 AI 콤보' 세탁건조기의 먼지필터 청소 시 기존 매뉴얼이 그림으로 표현했던 것을 "세탁기 전면부 상단 오른쪽 모서리에 먼지필터 도어가 있습니다"와 같이 구체적으로 안내한다.부품 외관도 "손바닥보다 조금 큰 사이즈의 문이 먼지필터 도어입니다"처럼 촉각적 경험에 기반한 설명을 포함했다. 또한 음성인식 Q&A 기능을 탑재해 필요한 정보를 빠르게 찾을 수 있도록 했으며, 시각장애인을 위한 촉각 스티커 부착 위치도 안내한다.단계적 확대와 미래 계획매뉴얼은 2024년형과 2025년형 비스포크 AI 콤보 세탁건조기, 인피니트 AI 콤보 세탁건조기, 비스포크 AI 원바디 세탁기·건조기, 비스포크 AI 세탁기와 비스포크 AI 건조기 등 6개 제품에 우선 제공된다. 한국어 버전으로 시작해 향후 스페인어, 영어, 프랑스어를 포함한 20개 언어로 확대될 예정이다.양혜순 삼성전자 생활가전(DA)사업부 부사장은 "모든 사용자가 삼성 제품을 불편함 없이 사용할 수 있도록 접근성을 지속적으로 개선해 나갈 것"이라며 "앞으로도 혁신 기술과 사회적 가치를 결합해 더 나은 사용자 경험을 제공하겠다"고 밝혔다.흰지팡이의 날은 1980년 세계시각장애인연합회가 시각장애인들의 권리를 보호하고 사회적 관심을 이끌어내기 위해 제정한 기념일이다.
59 조회
0 추천
10.15 등록
(퍼플렉시티가 정리한 기사)아마존이 인공지능 분야에 대한 투자를 가속화함에 따라 인사(HR) 부서의 최대 15%를 감원할 준비를 하고 있다고 이 사안에 정통한 소식통이 화요일 밝혔다. 이번 감원은 전 세계적으로 1만 명이 넘는 인력을 보유하고 채용, HR 기술, 직원 지원 기능을 담당하는 회사의 People eXperience and Technology(PXT) 부서를 주로 대상으로 한다.이 같은 인력 감축은 앤디 재시 CEO가 올해 인공지능 인프라와 클라우드 컴퓨팅 역량에 1,000억 달러 이상을 쏟아붓는 동시에, 기업 인건비를 줄이기 위한 대대적인 전략의 최신 단계로 평가된다. 아마존의 핵심 소비자 사업 부문에서도 추가적인 감원이 예상되지만, 정확한 규모와 시기는 아직 명확하지 않다.AI 기반 인력 혁신이번 해고는 자시(Jassy)가 6월에 직원들에게 AI 도입으로 인해 회사 전반에 걸쳐 인력 감축이 있을 것이라고 경고한 메모에 따른 것이다. "AI를 회사 전체에 광범위하게 활용하면 효율성이 높아져 전체 기업 인력이 감축될 것으로 예상합니다,"라고 자시는 적었으며, 직원들에게 기술적 변화를 받아들이지 않으면 뒤처질 위험이 있다고 강조했다.아마존은 이미 역사상 최대 규모의 인력 감축을 단행했으며, 2022년 말부터 2023년 사이에 약 27,000개의 기업 직무를 없앴다. 이번 감축은 전통적인 성과 기반 감축과 달리, 아마존의 장기 AI 전환에 따른 전략적 구조조정이라는 점에서 차이가 있다.회사의 대규모 AI 투자는 내부 운영을 지원하고 기업 고객에게 서비스를 제공하기 위한 미래형 데이터 센터 구축을 포함한다. 아마존 웹 서비스는 자사의 AI 사업이 현재 수십억 달러 규모로 성장하고 있으며, 세 자릿수 성장률을 기록하고 있다고 밝혔다.휴일 채용, 전략적 변화 강조아마존이 휴일 시즌을 맞아 미국 전역의 창고와 물류 네트워크에서 25만 명의 임시직 근로자를 채용하겠다고 발표한 것과 동시에, 기업 정리해고가 뚜렷한 대조를 이룹니다. 시간당 평균 19달러 이상의 임금을 받는 이 임시직들은 지난 2년과 같은 수준의 채용 규모를 보이며, 회사가 휴일 수요 증가에 대비하고 있음을 보여줍니다.이러한 상반된 접근 방식은 아마존이 변화하는 인력 전략—화이트칼라 일자리 감축과 일선 운영 유지는 병행—을 추구하고 있음을 강조합니다. 이러한 조치는 회사가 트럼프 대통령의 관세 정책 아래에서의 경제적 불확실성을 헤쳐 나가면서, 마이크로소프트, 알파벳 등 경쟁사와의 AI 및 클라우드 컴퓨팅 분야 경쟁 우위 유지를 위해 분투하는 가운데 이루어지고 있습니다.업계 분석가들은 아마존의 이러한 접근 방식을 빅테크 전반의 광범위한 트렌드를 반영하는 것으로 보고 있습니다. 즉, 기업들이 선별적인 정리해고를 단행하는 한편, 미래 성장과 효율성을 이끌 AI 역량에 막대한 투자를 하고 있다는 뜻입니다.
56 조회
0 추천
10.15 등록
(퍼플렉시티가 정리한 기사)AMD는 월요일 산호세에서 열린 Open Compute Project Global Summit에서 Helios 랙 규모 AI 플랫폼을 공개하며, AI 인프라 시장에서 Nvidia의 지배력에 대한 과감한 도전을 알렸습니다. 이 발표는 Oracle이 2026년 3분기부터 50,000개의 AMD Instinct MI450 GPU를 배포하기로 약속하며 첫 주요 고객이 된 것과 동시에 이루어졌습니다.Helios 플랫폼은 급속도로 확장되는 AI 데이터 센터 시장에서 경쟁하기 위한 AMD의 가장 야심찬 노력을 나타내며, Meta의 새로운 Open Rack Wide 사양을 활용하여 Nvidia의 차기 Vera Rubin 아키텍처보다 50% 더 많은 메모리 용량을 제공한다고 회사는 주장합니다. 각 Helios 랙은 72개의 MI450 GPU를 탑재하고 있으며, 31TB의 HBM4 메모리와 1.4 PB/s의 총 대역폭으로 최대 1.4 엑사플롭스의 FP8 성능을 제공합니다.오라클 파트너십은 주요 검증을 의미합니다업계 분석가들에 따르면 약 35억~40억 달러 규모로 평가되는 오라클과의 계약은 AMD의 AI 전략에 대한 중요한 검증을 의미합니다. 오라클 클라우드 인프라스트럭처는 MI450 프로세서로 구동되는 최초의 공개 이용 가능한 AI 슈퍼클러스터의 일환으로 50,000개의 GPU를 배치할 예정이며, 2027년 이후 확장 계획을 가지고 있습니다."고객들은 극한의 확장성과 효율성을 위해 설계된 적응 가능하고 개방적인 컴퓨팅 솔루션을 필요로 합니다"라고 오라클은 파트너십 발표에서 밝혔습니다. 이번 배치는 MI450 GPU와 차세대 EPYC "Venice" CPU, 그리고 Pensando "Vulcano" 네트워킹 기술을 결합한 AMD의 통합 Helios 랙 디자인을 활용할 것입니다.AMD의 주가는 이번 발표 이후 시간외 거래에서 3% 이상 상승했으며, 이는 주로 회사의 최근 AI 파트너십에 힘입어 올해 85% 상승한 것에 더해진 것입니다. 오라클과의 계약은 AMD가 수년간 6기가와트의 GPU 용량을 제공하기로 OpenAI와 수십억 달러 규모의 계약을 체결한 지 불과 일주일 만에 이루어졌습니다.Nvidia 생태계에 대한 개방형 표준 도전Helios 플랫폼은 Nvidia의 독점 생태계에 대한 대안으로 개방형 표준을 촉진하는 AMD의 전략을 구현합니다. 기가와트 규모의 데이터 센터에 최적화된 더블 와이드 랙을 정의하는 Meta의 Open Rack Wide 사양을 기반으로 구축된 Helios는 UALink 및 Ultra Ethernet Consortium 아키텍처를 포함한 개방형 컴퓨팅 표준을 통합합니다.AMD 데이터 센터 솔루션 부문 수석 부사장인 Forrest Norrod는 "개방형 협업은 AI를 효율적으로 확장하는 핵심입니다"라고 말했습니다. "Helios를 통해 우리는 개방형 표준을 실제 배포 가능한 시스템으로 전환하고 있습니다".각 MI450 GPU는 최대 432GB의 HBM4 메모리와 19.6 TB/s의 메모리 대역폭을 제공하여 AMD에게 메모리 집약적인 AI 워크로드에서 잠재적인 이점을 제공합니다. 이 플랫폼은 또한 AMD가 이전 세대 대비 17.9배 높은 성능을 제공하며 Nvidia의 경쟁 시스템인 Vera Rubin과 비교하여 우수한 메모리 사양을 제공한다고 설명합니다.
65 조회
0 추천
10.15 등록
홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입