마이크로소프트의 Fara-7B는 GPT-4o와 경쟁하는 컴퓨터 사용 AI 에이전트로, PC에서 직접 작동
페이지 정보
작성자
xtalfi
작성일
16:10
본문
Microsoft는 사용자의 PC에서 직접 시각적 스크린샷을 해석하고 마우스 및 키보드 동작을 제어하여 작업을 수행하는 70억 개의 매개변수를 가진 AI 에이전트 Fara-7B를 공개했으며, 이는 데이터 처리를 로컬에 유지하여 개인정보 보호를 강화하고 HIPAA 및 GLBA와 같은 규정을 준수할 수 있는 클라우드 기반 모델의 대안을 제공합니다.
WebVoyager 웹 탐색 벤치마크에서 Fara-7B는 69.5%의 작업 성공률을 달성하여 GPT-4o의 65.1% 성능을 능가했으며, 유사한 크기의 모델이 필요로 하는 41단계에 비해 약 16단계 만에 작업을 완료했습니다.
이 모델은 Microsoft의 Magentic-One 다중 에이전트 프레임워크에 의해 생성된 145,000개의 합성 작업 궤적을 사용하여 훈련되었으며, 현재 MIT 라이선스 하에 Hugging Face에서 사용할 수 있습니다. 다만 Microsoft는 이 모델이 여전히 실험적이며 프로덕션 배포보다는 파일럿 프로젝트에 가장 적합하다고 주의를 당부하고 있습니다.
댓글 0