Agent AI를 통한 문서를 인식하고 분석해보기
페이지 정보
본문
머신러닝의 슈퍼스타이자 코세라에서 무료로 해당 강의를 제공해주는 앤드류 응 교수님이 창업한 Landing-Ai에서
문서와 이미지 효율적 분석을 위한 Agent Ai를 공개하였습니다. 데이터를 다루는데 진심인 기업이니 다른 오픈소스와 상용소스와 비교해볼만해보입니다.
왜 기존 문서 추출은 항상 불편했을까?
PDF나 이미지 속 표, 숫자 등의 데이터를 코딩으로 읽어들이면 부서진 표, 누락된 정보, 흐트러진 레이아웃 등 여러 문제가 생깁니다. OCR도 완벽하지 않아 추가 작업이 많았습니다.
LandingAI ADE란 ?
LandingAI의 ADE(Agentic Document Extraction)는 인간이 문서 레이아웃을 보고 인식하듯이, 구조를 이해하며 데이터를 뽑아냅니다. 단순 텍스트가 아니라, 표나 헤더, 합계 등 시각적 구조를 분석하여 결과를 내줍니다.
시작방법은 간단합니다.
pip install landingai-ade
export VISION_AGENT_API_KEY=<your-api-key>
PDF나 이미지를 바로 구조화하기
playground에서 문서를 올려서 테스트 해보고 실제 사용시에는 키를 등록하여 분석작업을 진행합니다.
아래처럼 파이썬 코드를 실행하면 PDF 속 내용이 깔끔한 마크다운으로 정리됩니다.
간단하쥬?
from landingai_ade import LandingAIADE
response = LandingAIADE().parse(document_url="bank-statement.pdf")
print(response.markdown)
print(response.chunks)
if response.markdown:
with open('markdown-bank-statement.md', 'w', encoding='utf-8') as f:
f.write(response.markdown)
print("마크다운 저장 완료")
else:
print("결과 없음")
https://va.landing.ai/my/playground/ade
복잡한 PDF나 각종 서식이 들어가 있는 문서를 한번 테스트해보세요.