자유DocuExtractor

RAG 솔루션 구축을 위한 문서 파일 추출 지원 SDK 입니다. 비정형 문서인 PDF와 바이너리 형식인 HWP 문서를 사용자가 지정하는 JSON 형식으로 추출합니다. 특히 HWP의 경우 배포문으로 보안된 파일도 지원합니다.

DOCX, PDF 형식도 여타 오픈소스 유틸리티랑 비교해보면 확연히 성능과 품질이 차이나는 것을 확인할 수 있습니다. 현장에서 품질이 입증되었습니다.

  • 제품명: 자유DocuExtractor 1.0
  • 주요 기능
    • 문서 내 정확한 데이터 추출 및 분리
    • 문서를 의미단위로 검색하기 위한 메타 데이터 추출
    • 텍스트, 표, 이미지, 파일 정보등 상세하고 정확한 속성을 JSON에 표현
  • 지원 포맷
    • DOCX, PDF, HWP, HWPX
  • 출력 포맷
    • 사용자 지정 JSON 포맷
  • 지원 운영체제
    • Windows, Linux. (32bit, 64bit)
  • 제안서 및 테스트 계정 요청(15일간 테스트 계정을 제공해 드립니다. )
    Trial request: sales (@) jayoo.kr
자유DocuExtractor 제안서및 Trial 요청
본인은 개인정보 정책 및 서비스 약관에 동의합니다.
위로 스크롤