Skip to content

Docling

Docling DS4SD%2Fdocling | Trendshift

arXiv PyPI 버전 PyPI - 파이썬 버전 uv Ruff Pydantic v2 pre-commit MIT λΌμ΄μ„ μŠ€ PyPI λ‹€μš΄λ‘œλ“œ Docling μ•‘ν„° OpenSSF Best Practices LF AI & Data

Docling은 κ³ κΈ‰ PDF 뢄석을 ν¬ν•¨ν•œ λ‹€μ–‘ν•œ λ¬Έμ„œ ν˜•μ‹μ„ νŒŒμ‹±ν•˜μ—¬ λ¬Έμ„œ 처리λ₯Ό λ‹¨μˆœν™”ν•˜κ³ , μƒμ„±ν˜• AI μƒνƒœκ³„μ™€ μ›ν™œν•˜κ²Œ ν†΅ν•©λ©λ‹ˆλ‹€.

μ£Όμš” κΈ°λŠ₯

  • πŸ—‚οΈ PDF, DOCX, XLSX, HTML, 이미지 λ“± λ‹€μ–‘ν•œ λ¬Έμ„œ ν˜•μ‹ νŒŒμ‹±
  • πŸ“‘ νŽ˜μ΄μ§€ λ ˆμ΄μ•„μ›ƒ, 읽기 μˆœμ„œ, ν‘œ ꡬ쑰, μ½”λ“œ, μˆ˜μ‹, 이미지 λΆ„λ₯˜ 등을 ν¬ν•¨ν•œ κ³ κΈ‰ PDF 뢄석 κΈ°λŠ₯
  • 🧬 톡합적이고 ν‘œν˜„λ ₯ μžˆλŠ” DoclingDocument ν‘œν˜„ ν˜•μ‹
  • β†ͺ️ Markdown, HTML, 무손싀 JSON λ“± λ‹€μ–‘ν•œ 내보내기 ν˜•μ‹ 및 μ˜΅μ…˜ 지원
  • πŸ”’ λ―Όκ°ν•œ 데이터와 폐쇄망 ν™˜κ²½μ„ μœ„ν•œ 둜컬 μ‹€ν–‰ κΈ°λŠ₯
  • πŸ€– LangChain, LlamaIndex, Crew AI, Haystack λ“± μ—μ΄μ „νŠΈ AIλ₯Ό μœ„ν•œ ν”ŒλŸ¬κ·Έ μ•€ ν”Œλ ˆμ΄ 톡합 κΈ°λŠ₯
  • πŸ” μŠ€μΊ”λœ PDF 및 이미지λ₯Ό μœ„ν•œ 폭넓은 OCR 지원
  • πŸ₯š μ—¬λŸ¬ λΉ„μ „ μ–Έμ–΄ λͺ¨λΈ(SmolDocling) 지원 πŸ”₯
  • πŸ’» κ°„λ‹¨ν•˜κ³  νŽΈλ¦¬ν•œ CLI

μΆœμ‹œ μ˜ˆμ •

  • πŸ“ 제λͺ©, μ €μž, μ°Έκ³ λ¬Έν—Œ, μ–Έμ–΄ λ“± 메타데이터 μΆ”μΆœ
  • πŸ“ 차트 뢄석 (λ§‰λŒ€ 차트, 원 κ·Έλž˜ν”„, μ„  κ·Έλž˜ν”„ λ“±)
  • πŸ“ λ³΅μž‘ν•œ ν™”ν•™ ꡬ쑰 뢄석 (λΆ„μž ꡬ쑰)

μ‹œμž‘ν•˜κΈ°

LF AI & Data

Docling은 LF AI & Data Foundation의 ν”„λ‘œμ νŠΈλ‘œ ν˜ΈμŠ€νŒ…λ©λ‹ˆλ‹€.

IBM ❀️ Open Source AI

이 ν”„λ‘œμ νŠΈλŠ” IBM Research Zurich의 AI for Knowledge νŒ€μ—μ„œ μ‹œμž‘ν–ˆμŠ΅λ‹ˆλ‹€.