Docling
Doclingμ κ³ κΈ PDF λΆμμ ν¬ν¨ν λ€μν λ¬Έμ νμμ νμ±νμ¬ λ¬Έμ μ²λ¦¬λ₯Ό λ¨μννκ³ , μμ±ν AI μνκ³μ μννκ² ν΅ν©λ©λλ€.
μ£Όμ κΈ°λ₯
- ποΈ PDF, DOCX, XLSX, HTML, μ΄λ―Έμ§ λ± λ€μν λ¬Έμ νμ νμ±
- π νμ΄μ§ λ μ΄μμ, μ½κΈ° μμ, ν ꡬ쑰, μ½λ, μμ, μ΄λ―Έμ§ λΆλ₯ λ±μ ν¬ν¨ν κ³ κΈ PDF λΆμ κΈ°λ₯
- 𧬠ν΅ν©μ μ΄κ³ ννλ ₯ μλ DoclingDocument νν νμ
- βͺοΈ Markdown, HTML, 무μμ€ JSON λ± λ€μν λ΄λ³΄λ΄κΈ° νμ λ° μ΅μ μ§μ
- π λ―Όκ°ν λ°μ΄ν°μ νμλ§ νκ²½μ μν λ‘컬 μ€ν κΈ°λ₯
- π€ LangChain, LlamaIndex, Crew AI, Haystack λ± μμ΄μ νΈ AIλ₯Ό μν νλ¬κ·Έ μ€ νλ μ΄ ν΅ν© κΈ°λ₯
- π μ€μΊλ PDF λ° μ΄λ―Έμ§λ₯Ό μν νλμ OCR μ§μ
- π₯ μ¬λ¬ λΉμ μΈμ΄ λͺ¨λΈ(SmolDocling) μ§μ π₯
- π» κ°λ¨νκ³ νΈλ¦¬ν CLI
μΆμ μμ
- π μ λͺ©, μ μ, μ°Έκ³ λ¬Έν, μΈμ΄ λ± λ©νλ°μ΄ν° μΆμΆ
- π μ°¨νΈ λΆμ (λ§λ μ°¨νΈ, μ κ·Έλν, μ κ·Έλν λ±)
- π 볡μ‘ν νν ꡬ쑰 λΆμ (λΆμ ꡬ쑰)
μμνκΈ°
κ°λ
Doclingμ κΈ°λ³Έ κ°λ μμ보기 μμ
λ³ν, RAG λ± λ€μν μ¬μ© μ¬λ‘ λ μνΌ μ΄ν΄λ³΄κΈ° ν΅ν©
μ£Όμ νλ μμν¬ λ° λꡬμμ ν΅ν© μ΄ν΄λ³΄κΈ° λ νΌλ°μ€
API μμΈ μ 보 νμΈνκΈ°
Doclingμ κΈ°λ³Έ κ°λ μμ보기 μμ
λ³ν, RAG λ± λ€μν μ¬μ© μ¬λ‘ λ μνΌ μ΄ν΄λ³΄κΈ° ν΅ν©
μ£Όμ νλ μμν¬ λ° λꡬμμ ν΅ν© μ΄ν΄λ³΄κΈ° λ νΌλ°μ€
API μμΈ μ 보 νμΈνκΈ°
LF AI & Data
Doclingμ LF AI & Data Foundationμ νλ‘μ νΈλ‘ νΈμ€ν λ©λλ€.
IBM β€οΈ Open Source AI
μ΄ νλ‘μ νΈλ IBM Research Zurichμ AI for Knowledge νμμ μμνμ΅λλ€.