MarkItDown:微软开源的文档一键转Markdown神器MarkItDown是微软开源的轻量级Python工具,能够将PDF、Word、Excel、PPT、图片、音频、HTML等20多种格式的文件一键转换为Markdown。它支持OCR文字识别、语音转录、元数据提取,保留文档的标题、列表、表格等结构信息,特别适合RAG系统和文本分析流水线。在GitHub已获得86k+Sta…分类:免费神器完整内容需要启用 JavaScript 以获得完整阅读体验。