最新下载
热门教程
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
ThinkParse 1.1.0 开源发布:将文档解析打造为可扩展的企业级服务
时间:2026-07-05 08:48:00 编辑:袖梨 来源:一聚教程网
文档解析如何从单机工具升级为高可用服务?ThinkParse 1.1.0 开源发布,提供稳定、可扩展的解析层,让知识库与RAG应用构建更轻松。核心内容:1. 企业级文档解析服务 ThinkParse 的定位与核心价值2. 1.1.0版本的关键升级:品牌统一与引擎强化3. 生产级架构解析:API与Worker解耦带来的稳定性与可扩展性


客户端 → FastAPI(轻量 API)→ Redis 队列 → Celery Worker(MinerU / MarkItDown)→ 本地或 S3 存储

mineru-api、mineru-worker 等)保持不变,现有部署配置可直接沿用。cd docker && sh build.sh),模型会在构建过程中自动下载。worker/tasks.py 时触发的 MINERU_DEVICE_MODE KeyError,避免 Worker 在特定部署模式下异常退出。curl -X POST "http://localhost:8000/api/v1/tasks/submit"
-F "file=@large_document.pdf"
-F "backend=pipeline"
-F "lang=ch"
-F "enable_pagination=true"
/file_parse)兼容 MinerU 官方格式,提交即等结果,适合脚本、小文件、快速验证:curl -X POST "http://localhost:8000/file_parse"
-F "[email protected]"
-F "backend=pipeline"
-F "lang_list=ch"
-F "return_md=true"
/api/v1/tasks/*)提交任务拿 task_id,轮询或回调获取结果,适合生产批量、长任务、高并发:# 提交
curl -X POST "http://localhost:8000/api/v1/tasks/submit"
-F "[email protected]" -F "lang=ch"
# 查询
curl "http://localhost:8000/api/v1/tasks/{task_id}"
/api/v1/queue/stats 实时看积压COMPOSE_PROFILES 一行切换| 类型 | 引擎 | 格式 |
|---|---|---|
| PDF、图片 | MinerU | PDF, PNG, JPG 等 |
| Office、网页、纯文本 | MarkItDown | Word, Excel, PPT, HTML, TXT 等 |
# 1. 复制配置
cp .env.example .env
cd docker && cp .env.example .env
# 2. 选择 Worker 类型(docker/.env)
COMPOSE_PROFILES=redis,mineru-cpu # 开发推荐 CPU
# COMPOSE_PROFILES=redis,mineru-gpu # 生产推荐 GPU
# 3. 构建镜像
cd docker && sh build.sh
# 4. 启动
docker compose up -d
# 验证
curl http://localhost:8000/api/v1/health
原始文档 → ThinkParse(结构化 Markdown)→ ThinkDoc(知识库)/ ThinkExtract(数据抽取)→ Agent 对话 / 检索
登录查看剩余 70% 内容
相关文章
- cctv5app如何投屏 操作方法介绍 07-05
- 鄂汇通如何查中考成绩 鄂汇办中考成绩查询教程 07-05
- 潇湘高考缴费app志愿填报怎么填报 潇湘高考填报志愿方法指南 07-05
- 今日相机如何设置广角 今日水印相机广角镜头使用教程 07-05
- dnf手游助手app怎么隐藏个人游戏信息 详细操作方法介绍 07-05
- 粉笔公考app如何切换考试类型 粉笔app更改考试类型方法 07-05