TextIn xParse(原ParseX)

专为LLM下游任务设计的通用文档解析服务
识别文档或图片中的文字信息,将文档解析为Markdown格式,并按常见的阅读顺序进行还原,赋能下游各类大语言模型任务。
表格识别更精
有线表、无线表、密集表,都能精准识别
单元格合并、跨页表格合并也不在话下
解析速度极
100页长文档,最快仅需1.5s
不仅支撑在线应用提供极致用户体验
也能大幅缩短离线处理时间
定性
单日数百万级调用量,成功率可达
99.999%
来自亿级用户体量APP的技术,稳定可靠
多种需求,一“次”搞定
一个接口,支持 PDFWord(doc/docx)、常见图片(jpg/png/webp/tiff)、HTML 等多种文件格式
一次请求,即可获取文字、表格、标题层级、公式、手写字符、图片信息
pdfwordjpegpngheifhtml
支持多种文档格式
一键分离多种元素信息
一键分离多种元素信息
识别能力,覆盖全面
具有各类常见文档的识别解析能力,并在表格识别上专项优化。
支持标准的金融报告、国家标准、论文、企业招投标文件、合同、文书、工程图纸、电子书、试卷等文档内容。
有线表格
有线表格
无线表格
无线表格
研报表格
研报表格
有线无线混合型表格
有线无线混合型表格
双栏版式
双栏版式
手写文字
手写文字
单行公式
单行公式
影印扫描文件
影印扫描文件
三栏版式
三栏版式
印刷手写混合文字
印刷手写混合文字
行内公式
行内公式
带水印文件
带水印文件
多元场景,轻松应对
与多行业客户的反复打磨,只为给您提供更好的最佳实践,助力业务早日上线。
年报数据入库
教育题库清洗
RAG知识库建设
大模型训练语料清洗
文档翻译
在线判卷
在线文档问答
RPA/Agent
年报数据入库年报数据入库_2
为金融报告场景专项优化
表格更准,能力更全
  • 适配年报中的各类有线/无线表
  • 适配研报表格的复杂版式
  • 表格支持解析为HTML语法
接入方式灵活
支持在线调用、离线调用、私有化部署,可根据您的需求灵活选择。
在线预览与导出
最轻量级的使用方式
支持识别结果的在线预览和编辑
支持批量导入与导出
对非开发者友好
实时API调用
最常见的调用方式,所有请求均实时返回
支持丰富的参数设置
适合在线类应用和时效要求高的开发者
离线套餐包调用
支持全流程域内服务器处理
提供10万次起订的预付费套餐包,使用门槛更低
支持快速集成至现有业务系统
私有化部署
提供按年付费和买断机制
支持国产化显卡适配
立即探索,解锁更多产品详情
申请试用arrow
Copyright@2024 上海合合信息科技股份有限公司 保留所有权利
onlinechat
在线咨询
apply
申请试用
phone
电话咨询
添加助手 领取资料
截屏保存图片到相册,打开微信扫码识别
qr_image
扫码领取资料包
金融
产业金融营销工具包
产业金融营销工具包
20种金融拓客工具包
20种金融拓客工具包
10种金融风控工具包
10种金融风控工具包
15张重点产业图谱
15张重点产业图谱
10张万亿城市产业图谱
10张万亿城市产业图谱
实体
供应链风险管理资料包
供应链风险管理资料包
供应商准入尽调资料包
供应商准入尽调资料包
企业合规经营工具包
企业合规经营工具包
财务应收授信工具包
财务应收授信工具包
制造业风控合规工具包
制造业风控合规工具包