400-6666-582
免费试用
文字识别训练平台
无需OCR开发基础的全流程一站式开发平台,提供海量训练数据快速生成、自动化模型生成及完整的模型训练和测试等功能,让文字识别模型训练更简单
申请试用
热门模型
锚点模型
固定版式文档识别,仅需一张样本即可创建模型,无需训练,就能实现数据的结构化提取。如银行卡、身份证、火车票等。
K-V模型
半固定版式文档识别,针对用户标注的键值对位置和文本信息,训练专属场景的AI模型,从而提升识别率。如银行各类票据、护照等。
NLP模型
不固定版式文档识别,智能化语义理解,不受文本空间位置变化影响,可实现采购订单、收货单、物流单据、海外Invoice、合同、简历等场景的训练。
长文本模型
适用于合同、标书、保单、网页截图等长文本关键信息抽取,支持多页PDF的标注、训练、推理,不限文档与版式,开通即用,无需训练。
分类识别模型
通过大量图片类型标注,结合“纯图像”、“图像+文本”两大算法模式,实现各类证件票据的分类识别。
功能介绍
一站式模型创建与部署
针对文本检测、文字识别、文档分类和信息抽取等任务,合合信息基于业界领先的深度学习算法,提供集数据标注、模型训练、模型部署为一体的机器学习服务。
全版式文档识别与分类
内置丰富预训练模型,可满足不同版式文档识别和分类需求。不受文本方向及位置限制,可智能化实现标准卡证、票据、采购订单、收货单、物流单据、海外Invoice、合同、简历等场景的识别训练。
大批量样本自动预标注
当样本量过大时,仅需人工标注少量样本,训练预标注模型,就可利用模型实现大批量样本的自动标注,大幅节省人工标注成本,提高标注效率。
虚拟样本自动生成训练
当训练数据不足时,支持利用少量样本,自动生成虚拟数据,少量样本即可完成训练,利用虚拟样本提升模型的泛化能力。
模型迭代业务在线优化
依托数据回流功能,可将业务真实数据反哺模型,帮助企业自主生产的模型持续迭代,模型在持续迭代中,不断提升识别准确率和效率。
多硬件适配超灵活部署
支持GPU/CPU混合训练、混合推理部署、多模块合并;支持单GPU训练和纯CPU训练推理,企业可以在现有硬件基础上直接部署训练平台,可有效降低企业硬件改造成本,灵活度高,鲁棒性强。
使用流程
01.
创建模型
结合项目需求,自主选择适配模型创建
image
02.
准备数据
批量上传数据样本,并支持生成虚拟数据
image
03.
数据标注
标注数据集,自动识别填表,并支持自动预标注
image
04.
模型训练
选择预训练模型、迭代轮数,一键开启自动训练
image
05.
模型测试
自动化测试验证,提供详细测试结果,模型识别率一目了然
image
06.
模型部署
下载模型部署包,部署到服务器,即可通过API调用
image
产品优势
零门槛
零基础AI开发者或业务人员可用
易训练
数据标注简单易用,自动生成训练数据
低成本
快速对接业务系统,硬件改造成本低
高精度
模型训练基础扎实,复杂场景也能实现高精度识别
应用场景
多种技术能力,满足不同业务复杂场景
image
银行票证信息录入
银行票证种类多,人力成本投入巨大。依托文字识别训练平台即可创建模型并训练测试,解决定制化识别开发门槛高、周期长的问题。
image
保单批量文字识别
文字训练平台可对各类保单一键训练并测试,当样本量不足时还可自动生成海量标注好的训练数据用于模型训练,提高文件批量定制化识别的精准度。
image
证券报表配置识别
通过自学习数据样本深度强化学习,在具体业务场景下快速响应企业业务变化需求,对识别报表的细微变化无需进行算法调整。
image
零售与服务业会员卡识别
支持自主创建各类会员卡、储值卡等卡片的信息抽取模型,快速提取机构名称与会员卡号,自动录入收银系统。
image
制造业单据识别
支持自主创建海外发票、物流单、提货单、出/入库单等不固定版式单据的信息抽取模型,按照业务需求智能提取票据中的相应字段信息如:单号、商品名、金额、日期等,自动录入业务系统。
image
各类企业定制文档
各行业企业存在各类通知书、确认书、申请书等版式文档,借助训练平台可一站式创建并训练针对各类定制文档的信息抽取模型,助力企业提升业务处理效率。

立即探索,解锁更多产品详情

申请试用
Copyright@2023 上海合合信息科技股份有限公司 保留所有权利沪ICP备12002324号-1 - 单位门户网站法律声明不良信息举报电话:4006611390沪公网安备 31010602003171号上海市互联网违法和不良信息举报中心隐私政策

联系我们