随着金融全球化与信息技术的发展,商业银行的外部经营环境剧烈变化,商业银行正在从传统的“部门银行”转变向“流程银行”。流程银行是指通过流程再造后具有可持续竞争力的现代商业银行。
在“部门银行”的分散作业模式下,前台网点柜员兼顾复杂业务的接票与处理,存在以下问题:
我国商业银行的流程银行实践大多首先实现前后台分离,后台业务集中处理,采取集中运营模式推进流程银行建设。逐步实现业务整合上收,财务集中处理,流程再造及全面管理与整合,稳健推进网点转型,减少分支机构业务处理操作工作量,释放网点柜员劳动力,使网点柜员有充足的时间为客户提供更好的服务,从而实现以客户为中心的服务理念。
01. 集中运营业务流程
“集中运营”是指利用电子影像技术和工作流技术,形成分支机构前台受理、专门机构后台集中处理的业务运作模式。前台受理强调简化网点终端功能,在前台业务发生过程中将部分复杂业务的接票和处理分开。全国性标准化业务集中到总行,对于特色类业务或特色类业务的部分操作环节集中到分行。
在集中运营中,长流程的业务被切分成“前台受理-录入-审核-授权”几段清晰分离、相对短的流程,形成“铁路警察各管一段”的工作模式。
在这样的工作模式中,如何将前台每一笔交易的相关票据影像和业务数据,尽可能准确无误传递到后台授权人员,是技术关键。而影像技术就在其中发挥了至关重要的作用。
网点柜员接票后,将凭证扫描自动上传影像平台,影像平台将整张凭证进行切片,每张切片上只有一个要素,如:账号、户名、金额、日期等。两位录入员对切片要素分别进行录入,校验员判断两录结果是否一致,如校验一致,由审核岗进行整单审核,审核凭证图像信息与录入信息是否一致、录入信息与要求填写信息是否一致等,审核通过后由授权岗授权。
02. “智能文字识别”取代“一次人工录入”
在传统的“两录”过程中,可将其中一录由人工录入转变为AI识别,通过智能文字识别技术,系统自动识别提取切片信息,另一录依然为人工录入,将智能文字识别结果与人工录入结果进行一致性校验,在保证录入流程严格准确的基础上,大幅度提升了业务效率,降低人力成本。这种集中运营数字化升级方式目前已被多家银行所采用并成功落地运行。
合合信息拥有17年智能文字识别领域的算法积累,拥有100多项自主知识产权的发明专利,其中境外专利超过30项,并荣获ICPR2020(国际模式识别大会)11项冠军。
依托底层算法与深度学习检测识别模型,合合信息支持印刷体识别、手写体识别,识别准确率高,排除干扰能力强,成功解决抖动模糊、歪斜、反光、形变、模糊、光照不均、阴影、远距离低像素、背景复杂、字体复杂、多语言融合等复杂场景的识别问题。
合合信息支持识别包括中、英、法、俄、西、葡、德、意、日、韩等在内的56种主流语言,支持识别多方向文字、多版式图像。面对切片中不限格式的文本、表格图像,可进行高准确率的文字的识别与提取,技术可用性高。
03.图像智能切片分类
依托合合信息的图像智能处理、分类、存储技术,合合信息可助力银行搭建集中运营基础设施——影像平台,根据业务录入需求,对凭证图像进行智能切片,并根据切片上的要素类型进行分类。
另外,合合信息还支持对识别字段类型进行机打体/手写体智能判断,帮助银行在运用OCR智能文字识别能力时,进一步细化能力应用场景,提升集中运营的精细化程度。
通过建设集中运营影像平台,支持业务前后台分离的作业模式,并提供统一的工作流程推动、影像处理、存储、查询等服务。
04. 客户案例
某全国性股份制银行
某全国性股份制银行借助合合信息的智能文字识别与图像处理能力,实现凭证自动切片,并根据识别字段为机打体或者手写体进行切片分类,机打体切片由OCR智能识别完成一次录入,手写体切片人工录入,在保证录入准确性的同时,提升了运营中心业务处理效率,降低了集中运营的人力成本。据行方反馈,进行此项业务流程改造后,可减少30人天的工作量。
某城商行
某城商行与合合信息合作,对集中运营的电汇凭证、转账支票、进账单等票据凭证进行智能识别录入,识别字段包括:凭证号码、大小写金额、付款账号、付款户名、收款账号、收款户名、出票日期、用途等。一次OCR录入结果与一次人工录入结果进行校对验证,校验一致则录入系统。
01. 事后监督系统
银行需要根据会计规范与银行相关法规,对行内各网点的业务交易进行事后监督,通过对业务凭证、营业日报表等进行复审、核对、检验,实现重点监督、差错处理与综合对账。银行通过事后监督系统,将每一笔交易的凭证进行电子档案化存储,并建立精准的索引,便于后续查询,避免手工翻找凭证的费时费力。
传统事后监督流程中,由于人工审核的人力与效率的局限性,无法对全业务进行审查,只能手工抽查部分大额交易凭证,后督业务覆盖不全面。
依托智能文字识别与智能审核技术,后督系统可实现凭证自动录入、流水勾兑、影像匹配、自动审核,建立全业务后督体系,充分发挥后督防弊纠错、规范行为、保证资金安全的作用。
02.全业务凭证智能识别
由于银行业务涉及凭证种类多样,能否精准识别多类型凭证尤其是非固定版式凭证的特定字段信息,成为考验后督系统审核能力的主要难题。
合合信息支持多种类型的银行凭证高精度识别,包括:转账支票、现金支票、进账单、收款凭证、电子转账凭证、信汇凭证、托收凭证、收费凭证、现金交款单、银行承兑汇票、商业承兑汇票及各类申请书、缴款书、通知书等。
对于非固定版式凭证,合合信息基于自研的智能文字识别与自然语言处理技术,结合空间位置关系特征与语义理解,实现了对非固定版式凭证的高精度识别,充分满足后督全业务凭证智能审核需求,提升后督系统可用性与智能化水平。
另外,凭证印章由于规格多样、文字绕排、深浅不一、易叠字的特点,往往审核效率低、错误多、工作体验差。合合信息支持印章识别与多种形式的印章图像优化,提供印章消除、印章提取、印章展平、印章强化等印章治理方案,可高精度识别录入印章信息,并自动判断印章类型。
基于合合信息的AI算法支撑,银行后督系统可对全业务凭证需审核字段进行自动识别提取,后督员依照审核要求,对字段相互间信息、字段与身份证件信息、联网信息等进行核对校验。
03.自主创建识别模型,业务数据回流训练
由于银行业务凭证种类繁多,针对每种凭证采购对应的OCR模块,不仅成本巨大、采购周期长,且技术更新难度高,灵活性低,尤其是对于有不同版式的同种凭证或不定期更换版式的凭证,非常依赖外部的OCR厂商进行产品调适,工作流较长,影响业务效率。
故此,许多股份制银行与头部城商行、农商行,都在着力推进自身科技能力建设,希望能自主创建并训练可用的文字识别模型,满足业务需求。
合合信息推出智能文字识别训练平台,为有上述需求的银行提供了低代码、自动化的一站式OCR开发平台,帮助银行快速、低门槛地完成批量智能文字识别模型的生成、训练、效果优化与迭代升级。
通过合合信息智能文字识别训练平台,银行的研发人员或实际业务人员可以在极短时间内实现从自主创建识别模型、训练提升识别效果,到实际测试和部署的全周期AI开发工作流,助力银行创建基于自身业务需求的个性化的智能文字识别模型,实现全业务凭证电子档案化。
为了通过实际业务数据不断提升训练效果,合合信息还可助力银行在行内搭建数据回流交换平台,数据回流交换平台可自动获取集中作业平台产生的“OCR录入与人工录入结果校验不一致”的数据并进行加工处理:判断业务类型归属、对应模型名称及对应模型数据集名称,并从影像平台中获取数据对应的影像文件,回流至TextIn 智能文字识别训练平台的数据集。根据实际业务中产生的标注信息数据进行训练,实现“在业务场景中越用越好用”的持续迭代效果。
04.客户案例
某上市城商行
某上市城商行与合合信息合作,部署超50项智能文字识别引擎与智能图像处理引擎,覆盖全文识别、手写体签名识别、表格识别等基础识别能力,身份证、银行卡、驾驶证、行驶证、结婚证、户口本、房产证等证件识别,现金支票、转账支票、进账单、存单、结算业务申请书、代发工资流水等业务凭证识别,增值税专用发票、增值税普通发票、火车票、出租车票、定额发票、机动车销售统一发票等票据识别,赋能集中作业中心、运营管理部、风险管理部、财务企划部等多部门。
同时,该城商行私有化部署了TextIn智能文字识别训练平台,提升自主创建、训练、迭代智能文字识别模型的能力,并通过搭建数据回流交换平台连接集中作业平台与智能文字识别训练平台,数据回流交换平台对来自集中作业平台的识别错误数据进行拉取、整合、格式转换与统计后,将标注数据回流至智能文字识别训练平台,并用于对应模型的训练、测试,提升模型的识别准确率,赋能全业务条线高效智能审核。