合合信息闯关科创板,智能文字识别技术引关注
科技猎 · 2022-10-12 11:20:09 · 热度:加载中...

  当前,人工智能市场已经成为资本市场关注的焦点,人工智能行业“老兵”合合信息也拟登陆科创板上市。智能文字识别技术是正在登陆科创板的合合信息核心技术之一,以表格识别为例,合合信息智能文字识别技术就可以解决其中的难点。

  众所周知,表格是工作或学习中的常见对象之一,有时是电子表格,有时是图片表格或者纸质版的表格。电子的表格整理起来还比较方便,图片表格或者纸质版的表格整理起来就较为麻烦。这种情况下,高精确度的表格识别技术就能够大幅节省文件处理时间这便是合合信息智能文字识别技术中,图像处理和复杂场景文字识别技术的重要应用。

  为了做到便捷高效识别复杂场景下的表格,合合信息引入深度学习技术,将表格识别分为有线表识别和无线表识别两种方案。有线表识别中,合合信息利用语义分割、角点回归等技术方案还原有线表,在财报相关表格识别测试中,有线表识别单元格结构准确率高于98%。

  合合信息无线表识别则采用序列模型、规则匹配等方案,通过自研模型直接预测表格的逻辑结构,再得到表格的物理结构,在保证表格区域内容的完整性的同时,检测准确率较传统方法显著提升。

  合合信息智能文字识别技术中的表格识别技术已被应用于以“扫描全能王”为代表的C端APP中,通过“文件转换excel”功能服务于大众生活和办公需求,近半年来,“文件转换excel”相关功能累计被调用百万次。作为合合信息智能文字识别引擎中的重要模块,表格识别技术已落地在保险、银行、证券等行业中,应用于合同、银行流水、物流单据识别等多个场景。

  据悉,合合信息曾在2019年国际文档分析识别大会(ICDAR)中获得表格识别竞赛的冠军。公司智能文字识别相关技术还在国际顶会ICPR、ICFHR 等竞赛中获得十余项冠军,并于CVPR、AAAI、ACL、ACM MM等国际顶会上发表。

本文来源:科技猎