新的手写识别模型在网上拉丁和阿拉伯文字
突尼斯斯法克斯大学的研究人员最近开发了一种新的方法来识别在线脚本中手写的字符和符号。他们的技术在arxiv上预先发表的一篇论文中提出,在用拉丁字母和阿拉伯字母书写的文本上已经取得了显著的成绩。
近年来,研究人员创建了基于神经网络的体系结构,可以处理各种任务,包括图像分类、人脸识别、自然语言处理(NL P)等。手写识别系统是一种计算机工具,专门设计来识别字符和其他手写符号,其方式与人类相似。
事实上,人类在生命的最初几年里,通过单独和分组识别特定的字符,天生就有能力理解不同类型的笔迹。在过去的十多年里,许多研究试图在计算机系统中复制这一能力,因为这最终将能够对手写文本进行更先进、更自动的分析。
研究人员在论文中写道:“我们研究了基于提取特征系统和深度逼近系统的在线手写脚本识别问题。”“我们使用了一种现有的方法,结合新的分类器,以获得一个灵活的系统。”
Sofax大学的研究人员介绍了两个基于深层神经网络的系统:一个在线手写分割和识别系统,它使用一个长期的短期记忆网络(ONHSR-LSTM)和一个由一个卷积长短期记忆网络(ONHR-COVLSTM)组成的在线手写识别系统。
他们的第一个模型,被称为OnHSR-LSTM,是基于一种理论,将人类的知觉系统描述为一种将语言从图形符号转换为符号表示的手段。它的工作方式是检测符号或字符的共同属性,然后根据特定的知觉规律排列它们,例如,基于邻近性、相似性等。
研究人员在他们的论文中解释道:“最后,它(模型)试图建立一个手写体的表示法,基于这样的假设:对形式的感知是对基本特征的识别,直到我们识别出一个物体。”因此,笔迹的表示是原始笔画的组合。笔迹是一系列基本代码,它们被组合在一起来定义一个字符或一个形状。
研究人员提出的第一种技术实质上是使用手写生成模型将手写脚本划分为单独的椭圆笔画。随后,将这些笔画划分为原始代码,神经结构用来识别在线手写脚本中的单词。
由研究人员提出的第二个系统,OnHR-卷积LSTM,是一个生成模型,它使用脚本的在线信号作为输入,并被训练来预测字符和单词。第二种技术特别适用于序列学习任务(即涉及字符和符号的长序列处理和分类的任务)。
研究人员使用五个包含阿拉伯字母和拉丁字母手写脚本的不同数据库对这两个系统进行了培训和评估。他们的测试取得了显著的结果,这两个系统达到98%以上的识别率。有趣的是,研究人员发现,这两种技术的表现与人类在类似任务中的表现相当。
研究人员写道:“我们现在计划在大规模数据库和其他脚本上建立和测试我们提议的识别系统。”