在线和离线手写汉字识别:综合研究和新基准
资料介绍:
在线和离线手写汉字识别:综合研究和新基准(中文15000字,英文PDF)
摘要:
最近基于深度学习的手写汉字特征识别的方法已经取得了最顶尖的表现,这种方法是通过直接从原始数据学习有识别度的特征。然而,我们相信长期且充分被研究的特定领域知识仍然有助于手写汉字识别的性能。通过整合传统统一规范化的,按特定方向分割的特征直接映射到深度卷积神经网络,我们便可在ICDAR-2013竞争数据库中获得新的最高精度的在线和离线汉字识别。有了这个新的框架,我们可以消除增长的数据和全体数据的需求,这个框架可以广泛应用于其他系统中来获得最好的结果。这使得我们的框架不仅在训练或者测试中都是高效和有效的。此外,尽管directMap+convNet可以获得最好的结果和超越人类水平的性能,我们表明作者改编版在这种情况下仍然有效。我们提成了一个新的适应层,来减少在一个特定的源层中训练和测试数据的不匹配。适应过程可以高效地并且有效地实现一种无监督的方式。通过在前期训练的卷积神经网络中添加相应的层次,这个层次可以适应特定作者的新的书写风格,并且识别精度可以持续地,显著地进一步改进。本文概述了并比较最近基于深度学习的汉字识别的方法,而且给在线和离线手写汉字识别设置了新的基准。 [来源:http://Doc163.com]
[来源:http://Doc163.com]
[来源:http://www.doc163.com]