文件交换的选择

我们最好的用户提交

分类旧日本字符使用CNN

汪东城本周的选择CNN老日本字符分类我的一个同事彰Agata

如今,我可能去很多天没有看到一个手写文档。从电脑和智能手机,电视和书籍,几乎所有我看到的是一个打印字符。这是难得,手写文档的时候。

这个演示(Akira使用深度学习(卷积神经网络)分类各种日本手写字符。在古老的著作,这些日本人物很难破译,因为大自然草书。例如,这里有100个样本的字符。

乍一看,他们看起来就像涂鸦。如果他们在句子的话,也许你可以通过上下文识别字符。但我们能训练一个网络来识别字符完全由自己?彰显示。

他使用一个大型日本经典字符数据集从开放数据中心的人文。只是为了告诉你即使对人类是多么困难,以下是一些样本数据集。

我颜色,相同的字符相同的颜色突出显示。有些类似,但其他人完全不同甚至寻找相同的字符。

使用卷积神经网络(从彰深度学习工具箱使用字符数据集)来训练网络。通常,当你需要从头开始训练一个网络很多标记的图像。没有担忧。他使用的数据集有超过20000的图片,有超过1000对他想每个字符分类图像。训练网络的计算非常昂贵,所以你通常想做这个GPU,或多个GPU如果你有他们。然而,从R2017a你可以训练一个CPU上的卷积神经网络。我花了10分钟,但是我能够训练网络使用处理器仅仅消费笔记本电脑。

一旦训练,彰测试网络对一个测试字符集(不同的训练集)。他的网络实现超过90%的准确率。这里有一些样本正确分类的角色。

这里有一些错误的classifed字符。

更多地了解这个过程,看看通过彰的演示。

评论

试一试,让我们知道你的想法在这里或者离开评论彰。




发表与MATLAB®R2017a

|
  • 打印
  • 发送电子邮件

댓글

댓글을남기려면링크를클릭하여MathWorks계정에로그인하거나계정을새로만드십시오。