HWDB-1.1 手写汉字CNN识别模型训练 - 代码天地

HWDB-1.1 手写汉字CNN识别模型训练

企业开发 2018-06-08 05:17:18 阅读次数: 0

数据集

使用CASIA-HWDB1.1进行训练和测试，训练集和测试集按照4:1划分，测试集235200张，训练集940800张，

共计1,176,000张图像。该数据集由300个人手写而成，其中包含171个阿拉伯数字和特殊符号，3755类GB2312-80 level-1汉字。

http://www.nlpr.ia.ac.cn/databases/handwriting/Download.html

样例图

模型训练

Finetuning from a pretrained model
以googlenet为基础模型，进行finetuning。直接训练全部类别无法收敛时，尝试分阶段训练。
训练后的测试结果为loss-1和loss-2分支准确率为95%，loss-3分支为97%。收敛很快，以0.01为基础学习率，32的batch size，不到10000次迭代就收敛了。
Train 'HWDB-CNN-9Layer' model
虽然googlenet效果尚可，但是由于网络设计的历史原因，全连接层没有用avg_pooling，所以输入时需要强行把图像放大到224*224，且输入是3通道，对于字符来说有点浪费资源。决定按照论文https://arxiv.org/abs/1702.07975重头撸一个轻量点的模型。
这个论文里的模型比较简单，就是很基本的结构（模型图太长，不贴了）。加了BN（注意BN以及一些特殊层训练和deploy的区别），训练过程收敛也很快，过程图如下：
训练过程准确率
训练过程损失

前传时间及模型大小对比
googlenet: 0.46ms/张，89.5MB
HWDB-CNN-9Layer: 0.205ms / 张, 44.2MB

猜你喜欢

转载自blog.csdn.net/MLlearnerTJ/article/details/80607388

HWDB-1.1 手写汉字CNN识别模型训练

keras+卷积神经网络HWDB手写汉字识别

CNN手写汉字识别

应用训练MNIST的CNN模型识别手写数字图片完整实例（图片来自网上）

手写汉字笔迹识别模型汇总

Tensorflow实践：CNN实现MNIST手写识别模型

CNN实现MNIST手写识别模型

tessorflow练习手写汉字识别

联机与脱机手写汉字识别

DenseNet手写汉字识别

基于Pytorch的手写汉字识别

Android 通过 TensorFlow 训练模型识别手写数字

Tensorflow训练MNIST手写数字识别模型

CASIA手写体数据集HWDB gnt和dgrl格式解析

HWDB1.1数据集.gnt转换成.png

MNIST手写数字识别——CNN

Kaggle手写数字识别 -- CNN

手写数字识别CNN

CNN手写数字识别

【教学】手写汉字识别_单个汉字鼠标手写识别

【教学】手写汉字识别，含训练代码，界面演示，1w字教学

【模型+代码/保姆级教程】使用Pytorch实现手写汉字识别

基于CNN网络的mnist手写数字数据库训练和识别

DL之CNN：利用自定义DeepConvNet【7+1】算法对mnist数据集训练实现手写数字识别、模型评估(99.4%)

TensorFlow实现CNN卷积神经网络对手写数字集mnist的模型训练

Keras深度学习——构建 CNN 模型识别 MNIST 手写数字

利用keras进行手写数字识别模型训练，并输出训练准确度

训练第一个AI模型：MNIST手写数字识别模型

densenet tensorflow 中文汉字手写识别

基于LeNet的手写汉字识别(caffe)

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)