以下列出了主要的变更:
- 更新了训练代码,使用mxnet的recordio首先把数据转换成二进制格式,提升后续的训练效率。训练时支持对图片做实时数据增强。也加入了更多可传入的参数。
- 允许训练集中的文字数量不同,目前是中文10个字,英文20个字母。
- 提供了更多的模型选择,允许大家按需训练多种不同大小的识别模型。
- 内置了各种训练好的模型,最小的模型只有之前模型的1/5大小。所有模型都可免费使用。
- 相较于之前版本的模型,新的模型精度有显著提升,尤其是针对英文单词的识别。新模型已经可以识别英文单词间的空格。
- 支持文字识别只在给定字符集中进行。 对于一些纯数字或者纯英文字母的应用场景可以带来识别率提升。
- 优化了对黑底白字多行文字图片的支持。
- mxnet依赖升级到更新的版本了。很多人反馈mxnet 1.4.1经常找不到没法装,现在升级到>=1.5.0,<1.7.0。