版本(version): 0.0.4(该版本主要是新增训练好的ner和pos_tag模型(albert版), 新增部分其他功能)
变化(change):
* 1.1 新增albert_bilstm_crf训练模型,包括命名实体提取(ner_albert_people_1998)和词性标注(tag_albert_people_1998),
* 1.2 新增tookit常用小工具: 中文繁简转化, 罗马数字与阿拉伯数字转化, 中文拼音转化等功能。
* 1.3 新增训练模型CRF(单独), 新增tf.keras预测模块与高并发模块(model_streamer待适配), 新增n-gram的embedding模式;
* 2.1 修改项目排版, 最外层只保留macropodus和test两级目录,并把evulate/report/image等放入test;
* 2.2 修改log打印方式(修复重读引用, 打印多次日志bug), base目录下log设为全局(只打印一次);
* 2.3 修改dl数据预处理模块, 涉及fit_generator多epcoh迭代(preprocess中迭代完), 不同embedding中label适配(<PAD>, <LCS>, <SEP>);
* 2.4 修改文本摘要中n_tops, 使之适配sklearn版本(>0.19);
* 2.5 修改graph模型架构中CRF的loss和acc等计算模块, 使减少代码量;
* 2.6 编写测试用例, README.md说明, 版本日志等