- [增加] 词性标注模型加入微博数据,使得在开放域上的词性标注性能更好(+3.3 precision)
- [增加] 依存句法分析模型加入微博数据,使得在开放域上的句法分析性能更好(+3 UAS)
- [增加] 依存句法分析算法切换到transition-based neural network parser,速度从250 tokens/s提升到8000 tokens/s。同时通过加入聚类特征以及优化训练算法,(在新闻领域)准确率也得到小幅提升(+0.2 UAS)
- [增加] `ltp_test`默认支持多线程,线程数可配置。
- [增加] 新加入子模块命令行程序,`cws_cmdline`,`pos_cmdline`,`par_cmdline`,`ner_cmdline`,使用户可以很容易替换中间模块,从而实现语言分析的组合。
- [修改] 优化了训练套件的交互方式
- [增加] 添加模型验证,单元测试模块。