Hanlp

Latest version: v2.1.0

Safety actively analyzes 693883 Python packages for vulnerabilities to keep your Python projects secure.

Scan your dependencies

Page 10 of 11

1.2.0

1. 分词器支持数词和数量词识别
2. 消除CRF分词对句子开头的词语的错误合并
3. 实现了一个基于HMM2-Trigram字符序列标注的分词器
4. 加入了一些防止缓存不兼容的安全措施
5. 词典减肥,新增TnT模型:[data-for-1.2.0.zip](http://pan.baidu.com/s/1nt64YDV)
6. 重构分词器
![image](http://ww4.sinaimg.cn/large/6cbb8645jw1erw04dfdk0j210t0buwgi.jpg)

1.1.5

1. 词典由AhoCorasickDoubleArrayTrie降级为DoubleArrayTrie,内存占用减少一半
2. 所以词典的缓存与旧版不兼容,请删除缓存或者下载[data-for-1.1.5.zip](http://pan.baidu.com/s/1kTGIs55)
3. 为减小配置难度,提供内置了mini数据包的Portable版,零配置,可以通过Maven直接引入:


<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.1.5</version>
</dependency>

1.1.4

1. 优化了Viterbi分词速度
2. 降低了人名识别误命中率
3. 调整词性标注时的Viterbi算法
4. 大幅改进CRF分词效果,并且提供[新模型](http://pan.baidu.com/s/1EY7Jg)**(与旧版本不兼容)**

1.1.3

1. 新增了**分词结果是否展示词性**的配置项`ShowTermNature=true`
2. 修复了停用词词典编码的潜在问题
3. CRF算法微调,等待未来重新发布新模型
4. 最大词频参数微调

1.1.2

fixed issue https://github.com/hankcs/HanLP/issues/2

1.1.1

修复两个词典路径问题

Page 10 of 11

© 2025 Safety CLI Cybersecurity Inc. All Rights Reserved.