Hanlp

Latest version: v2.1.0

Safety actively analyzes 693883 Python packages for vulnerabilities to keep your Python projects secure.

Scan your dependencies

Page 7 of 11

1.4.0

1. :triangular_flag_on_post:请参考文档[《文本分类与情感分析》](https://github.com/hankcs/HanLP/wiki/%E6%96%87%E6%9C%AC%E5%88%86%E7%B1%BB%E4%B8%8E%E6%83%85%E6%84%9F%E5%88%86%E6%9E%90)
1. 数据包依然兼容data-for-1.3.3.zip: [国内网盘](https://pan.baidu.com/s/1o8Rri0y) 或 [海外連結](https://drive.google.com/open?id=0B1lvF8Hhw1uZTU5SZ29YbXJaUVk) `md5=71f6fbbcde4ad70b5b97d4a01ca03c3c`
获取最新版的数据包,请`fork`一份并`git clone https://github.com/YourName/HanLP.git`。
1. Portable版同步升级到v1.4.0


<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.4.0</version>
</dependency>


:tada:感谢大快公司开源的文本分类模块!

1.3.5

1. 大幅优化CRF分词和二阶HMM分词,重构CharacterBasedGenerativeModelSegment TylunasLi
1. 自定义词典支持热更新:https://github.com/hankcs/HanLP/issues/563 ,ngram模型支持热加载:https://github.com/hankcs/HanLP/issues/580
1. 新增一个提高用户词典优先级的开关:https://github.com/hankcs/HanLP/issues/633
1. 支持98年人民日报的复合词语料格式,如"[中央/n 人民/n 广播/vn 电台/n]nt"
1. 开放TextRank关键词提取中的最大迭代次数参数:https://github.com/hankcs/HanLP/issues/577
1. 为Term添加equal方法 AnyListen
1. TextRankKeyword 提取窗口相近词的强化 tiandiweizun
1. 文本摘要方法支持自定义句子分隔符 wangdong
1. 提高AC自动机健壮性,添加hasKeyword接口 fnaith
1. 修复BinTrie.remove不存在的key时导致的问题:https://github.com/hankcs/HanLP/issues/540
1. 解决mini模型下同时打开所有命名实体识别和数词识别时触发的问题:https://github.com/hankcs/HanLP/issues/542
1. CharTable.txt 添加上下标字符的对应关系 AnyListen
1. 将“\t”等不可打印的字符视作分隔符:https://github.com/hankcs/HanLP/issues/584
1. 中文数词与阿拉伯数词切分开 jian.li
1. 修正全角年份识别中字符串长度错误,修正数字识别工具的错误,增加测试代码。支持读取包含BOM的文本文件。 TylunasLi
1. 校对CoreNatureDictionary.txt,删除以分号开头的错误词语:https://github.com/hankcs/HanLP/issues/221#issuecomment-313594433
1. 修复CoNLLWord中toString方法的bug xu2333
1. 微调人名识别模型:https://github.com/hankcs/HanLP/issues/562 删除人名识别模型中的高频动词D标签,降低误命中率,音译人名识别取消外国地名触发
1. 修复Nature.fromString和IOUtil.loadDictionary:https://github.com/hankcs/HanLP/issues/626
1. 修正简繁一多对应校验表,拼音等
1. 数据包依然兼容data-for-1.3.3.zip: [国内网盘](https://pan.baidu.com/s/1o8Rri0y) 或 [海外連結](https://drive.google.com/open?id=0B1lvF8Hhw1uZTU5SZ29YbXJaUVk) `md5=71f6fbbcde4ad70b5b97d4a01ca03c3c`
获取最新版的数据包,请`fork`一份并`git clone https://github.com/YourName/HanLP.git`。

Portable版同步升级到v1.3.5


<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.3.5</version>
</dependency>


:tada:感谢所有contributors、所有在issue中提出宝贵建议的用户!

1.3.4

1. 集群环境中CoreStopWordDictionary适配IOAdapter: https://github.com/hankcs/HanLP/issues/530
1. 修复HDFS上的readBytesFromOtherInputStream:https://github.com/hankcs/HanLP/issues/536#issuecomment-302918045
1. 解决resin下自定义IOAdapter的IO异常:https://github.com/hankcs/HanLP/issues/528
1. 修正TextUtility.isAllSingleByte:https://github.com/hankcs/HanLP/issues/526
1. 修正了核心字典的”每xx"词性:https://github.com/hankcs/HanLP/pull/524
1. 数据包依然兼容data-for-1.3.3.zip: [国内网盘](https://pan.baidu.com/s/1o8Rri0y) 或 [海外連結](https://drive.google.com/open?id=0B1lvF8Hhw1uZTU5SZ29YbXJaUVk) `md5=71f6fbbcde4ad70b5b97d4a01ca03c3c`
获取最新版的数据包,请`fork`一份并`git clone https://github.com/YourName/HanLP.git`。

Portable版同步升级到v1.3.4


<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.3.4</version>
</dependency>


特别鸣谢

hx78
realgzq
junphine
cicido
AnyListen

:tada:感谢所有contributors、所有在issue中提出宝贵建议的用户!

1.3.3

1. CharType的二进制由程序自动生成,版本库内全部词典/模型实现明文文本储存维护
1. 支持逗号分割的.csv格式词典(感谢driventokill)
1. 移除用于加载语料和训练模型的main方法,方便Spring用户:https://github.com/hankcs/HanLP/issues/391
1. 在机构名识别的时候,词语保持自己的词性,而不是未团的词性:https://github.com/hankcs/HanLP/issues/403#issuecomment-281859486
1. 增加一些方便语料处理的方法
1. 机构名识别限定nrf为特征词的译名性前缀,删除一些类似于"的""之"等不能构成机构名的助词成分
1. 修正一个拼音(感谢mudsu)
1. 移除TextRankKeyword中逻辑重复的语句(感谢jsksxs360)
1. 优化索引分词,以字典序保证子成分的顺序稳定:https://github.com/hankcs/HanLP/issues/496#issuecomment-298007743 ,改进索引分词的完整性,修复了索引分词中的各种问题(感谢gxy0451和panhaidong的issue)
1. 微调BiGram模型、人名识别模型、机构名识别模型
1. 去掉了portable版的文件存在校验逻辑,使其完整地支持root配置项和IOAdapter。旧版用户如果遇到兼容性问题,请参考[升级指南](https://github.com/hankcs/HanLP/issues/523)
1. 新版数据包data-for-1.3.3.zip: [网盘分流](https://pan.baidu.com/s/1o8Rri0y) 或 [电信下载](http://115.159.41.123/click.php?id=3) 或 [海外連結](https://drive.google.com/open?id=0B1lvF8Hhw1uZSDMtbDQwX0ZHVm8) `md5=71f6fbbcde4ad70b5b97d4a01ca03c3c`

Portable版同步升级到v1.3.3


<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.3.3</version>
</dependency>


:tada:感谢所有contributors、所有在issue中提出宝贵建议的用户!

1.3.2

:gift:
1. 机构名识别模式串匹配由AhoCorasick升级到AhoCorasickDoubleArrayTrie
2. 人性化提示神经网络依存句法模型路径配置问题
3. 索引模式支持用户词典全切分
4. 默认停用词过滤器不再过滤单字
5. 微调机构名识别模型,微调人名识别模型
6. 修订简繁词典
7. 新版数据包data-for-1.3.2.zip: [网盘分流](https://pan.baidu.com/s/1pKUVNYF) 或 [电信下载](http://115.159.41.123/click.php?id=2)
8. Portable版同步升级到v1.3.2


<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.3.2</version>
</dependency>

1.3.1

1. 全部静态依存句法分析模型迁移到内存池
2. 修复自定义词典的合并逻辑
3. 数据包依然兼容[data-for-1.3.0.zip](https://pan.baidu.com/s/1gfx7evD)
4. Portable同步升级到v1.3.1


<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.3.1</version>
</dependency>

Page 7 of 11

© 2025 Safety CLI Cybersecurity Inc. All Rights Reserved.