Generalnewsextractor

Latest version: v0.1.3

Safety actively analyzes 688600 Python packages for vulnerabilities to keep your Python projects secure.

Scan your dependencies

0.1.5

1. 修复由于`node.getparent().remove()`会移除父标签中,位于自己后面的 text 的问题
2. 对于class 中含有`article`/`content`/`news_txt`/`post_text`的标签,增加权重
3. 使用更科学的方法移除无效标签

0.1.4

更新Pypi 的名称

0.1.3

1. 修复 pyyaml 依赖

0.1.2

1. 指定 host 参数,获取图片绝对路径
2. 返回正文所在 标签的 HTML 源代码
3. 指定新闻标题的 XPath
4. 提前移除特定的 HTML 标签
5. 通过YAML、JSON 配置文件指定默认参数

Links

Releases

Has known vulnerabilities

© 2024 Safety CLI Cybersecurity Inc. All Rights Reserved.