中国互联网词库 ciku
ciku 是一个托管在 GitHub 上的开源项目,旨在为开发者提供免费的中国互联网敏感词库。该词库目前重点收录了两类内容:互联网脏话 与色情词汇。
该项目在数据覆盖面上表现强劲,收录了大量最新的网络流行语与变体词,能够为需要进行文本过滤或数据清洗的开发者提供高质量的参考基准。
核心特性
- 完全免费: 无论是个人研究还是商业用途,均可永久免费使用。
- 收录广泛: 实时跟进互联网新词,词库丰富度高,有效覆盖多种敏感表达方式。
- 适用场景: 适用于社区评论审核、聊天机器人敏感词拦截、文本内容合规性检测等数据处理环节。
项目地址
GitHub 仓库:pennyliang/ciku
正文完