全球主机交流论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

IP归属甄别会员请立即修改密码
查看: 1367|回复: 15
打印 上一主题 下一主题

新浪应该把他们的敏感词库开源出来 做点实事

[复制链接]
跳转到指定楼层
1#
发表于 2019-5-30 09:32:23 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
我们这些小企业小单位 一个敏感词库用一万年
新浪的词库大而全且更新即时
只有新浪开源了他们的敏感词库
我们这些小企业才算真正的和他们站在了同一战线上

WB的敏感词库 里面应该不少于20w个词吧?
15#
发表于 2019-5-30 11:31:25 | 只看该作者
把敏感词公开出来?你脑子瓦塔拉?
14#
发表于 2019-5-30 11:30:15 | 只看该作者
作为之前sina的员工,可以告诉你,敏感词很多都是wangan给的,你应该找wangan要,不是sina,这种是不会公开的,公开了容易被人钻漏洞。
13#
发表于 2019-5-30 10:46:46 | 只看该作者
之前批站后台源码泄露出来的时候里面就有拦截词库,里面某些人的名字跟脏话相隔很近,就被ytb某些人说成侮辱xxx了
12#
发表于 2019-5-30 10:41:03 | 只看该作者
新浪有的敏感词是付钱敏感,比如某些明星黑料
11#
发表于 2019-5-30 10:09:03 | 只看该作者
然后被各种黑灰产拿去研究之后,通过添加特殊字符来躲过敏感词检测?
10#
发表于 2019-5-30 09:59:26 | 只看该作者
一般也是开放一个检测API,而且可能需要付费。
9#
发表于 2019-5-30 09:50:15 | 只看该作者
开放出来,那不是把皇帝的新装戳破了?  当局还有脸面?
8#
发表于 2019-5-30 09:49:19 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
7#
发表于 2019-5-30 09:48:36 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
您需要登录后才可以回帖 登录 | 注册

本版积分规则

Archiver|手机版|小黑屋|全球主机交流论坛

GMT+8, 2025-9-26 01:59 , Processed in 0.063861 second(s), 11 queries , Gzip On, MemCache On.

Powered by Discuz! X3.4

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表