文本鉴黄中色情分级的原理是什么?

文本反垃圾中色情分级的原理是什么?智能模型如何快速适应敏感词变种?

网易云有料提问于 2018-03-08 13:43
2 个回答
2 个回答
  • 用户5143866 2019-05-08 14:27

    智能鉴黄行业的兴起,让传统的人工审核、鉴黄师等逐渐相形见绌,互联网创业者、中小型企业寻求第三方反垃圾云服务成为一种新的趋势。这其中凝聚着网易公司十余年反垃圾技术和安全经验的“网易易盾”成为佼佼者,并率先在全国发起成立了首个互联网内容安全联盟,在文本、图片等智能反垃圾方面树立了标杆。点击免费体验网易易盾智能鉴黄服务。 

  • 未来已来 2018-07-13 14:50

    应对变种,简而言之,原理就是:依托基于深度学习的语义分析来处理辨别。


    常规的审核方法是关键词识别和算法规则(规则引擎),主要就是表达式的集合,这种方式识别准确率会提高很多。但垃圾内容升级进化速度太快,复杂字符重组、特殊符号等让常规审核方法也束手无策。一方面除了要识别出垃圾文本,另外一方面不能把正常内容也判定成垃圾信息,举个比较污的例子:


    比如“口交”一词,通过常规审核肯定是认定为垃圾内容,但当它出现在“港口交通”、“串口交接线”这样的语境里却是正常内容,很容易造成误判。


    避免或降低这种复杂语义下的垃圾文本,网易云的经验,就是要依托深度学习技术和大数据技术,从垃圾特征库中提取和不断添加新特征,通过反复学习更有用特征,来达到对复杂语义钟垃圾内容的精确判定。当然,为了提高反垃圾效果,除了通过代码和算法对数据进行处理,支持传统的正则表达式以及各种基于元数据的定制的规则系统也是必不可少的。


    再加一个黄图鉴别原理的链接:人工智能是如何识别一张黄图的?