网易易盾:以人工智能技术提升UGC产品内容安全

西西吹雪2018-06-05 15:47

 互联网发展至今,已经成为人们的必需品。我们无论是在工作还是生活中,都会使用互联网。在Web 2.0时代,用户原创内容UGC大量出现,然而,一些垃圾信息、广告、色情图片等内容,正破坏着互联网的纯净度。

 

过去,多数企业会采用人工进行内容审核,然而误报率较高,成本也很高,随着音频、视频等流媒体的出现,内容审核的难度也越来越大。适应这种需求,网易今年推出了内容反垃圾产品网易易盾,为当下解决互联网内容垃圾方面提供了新思路和新方法。

 

内容反垃圾的重要性:规避风险,提升体验

 

有数据显示,仅2016年上半年,我国网民平均每周收到垃圾邮件高达18.9封、垃圾短信数量约为20.6条、骚扰电话更是多达21.3个,紧跟其后的还有恶意电脑广告弹窗和APP推送。而这些只是在网民体验层面的影响,对互联网服务尤其是UGC类产品来说,网络垃圾的泛滥无疑加重了运营风险。
 

(网易易盾总经理周森接受记者采访)

 

网易易盾的总经理周森认为,网络垃圾带来的风险主要集中在两个方面,一是监管,政策法规的安全,如果UGC产生的内容违反了政策法规,企业就会面临关闭的风险;二是用户体验,如果UGC不审核,会出现很多广告、灌水、刷屏等现象,对于用户体验来说会造成极大的影响。

 

既然网络垃圾带来如此大的风险,什么样的企业需要进行内容反垃圾呢?周森表示,只要网站上有UGC,就需要审核,进行内容反垃圾。过去,由于政府的监管压力,大多数企业都是自己来做内容反垃圾,通过技术+人工审核的方式实现,成本也相对比较高。

 

但是,内容反垃圾不是三两个人就可以完成的。周森告诉笔者,内容反垃圾一般是通过技术手段以及运营的流程制度来保证的,需要一定规模的团队才能运转。通常情况下,审核团队最少需要7个人员,7*24小时运转才能保证内容审核工作完成。而如今,网络垃圾的形式也多种多样,除了基本的文本、图片,还有视频、音频等多媒体形式,内容审核的难度也会加大,因此,企业不得不重视内容反垃圾。

 

网易易盾的核心竞争力:人工智能+亿级特征库

 

过去,我们所理解的网易主要是门户网站、游戏、邮箱服务,以及网易云音乐、网易考拉等口碑产品,那么,为什么网易要做内容反垃圾的云服务呢?周森告诉笔者,基于网易十九年对互联网产品研发体系及运营模式的丰富经验和深入探索,网易自去年起,已经面向市场推出一系列场景化云服务,致力于更好更快地满足B端客户业务需求、帮助其解决业务痛点及实现业务目标。而网易易盾是其中的智能反垃圾云服务,是网易云计算的一部分,提供广告过滤、智能鉴黄、暴恐识别及谣言排查等反垃圾服务。

 

网易易盾的核心思想就是用人工智能的技术,来进行反垃圾过滤,减少企业的人工审核,降低人工运营成本,以此来规避企业的运营风险,提升产品的用户体验。

 

周森介绍了网易易盾的产品实力:首先是特征库,基于网易19年的技术沉淀,积累了亿级别的特征库,按照文本和图片分类形成不同类别的特征库,同时还针对每个行业设定专门的特征库。第二就是技术实力,网易拥有众多专业的技术人员,也在多年实践中积累下丰富的技术经验。

 

网易易盾的产品共分为四类反垃圾服务,首先是广告过滤,基于网易邮件反垃圾的智能过滤技术,以及亿级广告特征库,进行精准过滤;第二是智能鉴黄,基于智能识别及海量样本库、信用库,高效识别色情图片;第三是暴恐识别,结合暴恐敏感图像智能分析技术,快速识别定位暴恐目标图像;第四是谣言排查,基于样本库及专业运营经验,快速排查谣言等有害信息。

 

云服务模式:SaaS级产品,便捷调用

 

过去,互联网内容以文字为主,所以大家最常用的就是关键词匹配的方式进行内容识别。但是,关键词的方式极易产生误判,对于用户的体验也不好,所以,网易易盾进行了技术改进。在文字方面,通过关键词识别、规则引擎、自然语言处理三阶段的技术,来保证识别的准确度。周森表示,目前,自然语言处理技术相对使用比较多,毕竟汉语言博大精深,双关、同音字、多音字等都相对比较复杂,采用自然语言技术可以提高准确度。

 

网易易盾通过人工智能技术过滤掉垃圾信息,文本相对过滤速度比较快,图片与视频相对较慢,如果出现争议的判断,则由人工介入进行再次审核。那么,机器过滤的速度有多快呢?周森告诉笔者,依托于网易云计算资源,网易易盾可以支持单日亿级别数据的运算能力,快速响应,实时返回。目前,网易易盾的准确率已经达到了99.8%以上。

 

网易易盾是SaaS级产品,而且使用的门槛也相对较低。主要是调用网易易盾的几个接口,将内容传送给网易易盾就可以实时返回内容的等级,例如垃圾、疑似、正常等。企业的运营人员就很容易的来判别哪些内容是有问题的,并且进行处理。

 

周森透露,未来,网易易盾将会继续深耕在网络安全方面,会在近几个月推出验证码,保护产品的登录注册过程。