编辑推荐

网易数帆开源API网关与容器云项目，让云原生生产落地“多快好

网易汪源：统一负载与多云环境的“开放姿态”，才是云原生

网易数帆如何用 Kubernetes“原语”搞定云原生中间件

快手打新挤爆券商系统，网易数帆推出券商稳定性保障方案

探索智慧校园新模式，网易有数在教育行业的实践分享

金融行业大数据治理之路——数据模型篇

知物由学 | 人工智能、机器学习和深度学习如何在网络安全领域中应用？

阿凡达2018-07-20 14:39

“知物由学”是网易云易盾打造的一个品牌栏目，词语出自汉·王充《论衡·实知》。人，能力有高下之分，学习才知道事物的道理，而后才有智慧，不去求问就不会知道。“知物由学”希望通过一篇篇技术干货、趋势解读、人物思考和沉淀给你带来收获的同时，也希望打开你的眼界，成就不一样的你。当然，如果你有不错的认知或分享，也欢迎通过邮件（zhangyong02@corp.netease.com）投稿。

以下是正文：

本文作者：Guarav Banga

最近，我参加了由十几位CISO（首席信息安全官）组成的思想领导力讨论会，我们就一系列网络安全问题进行了杰斐逊式的讨论。讨论会上提出的第一个问题就是大家如何看待人工智能，以及是否在使用人工智能。许多的与会者表示，他们的机器学习项目目前正在进行之中，但同时也强调，在网络安全领域并没有使用到人工智能技术。

人工智能这个词确实值得我们幻想，而且也符合我们对人类智能、图灵测试以及科幻电影的认知。可惜的是，正如我在CISO（首席信息安全官）晚宴上所阐述的那样，人们对“人工智能是什么”这个问题还存在着一些困惑，虽然近年来很多人都在提人工智能，但人们的困惑并没有得到解除。

本文由三部分组成，首先我们探讨一下人类智能与人工智能的一些基本概念，并解释当今比较流行的一些词汇，包括人工智能、机器学习、专家系统和深度学习之间的差异。最后，我们将讨论人工智能在网络安全应用中的真实情况，以及为什么我们需要把它作为一种战略工具。

什么是智能？

在进一步讨论人工智能这个话题之前，让我们首先来定义什么是智能（译者注：在英文中，智能即intelligence）。智能在广义上是相当复杂的，在科学和哲学的许多方面都存在着激烈的争论。但在本文中，我提供了下面这个定义。

对于智能，我有两个很重要的观点。首先，许多科学家认为，人类的智能根源于大脑如何在多种不同类型的感官数据中发现并存储具有相关性的分层模式。例如，当你在捕获的数据包或日志文件中看到某个网络名称中存在“Gaurav-iPhone”的时候，你会很自然地想到这很有可能是你的朋友Gaurav的iPhone。你会无意识地将有关同事姓名的知识与有关常用设备类型的知识联系起来。在生活中，你会不断地无意识地去更新这两个模型，并且会受到来自于多源的多媒体感官输入的影响，这些源包括Apple的广告、电视节目、电子邮件、文章以及走廊上的谈话。你可以试着将这个过程与传统的任意字符串模式匹配程序做个比较，并且在输入的灵活性和输出的准确性上保持一致。

其次，智能是一种预测，这是解决问题的一种方法。比如：你的眼睛正试图看到它所能看到的一切，与此同时，大脑会根据它期望眼睛所能看到的东西来通过神经系统向眼睛发送预测信息。这种预测机制“填补”了本没有意识到的东西，也就是为什么你无法正常识别视觉盲点的原因。这种预测机制也让你能够在晚上漆黑一片的卧室里行走而不会被绊倒：你的大脑向运动神经系统发送信号，为肌肉提供一个行走时所期望的模型。

常规的人工智能与狭义人工智能

人工智能这个概念最初是由一些探索超越传统程序的计算机科学家在20世纪50年代提出来的。他们受到了超智能程序的启发，该程序的智能特征与人类相似，比如“星球大战”中的R2D2和C-3PO，以及Superman III中的超级计算机，这是常规的人工智能。常规的人工智能在今天并不存在。我们不知道如何模仿人类大脑进行工作，甚至不知道模仿它的一小部分智能。

今天存在的人工智能，我们可以称之为狭义人工智能。现在有许多很有用的产品使用到了狭义人工智能，他们可以保质保量地执行一些任务，甚至比人类做得更好。例如亚马逊的Alexa，它的输入范围是有限的，但同时结合了多种狭义人工智能技术来完成某些任务，这让人错误地认为它具有智能。当前的国际象棋和围棋世界冠军也是狭义人工智能的运用。这些狭义人工智能系统拥有前面讨论过的三个智能元素：存储特定领域的知识、获取新知识的机制以及使用这些知识的机制。

当前也存在着几种通过狭义人工智能来解决网络安全领域问题的方法。虽然，能够通过图灵测试并取代安全团队成员的安全机器人并不存在，但是，基于狭义人工智能的工具能够提前发现威胁和漏洞，并且能够比大多数人更好地衡量安全状况。

人工智能、机器学习、专家系统和深度学习之间的区别

机器学习是归纳算法的应用，是知识获取过程的第一步，是在20世纪60年代探索人工智能的过程中产生的。机器学习可以说是侧重于“学习”的算法。计算机不是通过编写特定的计算机指令来完成任务，而是使用大量数据进行“训练”，使其能够学习如何执行任务。用于训练的样本可以由外部提供，也可以由知识发现过程的前一阶段提供。

这么多年来，出现了很多种机器学习算法，包括决策树、归纳逻辑、聚类、贝叶斯网络和人工神经网络。人工智能与统计学密切相关，甚至相互重叠。

机器学习被认为是脱胎于专家系统，但又与之不同，专家系统是根据精心准备的知识体系（规则）通过基于模糊规则的推理来解决问题的。专家系统被吹捧为20世纪80年代人工智能最成功的案例。专家系统背后的原理是，智能系统从它们所拥有的知识中获取能力，而不是从它们使用的特定推理策略中获取能力。简而言之，专家系统拥有知识，但并不完全会自学。它们需要人类程序员或操作员来让它们变得更加聪明。但是，如果根据我们对智能的定义进行判断的话，它们并不聪明。

现在回到会学习的系统上来。机器学习很难，因为在多个维度的数据之间关联模式是一个难题。这是一个大数据和计算密集型问题。人类大脑不断地从大量的源并且跨越多个维度获取大量的感官数据，慢慢地完善它的模型，然后才能达到网络安全团队中熟练员工的智能和专业知识水平。请设想一下一个大学毕业生大脑所接受的训练数据量（标记的和未标记的）。在大多数情况下，适用于机器学习系统的训练数据相当稀少，从而使得机器学习程序无法提供准确的结果。

人工神经网络和深度学习

近年来，我们看到一种被称为深度学习的机器学习技术发展十分迅速，这是一种早期机器学习方法人工神经网络的演进，该神经网络是受到人类大脑结构的启发而创造出来的。在神经网络中，每个节点都会为其输入分配权重，以表示其正在执行的操作的正确与否。最终的输出由这些权重的和决定。实际运用中的神经网络有许多层，每个层对应于神经网络要完成的各个子任务。

神经网络报告的输出采用“概率向量”的形式，例如，系统可能会说该图像有90％的确信度包含给定的动物，该动物有25％的确信度是鳄鱼。

直到目前为止，神经网络的研究几乎没有产生任何可以称之为“智能”的东西。预测输出的确信度很低，因此并没有什么用。你可能已经想到，目前遇到的最基本的问题是，即使是最基本的神经网络，它的计算密集度也很高，建立和使用神经网络来完成复杂的任务是不切实际的。多伦多大学的GeoffreyHinton领导的一个小型研究小组一直在研究这个问题，他们将超级计算机的算法并行化，并证明了这个观点。

为了理解这个问题，我们举一个计算机视觉和自动驾驶汽车方面的例子：识别交通停车标志。当停车标志检测神经网络在训练的时候，很可能会出现很多不正确的答案。例如，它在良好的能见度下可能就做得很好，但在恶劣的天气条件下就不行。这个网络需要大量的训练。它需要看到成千上万，甚至数百万的图像，直到各种神经元输入的权重都调好为止，并且无论环境条件如何，它每次都能得出正确的答案。直到做到这一点，我们可能才会说这个神经网络已经学会了停车标志的样子。

这正是2012年吴恩达（Andrew Ng）在谷歌所做的事情。吴恩达的重大突破是增加神经网络中的层数和神经元的数量，然后通过运行海量数据来训练它，这些海量数据主要是1000万个来自YouTube视频的图像。深度学习中的“深度”表示这种神经网络包含了的大量层。谷歌大脑项目是一个在16000个CPU核上使用深度学习算法训练的神经网络。该系统已经学会了在YouTube视频中识别一些东西，例如“猫”，即使该系统从未被告知过“猫”是什么。神经网络能“看到”猫这个视觉图像、包含单词“猫”的视觉图像，以及包含单词“猫”的音频之间的相关性，并且将这种相关性学习为知识，就像一个小孩子一样。

今天，基于深度学习的图像识别通常做得比人类更好，例如自动驾驶车辆、识别血液中的癌症和核磁共振扫描图像中的肿瘤。还有很多深度学习的变体得到了积极地改进和运用。有些模型可以进行堆叠以产生更高级的分类能力。以下图片来自于亚马逊Rekognition System的演示，深度学习技术能识别出图像和视频流中的对象、面部和上下文。