前西点军校教授:人工智能是全球反恐的新战场
11月13日,恐怖组织ISIS在法国巴黎市中心制造多起枪击爆炸事件。11月18日,我国公民樊京辉被ISIS作为人质残忍杀害。12月1日,美国加州圣贝纳迪诺发生枪击血案,杀手发动袭击前曾宣誓效忠ISIS……在这样严峻的形式下,全世界都敲响了反恐战斗的警钟。
那么,如何才能有效地打击恐怖分子?此前,记者曾向大家介绍过,美国亚利桑那州立大学的Paulo Shakarian教授将人工智能技术用在了反恐和反犯罪的战斗中(点击此处访问文章)。他毕业于西点军校,在西点军校担任过计算机科学副教授,曾战斗在伊拉克一线,拥有丰富的智能反恐经验。最近,记者对Shakarian教授进行了专访,请他为中国读者谈一谈自己的工作、人工智能在反恐中的应用,以及他对和平的看法。
人物背景:Paulo Shakarian
Paulo Shakarian,美国亚利桑那州立大学计算机科学教授,马里兰大学计算机科学博士,毕业于西点军校,曾在西点军校电气工程与计算机科学系担任副教授,还担任过美国军方情报官员和DARPA研究员。2003年,他作为美军第一装甲师的军方情报官员被派到了伊拉克,后又在驻扎德国的第501军事情报旅担任排长。在那里,他为军队收集、处理和分析了大量情报,还荣获了铜星勋章。在伊拉克期间,Shakarian开始用他在西点军校学到的计算机科学知识进行情报分析,并开始构思用人工智能对恐怖袭击进行建模。
采访实录
记者:说到反恐,很多人都会想到枪炮,但很少人会想到人工智能。请问您一开始是如何将二者联系起来的呢?是和您的个人经历有关吗?有没有什么特殊的时刻让您做出这个决定呢?
Shakarian教授:我在军队中服役时,曾在伊拉克待了2年,主要工作就是分析恐怖分子和叛乱团体的行为。2003到2004期间,我待在伊拉克,2006年到2007年期间,我又去到那里。说到计算机的使用,伊拉克战争与美国过去所涉入的所有战争都完全不同。我想,正是在这次冲突中,计算机系统首次成为了巡逻士兵的日常用品。这带来的后果就是,前所未有的大量数据被收集进来了。2006年,我在一个小团队中工作,这个团队与一个伊拉克特别准军事部队的工作很紧密。跟随这个部队,我跑遍了伊拉克境内的所有地方。在此过程中,我看到了许多不同的军事部队以不同的方式收集和分析数据。我之前曾获得计算机科学的学士学位,所以我突然想到,许多分析都能用先进的算法来改进,还能提高效率。
从伊拉克回来之后,我被选为DARPA(美国国防部先进研究项目局)的研究员,在弗吉尼亚待了几个月,了解了他们所使用的许多先进科技。
有了这些经历之后,我从2008年开始读博士。当时我脑中已经有一些关于人工智能如何改进反恐实战的想法。研究院为我提供了一个机会,能在研究中探索我自己的想法。获得博士学位后,我依然在继续进行这些研究。不管是过去在西点军校教书时,还是现在离开军队后来到亚利桑那州立大学,我的研究都在持续进行。
记者:目前,人工智能在反恐中有什么应用?与传统方法相比,人工智能有什么优势?
Shakarian教授:人工智能在很多方面都能帮助反恐战斗——因为这个领域中的很多问题对人类来说是巨大的挑战。比如说:
1)找到恐怖团伙行为的时间格局(temporal patterns)能帮助我们理解到底是什么导致了某些特定的行为(正如我们在ISIS数据分析中所做的一样)。
2)理解信息在社交媒体上是如何扩散的,有助于我们理解极端团体的哪些信息会对大众产生共鸣,这非常重要(例如我们最近对预测社交媒体病毒传播的研究:http://arxiv.org/abs/1508.03371)。(记者注解:关于这项研究,最近几天你的朋友圈被「主要看气质」刷屏了吗?或许你都不知道这条信息的源头是什么,但它突然间就红遍大江南北的社交媒体,就像病毒一样,成指数级增长,这就叫「病毒传播」。恐怖分子也善于利用病毒传播,在社交媒体上发布符合他们意识形态的信息。这种信息具有将普通人变成恐怖分子的潜力。所以,在早期识别出这样的信息,对阻止恐怖信息的散布十分重要。那么,究竟什么样的信息具备病毒传播的潜质呢?Shakarian教授和他的同事们用WISE(Web信息系统工程国际会议)2012年挑战赛所提供的新浪微博数据库,找到了一套可以预测信息「病毒性」的参数。他们研究的基础是「结构多样性」(structural diversity),指的是某一个人所涉入的社交语境的数量,通常可以表示为周边区域内独立社区的数量。经测试,这套方法的准确性达到0.69。)
3)理解恐怖分子的网络及其结构,有助于制定更好的目标打击计划,最近这方面的研究也有很多。我之前在这个主题上也有一些研究(http://arxiv.org/abs/1211.0709)。(记者注解:关于这项研究:为了瓦解恐怖组织和反叛网络,国家安全机构通常倾向于定点打击「高价值目标」(HVT),也就是他们的首领。然而,有无数的例子证明,首领被击毙后,反叛网络很快就会再生成一位新的首领。例如,2006年6月8日,臭名昭著的基地组织首领阿布·穆萨布·扎卡维被击毙后,一星期之后就出现了一位新首领阿布·艾尤卜·穆哈吉尔。如何瓦解这种首领的再生成机制呢?Shakarain引入了一个概念叫做「塑造」(shaping)行动,意思是说,在打击首领之前,先打击用算法识别出来的社交网络节点,也就是小首领,瓦解该组织产生新领导的能力,然后再击毙首领。这样,恐怖网络就很难再生成一位新首领,也就很难东山再起。下文有更多介绍。)
人工智能最重要的优势在于,我们能对恐怖分子、犯罪分子和极端分子建立更好的模型,采用的方式比人类在纸上的演算更加复杂和精巧,也更加有效。比如说,我曾经和执法机关的人一起工作,他们真的会花几个星期的时间来画一张包含几十个犯罪分子的社交网络,从中来理解他们的组织结构——而我们的软件能处理几百万人的社交网络,并且只用花几分钟。
记者:能否向中国读者简单介绍一下您的研究?您在研究中都用到了哪些人工智能的技术?
Shakarian教授:现在,我是亚利桑那州立大学「网络-社会智能系统实验室(Cyber-Socio Intelligent Systems (CySIS) Laboratory)」的主任。我们用到了许多不同的人工智能技术,包括数据挖掘、社交网络分析、机器学习以及逻辑学,旨在开发软件系统以解决安全相关领域的问题。我们的研究已经被用来支持军队、执法机关和网络安全的工作。我们的目标是理解那些能用先进的人工智能技术解决的安全问题。我们的理念是基于「使用启发」(use inspired)来研究,也就是说,我们的研究受到实际应用的影响很大。比如说,在与芝加哥警方合作的项目中,我们学到了很多东西,例如警察如何处理帮派暴力,以及他们最大的挑战是什么。这将直接影响我们实验室中的研究方向,让我们更加专注于实际应用所面临的挑战。
记者:在您的论文《挖掘因果关系:对ISIS的数据驱动研究》中,您分析了2200个事件,找到了其中一些看似毫无关联的事情之间的联系。在这个研究中,您用了什么人工智能的方法?下一步计划是什么?
Shakarian教授:《挖掘因果关系:对ISIS的数据驱动研究》(Mining for Causal Relationships: A Data-Driven Study of the Islamic State)这篇论文最直观的结果是,我们超越了相关性,检验了基于因果的时态关系。为什么我们需要超越相关性呢?因为,如果你拥有大量的信息(也就是「大数据」),你可能会遇到把巧合当成相关性的风险。例如,有人发现美国迈阿密州的离婚率与人造黄油的人均消耗量相关(http://tylervigen.com/spurious-correlations)。然而,这两件事之间显然没有任何关系——但是,如果我们事先并不知道黄油与离婚无关,我们怎样做出判断呢?解决这个问题的其中一个方法(多亏了那个例子)就是找到其他可能的原因,并进行比较。在离婚-黄油的例子中,我们可以先假设黄油真的导致了离婚,然后把它与其他看起来也相关的变量(例如人均收入)进行比较。我们就是用这样的方法对ISIS进行研究,这样,我们发现的因果关系就更加可信。
(记者注解:这篇论文中,他们分析了战争研究所提供的2200个ISIS相关事件的数据,构建了一个模拟ISIS行为的算法。这2200个事件发生于2014年下半年,既包括了围绕ISIS的军事行动,也包括反对ISIS的势力(包括伊拉克、叙利亚和美国领导的联盟)。在其中,他们将逻辑程序和因果推理相结合,试图挖掘出事件之间的因果关系。由此得出了ISIS的一些规律:
如果在某个星期,ISIS在伊拉克采取了步兵行动并伴有间接射击,那么,下一个星期在叙利亚就会出现车载简易爆炸装置(VBIED)的行动。(p=1.0,εavg=0.92)
如果在某个星期,ISIS在伊拉克提克里特市采取了行动,并进行了大规模的处决,那么随后,伊拉克和叙利亚就会同时出现大量简易爆炸装置(IED)。(p=1.0,εavg=0.97)
叙利亚政府空袭之后的一个星期内,ISIS往往会扣留大量人质(εavg=0.91,p=0.67)。并且,在他们的数据库中,类似的大规模扣留总是发生在叙利亚空袭之后。
如果联军空袭伊拉克摩苏尔市的同时,ISIS正在对安巴尔省采取行动,那么在空袭后的一个星期内,ISIS在伊拉克的简易爆炸装置行动会大大增加(p=0.67,εavg=0.97)。然而,如果空袭的同时,ISIS还在对叙利亚采取行动,那么,当地简易爆炸装置的使用也会增长(p=0.67,εavg=0.79)。
根据这些行为规律,他们得出了以下一些结论
ISIS可能会在除巴格达以外的其他区域采取大规模步兵行动之前,在巴格拉采取自杀式车载炸弹,来防止伊拉克军队/警察的增强部署。
ISIS倾向于在大规模步兵行动之前,采取间接射击(IDF)作为前导——更符合传统军事力量,而不是大规模使用IDF来实现骚扰的目的(这在伊拉克自由行动期间的反叛团体中很常见)。
联军空袭与ISIS对简易爆炸装置的使用之间存在着关系,但却没有激发其他更大规模的武器(例如车载炸弹),这可能意味着ISIS在这种行动后,会依赖更加分散和反叛风格的策略。
他们还发现,有两个目标对ISIS似乎有特别高的价值——巴拉德和拜伊吉。拜伊吉拥有一座主要的炼油厂,而巴拉德靠近一座重要的政府军事基地。)
记者:机器学习需要大量的数据来训练。那么在反恐斗争中,如何收集这些数据呢?
Shakarian教授:在许多机器学习的方法中,都需要大量的数据来构建你想分析的实体(如恐怖团伙)的模型。然而,我们希望寻求多种方法,来最大限度地利用我们的数据。例如,我们使用地理社交网络(geographic social network)分析来定位恐怖组织中那些社交关系紧密但地理位置较为分散的团伙(http://arxiv.org/abs/1305.3668)。有时候,在分析恐怖团伙时,理解你所收集的数据的各个方面是非常有用的——尽管有时信息的数量并不大。
记者:你的研究孵化出了一些具有变革潜力的项目,例如SCARE, ORCA, GANG和SNAKE。能否请您介绍一下这些项目,以及它们目前的运作情况?它们能预测人们的行为,从而预防犯罪吗?
Shakarian教授:SCARE是一个设计来帮助定位反叛军武器库的软件。它设计的初衷是让士兵洞察出叛军的武器可能藏在什么地方,从而阻止他们的路边炸弹攻击计划。目前,我们正在使用这个软件及相关的技术来帮助执法机关定位失踪人口——我们希望这个令人兴奋的项目在接下来的几个月里就会有结果。
ORCA和GANG是芝加哥警方使用的软件包,用来分析街头的犯罪帮派。二者的继任者是VPRED(犯罪预测引擎,violence prediction engine ),使用街头帮派的社会结构数据来预测暴力犯罪分子。VPRED在今年夏天举行的顶级数据挖掘会议KDD上公布(PPT:07-vpred_CySISTech_Aug20)。在这里可以得到更多信息:http://arxiv.org/pdf/1508.03965.pdf。
SNAKE是一个执法机关用来监测社交媒体的软件。它更加具有实验性,但是,它的开发过程所带来的经验教训促成了我们现在正在做的一项工作——用社交网络/社交媒体来分析极端团体。最近,我们赢得了著名的美国国防部「密涅瓦」奖,获得了资金来进行这项工作。具体而言,我们正在监测社交媒体上的「病毒传播」(goes viral)——目前我们的进展不错。(记者注解:ISIS为何能从社交媒体上招募如此多的成员?Shakarain教授试图用人工智能技术来破译其中的秘密,理解为何ISIS的招募如何高效。例如,他们发现,在利比亚和埃及的某些地区,刚加入ISIS的年轻男性会在社交媒体上发布大量关于被西方国家剥削的内容,这种行为很可能正是ISIS的一种信息战术。他们正在研究病毒信息是如何从小圈子进入主流范围的,基于此,就能够预测哪些信息具有病毒信息的潜质。)
「塑造恐怖网络」(shaping terror network)是我在西点军校和其他几名同事研究的技术。这个想法的初衷是为了解决定位恐怖团伙头目的问题。具体地说,这些组织本质上富有弹性,容易在短期内产生出新的魅力型领袖。为了解决这个问题,我和西点军校的Devon Callahan、Jeff Nielsen和Tony Johnson研究出了一种理论,称为「塑造」(shaping),旨在影响恐怖分子的社交结构,降低打击头目后的组织弹性。用这个方法,如果你先对恐怖网络进行「塑造」(也就是先打击首领之外的小头目),就减少了潜在首领的数量。在「塑造」后再除去大首领,就可以降低恐怖网络的效率。这个研究引起了美国政府的兴趣——不过我并不知道他们后来有没有真的采取这种方法,因为那是高度机密的事。
记者:最近,随着移动互联网和物联网的飞速发展,我们能收集的数据也越来越多,导致了数据爆炸。大数据对反恐和打击犯罪有何影响?如何使用这些数据?如何保护隐私?
Shakarian教授:这是个很有趣的问题,也是我经常思考的问题。不管从反恐/反犯罪,还是从保护隐私的角度看,社交媒体、物联网等技术带来的挑战都是巨大的。从反恐/反犯罪的方面看,这些新技术能带来更多可收集的数据,但是如果没有处理大数据的方法来进行合宜的分析,这些数据都是无用的。此外,社交媒体等科技也为恐怖分子、极端分子等人提供了一种全新的犯罪方式——如何及时找出其中的重要信息,是一个很大的挑战。在其中,保护隐私也是一个重要的方面,因为犯罪分子、恐怖分子、恶意黑客这样的人会使用计算机平台的开放性来盗窃人们的身份信息、筹集钱财、劫持电脑进行勒索或对人进行敲诈。我相信,许多人都没有意识到,在使用这些新科技的同时,他们的个人信息已经公开到了超乎想象的程度——也让他们更易受到攻击。保护人们的隐私、免受犯罪分子和极端分子的攻击是非常重要的,这需要更好的科技教育。我认为,由于人们的大量个人信息都被暴露在外,因此未来可能会出现一些造成巨大经济损失的恐怖袭击——所以,教育人们保护好自己的个人隐私,是非常重要的事情。
记者:您的研究能被用来预测ISIS未来的行动,保护那些潜在的受害者。那您是否有计划更进一步,防止人们一开始就变成恐怖分子,防止他们加入ISIS呢?
Shakarian教授:是的,我们正在研究如何预防人们加入ISIS——这非常重要。这也是密涅瓦计划的长期目标。目前,我也正在研究一种新理论,来「抑制」(inhibiting)信息在社交媒体上的扩散,并获得了美国空军的资助来完成这项研究。我的中心思想是理解哪些因素能「抑制」社交媒体上的病毒模因(viral meme )。所以,我们希望不久之后能够找到方法来阻止极端宣传的散播——包括招募新成员。(记者注解:Shakarain教授带儿子在凤凰城参观消防博物馆时,了解到消防员会用防火带来阻止火势蔓延,这给了他灵感——或许也可以为社交媒体上的恐怖信息建造一个防火带,避免其变成病毒信息。在社交媒体上,最有可能成为社交媒体防火带的,就是那些与各自的社交网络联系不紧密,或对信息不感兴趣的人,他们会阻止信息的传播。这种思想受到企业和政府的关注。对企业来说,他们希望找到那些阻止广告信息蔓延的人,分析他们的特点并对其采取不同的市场策略。而政府则希望通过这种方法来遏制恐怖意识形态的蔓延。)
记者:你认为未来的恐怖主义和反恐战斗会是怎样的?
Shakarian教授:我认为,未来的恐怖主义最重要的领域是网络空间。一些恐怖团伙已经开始使用黑客技术了,但我认为这只是一个开始。这可能造成巨大的损失,所以这对未来的恐怖组织来说是一个具有吸引力的领域。所以,对反恐来说,网络安全在未来将扮演一个重要的角色。
记者:伊隆·马斯克和斯蒂芬·霍金都认为人工智能对人类非常危险,可能比核武器还要危险,有可能毁灭全人类。您怎么看待这件事呢?
Shakarian教授:人工智能和其他许多科技一样,都有造福人类的潜力,也有可能被坏人利用,对人类造成极坏的影响——但是我并不认为它的破坏力比其他学科(例如物理学、生物学等等)更大。我认为AI之所以被一些人贴上「危险」的标签,是因为近年来的一些进展超出了某些人的想象,尤其是领域外的人。即便如此,这些进展还是应该促使我们思考科学和技术可能带来的长期影响。——不过,我不认为人工智能有什么特别之处。
记者:爱因斯坦曾经说:「和平不能依靠武力维系,唯有理解才能实现。」您认为和平最重要的因素是什么呢?
Shakarian教授:我认为爱因斯坦是对的。理解全世界各地的民族,了解他们的文化和需求,最终将带来一个更加和平的世界。好消息是,在这种理解的过程中,科技将是一个关键的推动者——能让我们更好地彼此理解。