暗网世界，黑客可能用AI再造了一个“你”

大数据文摘出品

编辑：曹培信、张强

今年2月，卡巴斯基实验室的欺诈侦查小组捣毁了一个名为“创世纪”(Genesis)的暗网市场。该市场出售“数字身份”（互联网用户的电子身份信息），每条信息起价5美元，最高可达200美元。

出价取决于所购买信息的价值——例如，一个包含用户银行登录信息完整配置文件的数字掩码，会比一个浏览器指纹的价格要高的多。

*数字掩码是指用户设备指纹(设备ID、硬件、操作系统、IP地址、屏幕分辨率、固件版本、浏览器、浏览器插件、时区、GPU信息、WebRTCIPs、Tcp/IP指纹、cookie等)及其个人行为属性(在特定网上商店花费的时间、与兴趣相关的行为、鼠标/触摸屏行为等)的唯一组合。

黑客们通常会用恶意软件攻击他人电脑，并且找到并复制这些个人数据以及其他个人身份识别信息。

用AI在暗网再造一个“你”

“在这一点上，黑客们已经能够收集、管理和维护他们所侵入的用户的大量数据，”一家基于机器学习的技术公司的产品经理ImranMalek说，“这意味着，如果你的笔记本电脑被黑客入侵，黑客的战利品不一定是被入侵的电脑，而是你电脑上的所有数据，包括所有的身份识别信息。”

有了这些信息，通过特定浏览器和代理服务器来模仿真实用户的活动。再加上盗取的互联网用户的帐户信息，攻击者就可以自由地以该用户的名义进行新的、可信的交易——包括使用信用卡消费。

卡巴斯基实验室(KasperskyLab)全球研究与分析团队(Global Research&Analysis Team)高级安全研究员SergeyLozhkin表示:“我们看到了一个明显的趋势，全球范围内的信用卡欺诈行为日益增多，尽管该行业在反欺诈措施方面投入了大量资金，但这种数字孪生（Digital Twins）很难被发现。”

图片来自Kaspersky Lab

用AI对抗AI

在打击“暗网”犯罪的过程中，人工智能正成为一把利器。

MIT在今年5月13日的一篇文章指出，暗网犯罪有一些特点可以被追踪。

消失速度极快是“暗网”犯罪的一大特征，因为它们可能遭到其他黑客攻击、安全部门突击搜查，或者本身就是被设计成一个“退出骗局”——顾客为未完成的订单付费后，该网站会故意关闭。

林肯实验室(MIT Lincoln Laboratory)人工智能技术与系统集团(Artificial Intelligence Technology and Systems Group)研究员CharlieDagli就表示：“暗网交易市场的‘弹出式’特性使得跟踪参与者及其活动变得极其困难。”

图片来自mit.edu

卖家和买家在网络的多个层面(从表面到黑暗)以及在黑暗网络论坛上进行联系。“这种网站之间的不断切换现在已经成为暗网市场运作方式的既定组成部分。”Dagli说。针对这一情况，林肯实验室正在开发新的人工智能软件工具来分析表面和暗网数据，他们训练机器学习算法来计算不同论坛上用户之间的相似度，自动形成人物角色链接。

该算法首先从一个论坛a的用户那里获取数据，并为每个用户创建一个著作权模型。然后，将论坛b上用户的数据与论坛a上的所有用户模型进行对比，该算法寻找简单的线索，比如在两个论坛中一个叫“sergeygork”，另一个叫“sergeygorkin”，或者把“joenightmare”拼写为“joeknight”等等。

算法关注的另一个特性是内容相似性。

“因为很多内容都是复制粘贴的，所以类似的话可能会来自同一个用户，”Dagli说。然后，系统查找用户网络中的相似点，即用户交叉的区域，以及用户讨论的主题。然后将配置文件、内容和网络特性融合为一个输出：两个论坛中的两个人物角色代表同一个现实生活中的人物的概率，这个匹配正确率高达95%。

这个项目在实际应用中取得了很好的效果，林肯实验室参与开发了美国国防部高级研究计划局(DARPA)的Memex，曼哈顿地区检察官Cyrus Vance jr.在一份提交给美国众议院的书面证词中称，仅在2017年，他的办公室就使用Memex工具搜索出超过6000名人口贩卖嫌疑人。

Memex

黑客利用机器学习进行对抗性训练

安全部门及相关公司利用机器学习打击“暗网”犯罪的同时，黑客也开始利用机器学习进行对抗和犯罪。

比如上文中提及的“创世纪”，黑客利用“数字孪生”作为数字面具模仿真实的用户，并选择网络安全技术来通过欺诈检测协议。“如果一边是机器学习，那么另一边也是机器学习，”Malek说，“现在，黑客和坏蛋们正在实施他们自己的方案，作为一种对抗性的机器学习训练。”

另外，早在2017年的DEFCON大会上，安全公司Endgame也披露了OpenAI框架可以被用来定制恶意软件，用以创建安全引擎无法检测到的恶意软件。其原理是自动改变一部分被认为是恶意的二进制文件，使其在杀毒软件中看起来是值得信赖的。

同样还有网络犯罪自动化（Cyber crime Automation），有一种叫做Hivenet的智能僵尸网络。他们就像寄生虫一样潜伏在人们的设备中，自动决定谁是下一个使用受害者资源的人。

而这类似于这种恶意欺诈和攻击的软件，多数是在暗网中发布的。根据英国虚拟专用网络（VPN）比较服务发布的暗网价格指数，从用于攻击知名品牌的即时钓鱼网页到密码破解工具、WiFi网络黑客程序，以及各种功能的黑客工具，有一些只需要2美元就可以买到，其中就包括一些用人工智能生成的定制恶意软件。

结语

人工智能作为一项技术本无善恶之分，但是正如互联网除了我们日常可以接触到的表面，还存在一个“暗网”一样，人工智能也可能被心怀不轨的人利用，作为一个犯罪工具。

而对于AI从业者来说，也许以后在进行开发时，不仅需要考虑技术本身，还需要评估是否存在随之而来的负效应，以决定这项成果是否适合发布或者开源。