ZKX's LAB

Facebook正在用AI模拟用户的不良行为

2020-07-27新闻17

据外媒The Verge报道,Facebook的工程师们开发了一种新方法,帮助他们识别和防止有害行为,比如用户传播垃圾邮件、诈骗他人或买卖武器和毒品。他们现在可以使用人工智能驱动的机器人来模拟不良行为者的行为,让它们在平行版本的Facebook上自由活动。然后,研究人员可以在模拟中研究机器人的行为,并试验阻止它们的新方法。

Facebook正在用AI模拟用户的不良行为

这个模拟器被称为WW,发音为 "Dub Dub",是基于Facebook的真实代码库。该公司在今年早些时候发表了一篇关于WW的论文(之所以这么叫,是因为这个模拟器是WWW(万维网)的删减版),但在最近的一次圆桌会议上分享了更多关于这项工作的信息。

这项研究由Facebook工程师Mark Harman和该公司位于伦敦的人工智能部门研究人员领导。Harman对记者说,WW是一个非常灵活的工具,可以用来限制网站上的各种有害行为,他还举了一个例子,即利用模拟开发新的防御措施来对付骗子。

在现实生活中,骗子通常会从徘徊在用户的好友群中寻找潜在的目标开始工作。为了在WW中模拟这种行为,Facebook的工程师们创建了一组 "无辜 "的机器人作为目标,并训练了一些 "坏 "机器人,这些机器人在网络中探索,试图找到他们。然后,工程师们尝试了不同的方法来阻止"坏 "机器人,引入了各种限制条件,比如限制机器人每分钟可以发送的私信和帖子数量,看看这对它们的行为有什么影响。

Harman将这项工作与城市规划者试图减少繁忙道路上超速行驶的工作进行了比较。在这种情况下,工程师在模拟器中模拟交通流量,然后试验在某些街道上引入减速带等东西,看看它们有什么效果。WW模拟让Facebook可以做同样的事情,但对象是Facebook用户。

“我们将‘减速带’应用于我们的机器人所能执行的动作和观察,并如此快速地探索我们可能对产品做出的改变,以抑制有害行为,而不伤害正常行为,”Harman说。“我们可以将这个规模扩大到数万或数十万个机器人,因此,并行地搜索许多许多不同的可能...约束向量。”

模拟想要研究的行为是机器学习中足够常见的做法,但WW项目之所以引人注目,是因为该模拟是基于真实版本的Facebook。Facebook将其方法称为 “基于网络的模拟”。“与传统的模拟中所有的东西都是模拟出来的不同,在基于网络的模拟中,行动和观察实际上是通过真实的基础设施发生的,因此它们更加真实。”Harman说。

不过他强调,尽管使用了这种真实的基础设施,但机器人无法与用户进行任何方式的互动。他说:“它们实际上无法通过结构,与其他机器人以外的任何东西进行互动。”

值得注意的是,这个模拟并不是Facebook的视觉拷贝。不要想象科学家们研究机器人的行为,就像你在Facebook群里看人与人之间的互动一样。WW并没有通过Facebook的GUI产生结果,而是将所有的互动记录为数字数据。

现在,WWW还处于研究阶段,该公司用机器人进行的模拟试验都没有给Facebook带来现实生活中的变化。Harman表示,他的小组仍在进行测试,以检查模拟与现实生活中的行为是否有足够高的保真度来证明现实生活中的变化。但他认为这项工作将在今年年底前对Facebook的代码进行修改。

当然,模拟器也有局限性。例如,WW无法模拟用户意图,也无法模拟复杂的行为。Facebook表示,机器人会搜索、提出好友请求、留下评论、发帖和发送信息,但这些行为的实际内容(比如,对话内容)并没有被模拟出来。

不过Harman表示,WW的强大之处在于它能够进行大规模的操作。它可以让Facebook运行数千次模拟来检查网站的各种细微变化,而不影响用户,并从中发现新的行为模式。他表示:“我认为,大数据带来的统计能力仍未被充分认识。”

这项工作比较激动人心的一个方面是,WW有可能通过机器人的行动发现Facebook架构中的新弱点。机器人可以通过各种方式进行训练。有时会给它们明确的指令,告诉它们如何行动;有时会要求它们模仿现实生活中的行为;有时只是给它们一定的目标,让它们自己决定行动。正是在后一种情况下(一种被称为无监督机器学习的方法),可能会出现意想不到的行为,因为机器人找到了工程师没有预测到的达到目标的方法。

“目前,主要关注的是训练机器人模仿我们知道的平台上发生的事情。但无论在理论上还是在实践中,机器人都可以做一些我们以前没有见过的事情。”Harman说。“这其实是我们想要的东西,因为我们最终是想走在不良行为的前面,而不是不断地追赶。”

哈曼表示,该团队已经看到了机器人的一些意想不到的行为,但拒绝分享任何细节。他表示,他不想给诈骗者提供任何线索。

#Facebook#智能机器人

随机阅读

qrcode
访问手机版