二十三岁中国小伙发明AI对抗系统

来源 :海外星云 | 被引量 : 0次 | 上传用户:troy003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
《纽约时报》报道称Fawkes 可以避免ClearviewAI 滥用用户照片做人脸识别

  近日,23 岁的北京小伙单思雄,联合几位同学开发出一款 AI 对抗学习系统——Fawkes。这位即将在芝加哥大学攻读直博的九五后表示,Fawkes 开源一月以来,已在 GitHub 上获得10多万次下载量、以及 2600 多颗加星认可。
  目前,单思雄以第一作者身份撰写的 Fawkes 的研究论文《福克斯:保护隐私免受未经授权的深度学习模型的侵害》已经被安全顶会 Usenix Security 2020 录取。他表示, Fawkes 诞生于此时,有着很大的时间窗口意义。
  2020 年初,一家名为 Clearview AI 的公司,非法抓取 Google、Twitter、Facebook 和 YouTube 上的人脸照片,创建超 30 亿张照片的面部识别数据库,并通过出售算法牟利。丑闻曝光后,舆论哗然,该公司也成为众矢之的。
  事实上,不管在国内还是国外,你的照片都有可能被扒下来当作“小白鼠”,去训练机器学习模型。为解决上述痛点,在芝加哥大学 SAND 实验室两位华人导师赵燕斌和郑海涛的指导下,单思雄和其他三位同学,一起开发出 Fawkes。该命名也是对黑客团体“匿名者”广受欢迎的盖伊 · 福克斯面具的致敬。
  以单思雄的照片为例,Fawkes 的价值在于可以让用户修改照片,这种修改并不是美图软件的 “换头式” 修改,而是肉眼看起来和原图一模一样,但人脸识别系统却能识别这种细微差别。
Fawkes 修改后的英国女王前后对比图

  再以英国女王的照片为例,左图为原图,右图为 Fawkes 修改后的照片,肉眼几乎看不出区别,但这种区别却可以被机器识别。
  那么,以后你再往朋友圈发照片,就可以用 Fawkes 修改过的照片,不仅看起来和真人毫无区别,而且还更安全。因为被 Fawkes 修改过的照片,即便被人扒走去做模型,实际上也并非真正意义上的你的照片。对于机器来说,那只是一张和你长得很相似、但其实并不存在的人。
  该论文表示,在旷视 Face 、微软 Azure Face、亚马逊 Rekognition 等面部识别服务上,Fawkes 取得了“100% 的成功”。
  单思雄表示,机器学习早已变得炙手可热,大家只要有台电脑,会一点 GPU,会一点代码,就可以建一个机器学习模型。
  越来越方便的同时,也会给用户安全带来巨大威胁。而 Fawkes 的意义在于,它是反着来,即让机器学习模型变得不准确,这样就不能识别出用户的脸。

改几个像素,即可让照片“判若两人”


  Fawkes 使用到的主要技术是对抗学习,即在图片上加一些很小的噪音,这里的加噪音指的是修改像素。
  在实验上,单思雄主要是在电脑上跑代码,编程主要使用 Python 语言,以及深度学习框架 TensorFlow;数据集主要是图片,此外还有 GPU 等硬件。
  在分工上,单思雄和四位作者每人做一块实验,比如他去跑亚马逊的 API,其他人去跑微软或者旷世的 API。
  跑完代码,单思雄又对亚马逊、微软和旷识的人脸识别系统做测试。测试显示,上述系统均无法识别出用 Fawkes 修改后的照片到底是谁,这意味着 Fawkes 成功诞生。
  这里举例解释一下 API,如果一家公司想给大门装上人脸识别系统,并且找到亚马逊来做这件事,那么该公司就会把员工照片给亚马逊,后者会帮该公司建一个模型,建好后模型就能在公司大门口做人脸识别。
  而单思雄团队也用了一个和人脸识别大门相似的系统去存放各种图片,假如你的照片是被 Fawkes 保护的,并且没有被人脸识别系统识别出来,就等于保护成功。

对抗 AI 的过分灵敏


  Fawkes 开源之后,部分网友表示难以相信。怎么可能只改几个像素,就完全让一个人脸识别系统无法识别?其实这里面涉及到的正是对抗学习,之前业界已经有很多研究。
  大家都知道 AI 可以变得更智慧,但智慧的事物没有遇上好心肠的人,反而会伤害用户。而 Fawkes 所做的事情,正是要对抗这种可能存在的伤害,即跟 AI 系统的过分灵敏做对抗。
  具體来说,Fawkes 只是把左图变成右图的一个工具。你有一个 A 图,Fawkes 就可以算出 B 图,尽管 A 图和 B 图的差别非常细微,但是当前厂商的人脸识别系统,会认为 A 图和 B 图不是同一个人,这样就可以保护用户隐私。
  本次研究的优点在于,之前的对抗学习研究,只对一个特定人脸识别有用,而 Fawkes 对几乎所有的人脸识别系统都管用。

如何理解加噪音后,动物从 A 变成 B?


  如下图所示,尽管 Fawkes 修改像素后,可以让人脸识别系统,把熊猫识别为长臂猿。但是相比人眼感知仍有一定举例,也就是在人眼看来,下面的前后对比图似乎没有改变,这是因为 Fawkes 的噪音,对人眼视觉的影响很小,但是对机器模型的影响很大。
本次论文的四位作者和两位导师,左上为单思雄
  Fawkes 增加噪音的方法,是稍微修改图片像素,比如把照片上眼睛部位的像素调低一些,具体调整多少,是根据算法算出来的。最终实现的效果是,仅仅修改一小部分像素,就能给模型带来影响。
  该团队还使用演员帕特里克 · 登普西的脸部照片作为对象,细微改变了女演员格温妮丝 · 帕特洛的图像,这阻止了人脸识别来识别隐身图像中的格温妮丝 · 帕特洛的可能。

Clearview AI 首席执行官已回应 Fawkes


  Fawkes 的使用并不复杂,当你想在微信朋友圈发照片时,把原图在 Fawkes 上跑一下,让其修改几个像素后再发到网上,这样别人就不能用你的图片去训练模型。
  在应用方面,Fawkes 团队也坦诚,要使该软件真正发挥作用,就必须更广泛地发布。出于安全考虑,他们并不打算为 Fawkes 开发网站或 App,但他们希望像 Facebook 这样的公司,可以将类似技术集成自家平台,从而更好保护用户的使用安全。目前,Fawkes 团队已经收到个别公司的合作意向。
修改像素后的熊猫会被识别为长臂猿

  该项目立项之时,正好是 2020 年初,当时 Clearview AI 的丑事被媒体曝光。用户也开始担忧在网上发照片的危害,而 Fawkes 恰在此时立项,并在半年后做成,正好可以满足用户的刚需。
  不过,Fawkes 也并非绝对完美,它无法对使用未更改图像构建的模型进行任何处理,例如,Clearview AI 等公司和执法机构已经拥有的图像。
  Clearview AI 的首席执行官 Hoan Ton-That 了解该技术后表示:“互联网上有数十亿张未经修改的照片,它们都使用不同的域名。” “实际上,完善 Fawkes 之类的技术并大规模部署它几乎为时已晚。”
  但单思雄的导师赵燕斌回应称:“虽然该公司掌握了大量数据,但是分到每个人的头上,只有几张。大家现在慢慢开始用 Fawkes 之后,保护的照片会远远大于该公司原有的照片,从而导致 Clearview 的识别失灵。”因此,人们可以从现在开始,使用 Fawkes 来保护那些想要上传的个人照片。

23 岁小伙的“AI 之路”


  生于 1997 年的单思雄,今年 23 岁。高中时,他在北京十一中学读书,高三参加美国高考,考入芝加哥大学学习 AI 安全和 AI 隐私。
  他的主要指导老师正是前文的赵燕斌教授和郑海涛教授,两者均为《麻省理工科技评论》 “35 岁以下科技创新 35 人” 榜单(TR35)的上榜者。
  单思雄和兩位导师的结识,开始于大二期间。当时,赵燕斌从加州大学圣塔芭芭拉分校,来到芝加哥大学履新。由于之前就听说过赵燕斌,所以他就主动跟后者联系。在接触中,他发现赵燕斌在教学上很热心,研究过程中遇到问题,可以立马拉上他开会,开完会就立马解决,效率之高令人咂舌。赵燕斌讲解问题也很细致,而且善于启发学生,让学生主动去琢磨。
  未来,单思雄攻读直博期间的导师之一,仍是赵燕斌。截止目前,他在本科期间,累计发表6篇论文。2019年 11 月,他的另一篇对抗学习的论文,已经被 CCS 2020 录用。摆在这位中国小伙面前的,是未知且更有意义的 AI 研究之路。(摘自美《深科技》)(编辑/莱西)
其他文献
2006年5月19日,中国人民大学出版社的七人团队跟随中国国际图书贸易总公司组织的美国书展团,来到了美国首府华盛顿特区,参加2006年美国书展。    一、美国书展概况    美国书展(BookExpo American简称BEA)是全美最大的年度书展,其前身是1947年创办的美国书商协会会议与贸易展销会,即ABA书展,1996年更名为美国书展,由美国书商联合会(ABA)及美国出版商联合会(AAP
卡米拉·卡文迪什  世界人口构成正在发生急剧的变化。据德国一项研究显示,到2020年,全球65岁或以上的人口将首次超过五岁或以下的儿童。  换句话说,世界人口正在迅速老化。  人口老龄化已经成为一个老生常谈的话题。这听起来让人有点沮丧,因为伴随而来的是人口衰老,劳动力人数下降,医疗成本上升,给政府和个人都带来沉重负担。  然而,英国专栏作家和记者卡米拉·卡文迪什女士说,老年并没有人们所想象的那样悲
【编者按】 去年下半年以来,在新闻出版总署领导的大力支持下,本刊负责具体实施“农家书屋”工程书目征集与推荐工作,旨在通过严格的推荐与评选,为“农家书屋”工程建设提供参考书目。在入选书目即将向全社会发布的之时,《“农家书屋”工程实施意见》(简称《意见》)正式印发,再次肯定了推荐书目工作的意义与价值。不仅如此,《意见》的发布,可以看作是新闻出版行业的一件大事,为整个“十一五”时期新闻出版服务社会主义新
想不看奥运很难吧?  下面我们要一本正经地问大家几个奥运相关的问题,看看大家是不是“奥运会老司机”。  1.为什么奥运开幕式入场仪式东道主是最后一个呢?  2.你知道奥运火炬是怎么来的吗?  3.奥运田径赛场跑道为什么一圈是400米?  不知道没关系,我告诉你呀!01 入场顺序  如今,奥运开幕式上各国运动员的入场仪式是吸引全球目光的一大亮点。而早期举办奥运会时,开幕式可不像现在一样是一场文化盛宴
Tessera Therapeutics 正在开发一种新的基因编辑器,能够精确地插入长段DNA,这是CRISPR 做不到的  从1963 年美国分子生物学家、诺贝尔生理学/医学奖获得者乔舒亚·莱德伯格第一次提出“基因交换” 和“基因优化”概念开始,科学界和医学界对通过改变基因来治疗疾病的研究越来越深入。经过长达50多年的研究,基因治疗已经从实验室研究走向了临床应用,以 CRISPR 技术为基础,C
一滴墨水能引发千万人思考,一句格言可改变人一生命运。格言就是这样,它表达一种闪烁着人类智慧火花的思想,常常以一语中的、生动隽永的文字,予人以精神,给人以智慧,说出常人想说却未能说出的话。  格言历来备受人们青睐。格言类书籍一直在畅销着。花钱买格言就是花钱买智慧,这已成为大多数人的共识。人们阅读这些格言,就像是面对一位聪明理性、见多识广的朋友,其思绪之活跃,观察之敏锐,个性之鲜明,令人久而不忘,从而
《地图上的故事》丛书,脱胎于中央电视台大型电视系列片,由《地图上的故事——地域篇》、《地图上的故事——历史篇》、《地图上的故事——知识篇》构成,它以全新的方式将历史与现实相结合,地理与人文相结合,充分展示了中国文化的博大精深以及我国悠久的历史文化。书中配有600余幅地图,每一个故事都是由一张张小小的地图展开的,每一幅地图就是一个小故事,图与故事紧密的联系在一起,极大地丰富了书中的文化内涵,其独特的
随着农村城市化进程,城市里也发生了悄然变化,随着旧城改造和居住区的扩张,成片的住宅楼涌现出来。新的住宅小区成为众多市民的新生活地点。小区的物质生活设施如商场等一般比较完备,但因为图书馆与小区的所有权归属不同,导致图书馆等文化生活设施奇缺,对小区的和谐建设产生一定的影响。随着小区的增加,能否开展住宅小区图书服务和怎样服务也必将成为图书馆一个新的课题,很值得探讨。    1.住宅小区的文化生活特点  
在2000年大选中,佛罗里达州重新计票持续了数周,直到最高法院做出布什获胜的裁决  尽管美国大选计票工作还在进行时,特朗普多次声称选举存在欺诈,但没有提供证据,他说:“我们将诉诸美国最高法院。”  美国历史上唯一一次由美国最高法院裁决的选举是在2000年,当时阿尔·戈尔在法庭上被小布什击败。  将这两次选举作比较很有趣,但可能产生误导。  2000年只在佛罗里达州重新记票,两位候选人的票数相差只有
特朗普在演说期间多次称赞他的政府对美国经济增长的贡献  美国总统特朗普在世界经济论坛发表讲话,期间提及数项他在任期间建设美国经济和保护环境的成就,查证他声称的这些“成就”有没有事实根据。“美国有全球最干净的空气和饮用水之一”  特朗普之前也曾经称赞自己政府改善美国空气和食水品质的努力,但外界留意到他帶领美国退出《巴黎气候协定》等做法,都不利于环境保护。  根据美国耶鲁和哥伦比亚大学的研究,美国的空