审视人脸识别:一种AI技术的全球性滥用( 三 )


抵制人脸识别的关键词之二:
隐私
除了放大人类现有社会系统的偏见 , 对侵犯个人隐私的担忧 , 形成另一股强大的反对声浪 , 矛头直指大型科技公司 。
众所周知 , 一个人脸识别系统要发挥作用 , 还需要通过大型图像数据集进行训练和测试 。 理想情况下 , 需要在不同的光照条件下和不同的角度多次捕获人脸图像 。 没有大量数据的情况下训练人脸识别算法的普适方法 , 仍未出现 。
那么 , 这些数据从哪来?
1990 年代和 2000 年代 , 科学家们收集研究所需的数据一般会通过招募志愿者的方式 。 但现在 , 这个光荣传统几乎退出历史主舞台了 , 大多数机构未经许可就进行人脸数据采集 。
2015 年 , 斯坦福大学的科学家基于旧金山一家咖啡馆的网络摄像头 , 发布了一组 12000 张图像集 。 第二年 , 杜克大学的研究人员发布了超过 200 万个视频帧(85 分钟) , 记录了在大学校园中行走的学生的镜头 。
2016 年 , 雷德蒙德微软研究院发布了世界上最大的公众人物数据集 MS Celeb , 包含从互联网上搜刮的近 100000 个人的 1000 万张图像 , 其中包括采访人员、音乐家和学者 。
微软是通过知识共享许可协议(Creative Commons license)抓取和收录这些照片的 。 按照知识共享许可协议 , 照片的版权所有者许可后 , 微软可以将照片用于学术研究 。 微软自己也声称 , MS Celeb 的发布旨在促进学术研究 , 鼓励研究人员开发最好的人脸识别技术 。
版权所有者许可 , 并不等同于照片中的被拍摄者许可 。 人脸照片属于生物识别数据 , 按照欧盟 GDPR 的规定 , 处理此类数据须征得当事人的明确同意 。 不仅如此 , MS Celeb 发布之后 , 有研究人员发现 , 其所收录的已不仅仅是名人照片 , 还有一些普通人的照片 。 《金融时报》曝光称 , 信息安全采访人员 Kim Zetter、技术作家 Adam Greenfield、负责消费者隐私保护事务的原美国联邦贸易委员会专员 Julie Brill 等人都在其中 。
这些人完全没有意识到自己的人脸照片被收录到了这些数据集中 。 这就像是 , 你永远都不知道 , 你在何时何地 , 在经过哪一个摄像头的时候 , 成为了某个训练数据集一部分 。
“我并不是公众人物 , 没有任何道理放弃自己的隐私权 。 ”Adam Greenfield 声讨道 。
微软回应 , MS Celeb 仅被用于学术用途 。 但公开资料显示 , 多家公司使用过 MS Celeb 进行算法训练 , 如英伟达、IBM、松下、日立等 。 在那次风波中 , 微软表示已经删除 MS Celeb , 但 Adam Harvey 指出 , 这些数据并不会完全消失 。 他说 , 一旦数据被发布、被下载 , 它就存在于全世界的硬盘上 , 微软根本无法阻止人们根据自己的目的发布和使用数据 。
现在 , 美国的一些州已经确定 , 商业公司未经其同意使用人脸这样的个人生物识别数据是非法的 。 伊利诺伊州还允许个人对此提起诉讼 。
例如 Fcebook 就已同意支付 6.5 亿美元 , 以解决伊利诺伊州集体诉讼案 , 该诉讼案涉及一系列被用于人脸识别的非公开照片 。 总部位于纽约 Clearview AI(传该公司的人脸系统已经抓取到 30 亿张在线照片 , 并为警方和富豪提供定制服务) , 也正在面临人脸数据违规采集和使用的集体诉讼 。
【审视人脸识别:一种AI技术的全球性滥用】“我不担心政府 , 我担心谷歌和脸书” 。 北卡罗莱纳州威尔明顿大学的教授 Karl Ricanek 曾如此说道 。
“我认为 , 他们比政府拥有更多的公民信息 , 而且我们无法动摇这些公司的领导地位 。 我认为我们的政府至少还有着良好的使命 。 从学术角度来看 , 我们正在努力解决一些问题以让世界变得更好 , 而不是大多数人想着赚钱 。 ”

推荐阅读