NIST 的数据库显示 , 被归类为非裔美国人或亚洲人的面孔 , 比被归类为白人的面孔被算法误认的可能性高 10-100 倍 。 与男性相比 , 女性被误判的概率会更高 。
NIST 科学家 Watson 说 , 这种不准确性很可能反映了每家公司训练数据库的组成不平衡 。 数据科学家通常将这种不平衡描述为 “垃圾进 , 垃圾出” 。
因此 , 大量要求暂停或禁止人脸识别软件的呼吁 , 都会频繁经常提到对人口统计学偏见的担忧 。
甚至在今年 6 月 , 全球最大的计算机科学学术共同体 ACM 也发表声明 , 敦促私人和政府停止使用人脸识别技术 , 因为 “基于种族 , 种族 , 性别和其他人类的明显偏见特征” , 将损害特定人口群体的个人权利 。
抵制人脸识别的关键词之二:
隐私
除了放大人类现有社会系统的偏见 , 对侵犯个人隐私的担忧 , 形成另一股强大的反对声浪 , 矛头直指大型科技公司 。
众所周知 , 一个人脸识别系统要发挥作用 , 还需要通过大型图像数据集进行训练和测试 。 理想情况下 , 需要在不同的光照条件下和不同的角度多次捕获人脸图像 。 没有大量数据的情况下训练人脸识别算法的普适方法 , 仍未出现 。
那么 , 这些数据从哪来?
1990 年代和 2000 年代 , 科学家们收集研究所需的数据一般会通过招募志愿者的方式 。 但现在 , 这个光荣传统几乎退出历史主舞台了 , 大多数机构未经许可就进行人脸数据采集 。
2015 年 , 斯坦福大学的科学家基于旧金山一家咖啡馆的网络摄像头 , 发布了一组 12000 张图像集 。 第二年 , 杜克大学的研究人员发布了超过 200 万个视频帧(85 分钟) , 记录了在大学校园中行走的学生的镜头 。
2016 年 , 雷德蒙德微软研究院发布了世界上最大的公众人物数据集 MS Celeb , 包含从互联网上搜刮的近 100000 个人的 1000 万张图像 , 其中包括采访人员、音乐家和学者 。
微软是通过知识共享许可协议(Creative Commons license)抓取和收录这些照片的 。 按照知识共享许可协议 , 照片的版权所有者许可后 , 微软可以将照片用于学术研究 。 微软自己也声称 , MS Celeb 的发布旨在促进学术研究 , 鼓励研究人员开发最好的人脸识别技术 。
版权所有者许可 , 并不等同于照片中的被拍摄者许可 。 人脸照片属于生物识别数据 , 按照欧盟 GDPR 的规定 , 处理此类数据须征得当事人的明确同意 。 不仅如此 , MS Celeb 发布之后 , 有研究人员发现 , 其所收录的已不仅仅是名人照片 , 还有一些普通人的照片 。 《金融时报》曝光称 , 信息安全采访人员 Kim Zetter、技术作家 Adam Greenfield、负责消费者隐私保护事务的原美国联邦贸易委员会专员 Julie Brill 等人都在其中 。
这些人完全没有意识到自己的人脸照片被收录到了这些数据集中 。 这就像是 , 你永远都不知道 , 你在何时何地 , 在经过哪一个摄像头的时候 , 成为了某个训练数据集一部分 。
“我并不是公众人物 , 没有任何道理放弃自己的隐私权 。 ”Adam Greenfield 声讨道 。
微软回应 , MS Celeb 仅被用于学术用途 。 但公开资料显示 , 多家公司使用过 MS Celeb 进行算法训练 , 如英伟达、IBM、松下、日立等 。 在那次风波中 , 微软表示已经删除 MS Celeb , 但 Adam Harvey 指出 , 这些数据并不会完全消失 。 他说 , 一旦数据被发布、被下载 , 它就存在于全世界的硬盘上 , 微软根本无法阻止人们根据自己的目的发布和使用数据 。
推荐阅读
- 删除账单要人脸识别怎么解除
- 怎么识别萨摩耶
- 人脸识别引发道德伦理担忧!你的脸被监视了吗?
- 微信人脸支付怎么设置
- 扩容盘恢复真实内存 怎么样识别扩容卡
- 人脸识别,边界何在?
- 如何识别优质的基金
- AI又当医生了,这次是通过血液识别癌症
- win7电脑无法识别usb设备
- Win11面部识别设置不了怎么办 Win11激活面部识别功能