众所周知,人的记忆是靠不住的。即使拥有最突出的面部识别技巧的人,其记忆也是有限的。
量化一个人的记忆能力有多好是十分困难的。例如,没人确切地知道一个人究竟能记住多少张不同的面 孔,但是各类评估倾向于几千张上下————依据一个人可能结识的人数来判断。
而在这方面,机器是没有限制的。(46)如果给一台适宜的电脑植入一个庞大的人脸数据库,它就能够处理 它所看见的东西————然后按照指示识别人脸————其速度和精度都十分出色。这个技能支撑着二十一世纪人脸 识别软件的巨大前景。它也是现代监控系统如此令人惊惧的原因。
问题在于,进行人脸识别时机器也有局限性。而科学家们也是刚刚开始认识到这些局限是什么。(47)为 了弄清楚电脑的困难所在,华盛顿大学的研究人员创建了一个庞大的人脸数据库————他们称之为“巨型面”———— 并随着复杂性的遂步加大,测试各类人脸识别算法。研究的思路是在一个囊括了将近70万个不同的人的100万 张不同图像的数据库上测试机器————而不仅仅像其他研究所做的那样,采用一个涉及相对较少的不同人脸的庞大 数据库。
(48)随着数据库的增大,机器的精确度全面下降。例如,在处理含有13,000张图像的数据库时,算法的精 确度达到95%,但在面对100万张图像时精度下滑至70%左右。而这还算不错的,研究人员艾拉·凯麦尔玛 彻希尔泽说。“这比我们预期的要好多了,”她说。
(49)机器在辨别相似度较高的人时也有困难————机器难以将长相极相似的人分辨为两个不同的人,或者 对出现在不同照片中,年龄或者光线条件不同的同一个人,机器可能会误认为是两个不同的人。
“一旦我们将数据库扩展,算法就必须对身份的微小变化十分敏感,同时也不受光线条件、姿势和年龄的影 响,”凯麦尔玛彻希尔泽受说。
(50-1)问题在于,对许多想要设计系统来处理这些挑战的研究人员而言,并不存在实验所雪的庞大数 库—一至少,学术研究人员拿不到造当形式的数播。而像谷歌和脸书拥有的那些训练集是私有的。(502)尚不 存在包括数百万人脸的公共数揭库。“巨型面”的创建者说,它是目前最大的公共人脸识别数据集了 个终极的人脸识别算法应该可以识别数据集中数以十亿计的人,”研究人员写道