全文翻译

众所周知,人的记忆是靠不住的。即使拥有最突出的面部识别技巧的人,其记忆也是有限的。

量化一个人的记忆能力有多好是十分困难的。例如,没人确切地知道一个人究竟能记住多少张不同的面 孔,但是各类评估倾向于几千张上下————依据一个人可能结识的人数来判断。

而在这方面,机器是没有限制的。(46)如果给一台适宜的电脑植入一个庞大的人脸数据库,它就能够处理 它所看见的东西————然后按照指示识别人脸————其速度和精度都十分出色。这个技能支撑着二十一世纪人脸 识别软件的巨大前景。它也是现代监控系统如此令人惊惧的原因。

问题在于,进行人脸识别时机器也有局限性。而科学家们也是刚刚开始认识到这些局限是什么。(47)为 了弄清楚电脑的困难所在,华盛顿大学的研究人员创建了一个庞大的人脸数据库————他们称之为“巨型面”———— 并随着复杂性的遂步加大,测试各类人脸识别算法。研究的思路是在一个囊括了将近70万个不同的人的100万 张不同图像的数据库上测试机器————而不仅仅像其他研究所做的那样,采用一个涉及相对较少的不同人脸的庞大 数据库。

(48)随着数据库的增大,机器的精确度全面下降。例如,在处理含有13,000张图像的数据库时,算法的精 确度达到95%,但在面对100万张图像时精度下滑至70%左右。而这还算不错的,研究人员艾拉·凯麦尔玛 彻希尔泽说。“这比我们预期的要好多了,”她说。

(49)机器在辨别相似度较高的人时也有困难————机器难以将长相极相似的人分辨为两个不同的人,或者 对出现在不同照片中,年龄或者光线条件不同的同一个人,机器可能会误认为是两个不同的人。

“一旦我们将数据库扩展,算法就必须对身份的微小变化十分敏感,同时也不受光线条件、姿势和年龄的影 响,”凯麦尔玛彻希尔泽受说。

(50-1)问题在于,对许多想要设计系统来处理这些挑战的研究人员而言,并不存在实验所雪的庞大数 库—一至少,学术研究人员拿不到造当形式的数播。而像谷歌和脸书拥有的那些训练集是私有的。(502)尚不 存在包括数百万人脸的公共数揭库。“巨型面”的创建者说,它是目前最大的公共人脸识别数据集了 个终极的人脸识别算法应该可以识别数据集中数以十亿计的人,”研究人员写道

高频词汇及短语

notoriously 众所周知地;声名狼藉地

consistent with 与......一致

acquaintance 熟人

dip across the board 全面下降

adjust 调整;适应

massive 大量的;巨大的

accessible 易得到的;易使用的

precision 精度;精确

ultimate 最终的,终极的

scale up 增加,扩大

详解详析

46.A)。

【定位】 由题干中的human memory和machines定位到文章第三段第二句:Give the right computer a massive database of faces, and it can process what it sees—then recognize a face it’s told to find—with remarkable speed and precision.

【详解】 事实细节题。文章前两段指出人类的记忆是十分有限的,一个人最多大约可以记住几千张面孔。第三段第一句指出,在这方面,机器是没有限制的。接着定位句更明确地说到,如果给一台适宜的电脑植入一个庞大的人脸数据库,它就能以出色的精度和速度识别人脸。由此可知,机器在人脸识别方面比人类更有效,故答案为A)。


47.C)。

【定位】 由题干中的专有名词MegaFace定位到文章第四段第三句:To begin to figure out how computers are struggling, researchers at the University of Washington created a massive database of faces—they call it MegaFace—and tested a variety of facial-recognition algorithms (算法) as they scaled up in complexity.

【详解】 事实细节题。根据定位句可知,华盛顿大学的研究人员创建庞大的人脸数据库“巨型面”的目的是为了弄清楚电脑在人脸识别方面所面临的困难,选项C)的表述与定位句一致,故答案为C)。


48.D)。

【定位】 由题干中的machine accuracy定位到文章第五段第一句:As the databases grew, machine accuracy dipped across the board.

【详解】 事实细节题。定位句指出,随着数据库的增大,机器的精确度全面下降。选项D)的表述与定位句相同,故答案为D)。


49.A)。

【定位】 由题干中的a shortcoming of facial-recognition machines定位到文章第六段:Machines also had difficulty adjusting for people who look a lot alike—either doppelgangers (长相极相似的人), whom the machine would have trouble identifying as two separate people, or the same person who appeared in different photos at different ages or in different lighting, whom the machine would incorrectly view as separate people.

【详解】 推理判断题。定位句前半部分指出,机器在辨别相似度较高的人时也有困难,会难以区分两个长像极为相似的人。A)“它们无法轻易地分辨外貌几乎一样的人”符合原文,故答案为A)。


50.B)。

【定位】 由题干中的the difficulty定位到文章倒数第二段第一句:The trouble is, for many of the researchers who’d like to design systems to address these challenges, massive datasets for experimentation just don’t exist…和第三句:There are no public databases that contain millions of faces.

【详解】 事实细节题。文章倒数第二段第一句提到,问题在于,对许多想要设计系统来处理这些挑战的研究人员而言,并不存在实验所需的庞大数据库——至少,学术研究人员拿不到适当形式的数据。接着第三句提到,尚不存在包括数百万人脸的公共数据库。由此可知,研究人员最大的困难和问题就是他们没有充足的公共数据样本,故答案为B)。