全文翻译

数据共享:对开放数据的开放思想

[A](39)这是一项产生持续声势的运动:使研究数据、软件代码和实验方法公开、透明的呼吁。开放的精 神正在科学界获得认可,倡议者说,这是解决科学“危机”的唯一途径,在这个危机中,很少有发现能够被成功复 制。此外,他们说,这也是研究者集合一系列观察结果的最佳方式,而这是加快发现速度或者识别大规模趋势所 必需的。

[B]开放数据的改变给初级研究者造成了一个令人困感的问题。一方面,共享运动正得到官方支持。自 2013年以来,全球科学团体已经开始支持那些能使更多的人使用研究成果的政策。(42)另一方面,科学家对于 他们分享多少数据和何时分享数据持有不同的观点,他们对共享教据到底是会加速科学发展、促进科学繁荣,还 是会带来伤害和问题都各持己见。随着越来越多的期刊和投资者接受共享数据的要求,以及越来越多的科学家 爱好者呼吁更多的开放,初级研究者必须在接受者和那些继续抵制者之间做出选择,即使他们正努力开创自己 的事业。

[C]年轻的科学家面临的一个重大挑战就是如何在开放的同时避免科学上的损害。在与其他对开放科学 持谨慎态度或者不熟悉的人接触时,他们必须确定是否会有危及工作机会或者合作计划的风险。他们也必须学 会如何充分利用这项运动的益处,比如更多引用的机会和无需常规指标就可建立良好的声誉,如在重大影响力 的期刊上发表文章。

[D]一些领域比其他领域更加欢迎开放数据。由于心理学领域的发现不可复制性,所以在过去几年里,它 的期刊上发表文章的地位有所动摇,该领域的研究者强烈支持更加开放的科学这一运动。(38)一些心理学期刊也激励更多的人 对可复杂性科学感兴趣,比如一些文章上贴上“开放数据”的标记,清楚的指明在哪里可以找到数据。布莱 恩·诺塞克是社会心理学家、开放科学中心执行董事,他指出通过使用这种标记,《心理科学》期刊的平均数据共享 享率从2013年至2015年间增长至38%,翻了十倍。

[E]投资者也越来越接受开放数据的政策。一些人强烈鼓励,还有一些人要求建立一个可以让数据共享的 数据管理计划。美国国家科学基金会就是其中之一。一些慈善资助者,包括华盛顿州西雅图市的比尔和梅琳 达·盖茨基金会及伦救的威康信托基金会也要求他们的赠款接受人开放数据。 ||| [F]但是很多年轻的研究者,特别是没有接受过开放科学指导过的那些研究者,他们对共享还是保持私有 仍不确定。(45)研究生和博士后通常是依靠实验室主管的资金,如果他们的主管或者其他资深的同事反对共 享的话,他们可能也没有别的选择。

[G]一些人担心共享的潜在影响太大,特别是职业生涯早期阶段。“每个人都有被别人抢先发表的 怕经历,”纽约大学天文学家大卫·霍格说道。(37)这种担忧或许是人们在分享数据时徘徊犹豫的一个原因, 即使是在期刊发表时要求共享数据。

[H]在小实验室或机构里专注教学的研究者可以说在分享来之不易的数据时失去的最多。“以我的机构和 教学工作量,我没有博士后和研究生,”加州州立多明格兹冈大学热带生物学家特里·麦格林说道。“对我来说 分享数据的风险更大,因为它在我的实验中占比较大。

[I]]研究者还指出,在准备数据让他人查看时还有一个时间陷阱的问题。(44)一旦数据和相关材料出现在 存储库中,回答问题和处理投诉会花费很多时间。

[J]这种时间投资可能带来其他问题。数据科学家卡西克·拉姆认为,在有些情况下,资深的同事————他们 中很多都是选拔和晋升委员会的负责人————可能嘲讽他们认为是浪费精力的事情时,初级研究员也就很难信奉 开放精神了。“我最近听说过这样的事情,信奉开放数据和代码的想法让传统学者们很不舒服,拉姆说道。“他 们担心的是,提倡开放的人无法高效地利用他们的时间。

[K]一种开放科学的姿态也会让合作变得更加复杂。盖恩斯维尔佛罗里达大学社会态度研究者凯特·拉 特利夫认为,就像一个领城的两个阵营,一方关心开放科学,另一方不关心开放科学。“有一个新的领域要应付 在与他人谈论一个有趣的研究理念时,他们首先会问我想公开数据,你介意吗?”她说道。

[L]尽管有些复杂和担心,共享的优势仍非常显著。例如,当信息上传到存储库里时,会分配一个数字对象 标识符。(41)科学家可使用这个数字对象标识符来公布研究周期的每一个步骤,而不仅仅是最终的文章。这 样一来,他们就可能获得三次引用————数据和软件各一次,再加上纸质论文本身。并且尽管一些人认为引用软 件或数据在学术中很少使用,但它们还有其他的好处。

[M]一些支持者认为有日期和时间戳的透明数据程序能够保护科学家成果免遭被抢先。“这是分享和获得 好评之间的平衡点,同时也能打击剽窃行为,”丹麦夏洛滕隆国家水产资源研究秘书处的项目协调人伊福·格里 戈罗夫说道。(36)霍格说,割窃并不像很多人认为的那样是个大问题。“我接触的两个案例也与公开数据或代 码无关,”他说。

[N]开放科学也为初级研究者带来了更好地获取关健数据的途径,创造了公平的竞争环境。罗丝,恩思 是一名在英国剑桥大学研究进化生物学的博士后,他是开放科学的忠实捍卫者,部分原因是他以化石为基础的 研究需要依靠他人的数据。他说,科学上更加开放能够帮助打击一些人已经习以为常地对年轻科学家使用数据 的请求拒之门外的风气。

[O]对于那些担心危害合作的人来说,沟通也是有用的,他说。(43)对于开放科学的担心在研究之初就加 以讨论“一旦你和其他人开始一项研究,你必须对谁拥有数据、何时发表以及谁能如何处置这些数据的预期有 个明确的认识,”他说道。

[P](40)最后,与同事共享数据、软件和材料能够帮助初级研究者获得认可,这也是成功的关健部分。“你 要追寻的就是名声,加州大学戴维斯分校基因组学研究者泰特斯·布朗说道。“要想得到资金和工作,你必须 有相关经验,并取得一定程度的公众认可。你做的所有提高存在感的事情————特别是在你所知的群体之外的更 大领域内————是一个净赢。”

详解详析

36. Astronomer David Hogg doesn’t think scooping is as serious a problem as generally thought.

【译文】 天文学家大卫·霍格认为剽窃问题并不像大家认为得那么严重。

【定位】 由题干中的关键词David Hogg、scooping和a problem定位到[M]段倒数第二句。

【详解】 [M]段提到,霍格说,剽窃并不像很多人认为的那样是个大问题。题干中的doesn’t think…as serious a problem as generally thought 对应原文中的less of a problem than many think,故答案为M)。

M) Many advocates think that transparent data procedures with a date and time stamp will protect scientists from being scooped. “This is the sweet spot between sharing and getting credit for it, while discouraging plagiarism (剽窃),” says Ivo Grigorov, a project coordinator at the National Institute of Aquatic Resources Research Secretariat in Charlottenlund, Denmark. Hogg says that scooping is less of a problem than many think. “The two cases I’m familiar with didn’t involve open data or code,” he says.


37. Some researchers are hesitant to make their data public for fear that others might publish something similar before them.

【译文】 一些研究者对公开数据犹豫不决是因为担心其他人可能会先于他们发表类似的东西。

【定位】 由题干中的关键词hesitant、fear和publish定位到[G]段最后一句。

【详解】 [G]段提到,这种担忧或许是人们在分享数据时徘徊犹豫的一个原因,即使是在期刊上发表时要求公开数据。题干中的hesitant对应原文中的lingering hesitation,故答案为G)。

G) Some fear that the potential impact of sharing is too high, especially at the early stages of a career. “Everybody has a scary story about someone getting scooped (被抢先),” says New York University astronomer David Hogg. Those fears may be a factor in a lingering hesitation to share data even when publishing in journals that mandate it.


38. Some psychology journals have offered incentives to encourage authors to share their data.

【译文】 一些心理学期刊提供优惠政策鼓励作者分享他们的数据。

【定位】 由题干中的关键词psychology journals和incentives定位到[D]段第三句。

【详解】 [D]段提到,一些心理学期刊也激励更多的人对可复制性科学感兴趣,比如在一些文章上贴上“开放数据”的标记,清楚地指明在哪里可以找到数据。题干中的have offered incentives对应原文中的have created incentives,故答案为D)。

D) Some fields have embraced open data more than others. Researchers in psychology, a field rocked by findings of irreproducibility in the past few years, have been especially vocal supporters of the drive for more-open science. A few psychology journals have created incentives to increase interest in reproducible science—for example, by affixing an ‘open-data’ badge to articles that clearly state where data are available. According to social psychologist Brian Nosek, executive director of the Center for Open Science, the average data-sharing rate for the journal Psychological Science, which uses the badges, increased tenfold to 38% from 2013 to 2015.


39. There is a growing demand in the science community that research data be open to the public.

【译文】 对科学界向公众开放研究数据的需求不断增长。

【定位】 由题干中的关键词research data和public定位到[A]段第一句。

【详解】 [A]段第一句提到,这是一项产生持续声势的运动:使研究数据、软件代码和实验方法公开、透明的呼吁。题干中的a growing demand对应原文中的a movement building steady momentum; be open to the public对应原文中的publicly available and transparent,故答案为A)。

A) It is a movement building steady momentum: a call to make research data, software code and experimental methods publicly available and transparent. A spirit of openness is gaining acceptance in the science community, and is the only way, say advocates, to address a ‘crisis’ in science whereby too few findings are successfully reproduced. Furthermore, they say, it is the best way for researchers to gather the range of observations that are necessary to speed up discoveries or to identify large-scale trends.


40. Sharing data offers early-career researchers the chance to build a certain level of reputation.

【译文】 共享数据为初级研究者提供了建立一定声誉的机会。

【定位】 由题干中的关键词Sharing data、 early-career researchers和reputation定位到[P]段第一句。

【详解】 [P]段首句提到,与同事共享数据、软件和材料能够帮助初级研究者获得认可,这也是成功的关键部分。题干中的build a certain level of reputation对应原文中的gain recognition,故答案为P)。

P) In the end, sharing data, software and materials with colleagues can help an early-career researcher to gain recognition—a crucial component of success. “The thing you are searching for is reputation,” says Titus Brown, a genomics(基因组学) researcher at the University of California, Davis. “To get grants and jobs, you have to be relevant and achieve some level of public recognition. Anything you do that advances your presence—especially in a larger sphere, outside the communities you know—is a net win.”


41. Data sharing enables scientists to publish each step of their research work, thus leading to more citations.

【译文】 数据共享能使科学家公开他们研究工作的每一个步骤,因而可以获得更多的引用。

【定位】 由题干中的关键词publish each step 和citations定位到[L]段第三、四句。

【详解】 [L]段提到,科学家可使用这个数字对象标识符来公布研究周期的每一个步骤,而不仅仅是最终的论文。这样一来,他们就可能获得三次引用。 题干中的their research work对应原文中的the research life cycle,故答案为L)。

L) Despite complications and concerns, the upsides of sharing can be significant. For example, when information is uploaded to a repository, a digital object identifier (DOI) is assigned. Scientists can use a DOI to publish each step of the research life cycle, not just the final paper. In so doing, they can potentially get three citations—one each for the data and software, in addition to the paper itself. And although some say that citations for software or data have little currency in academia, they can have other benefits.


42. Scientists hold different opinions about the extent and timing of data sharing.

【译文】 科学家对数据共享的程度和时机持有不同意见。

【定位】 由题干中的关键词Scientists、timing和data sharing定位到[B]段第四句。

【详解】 [B]段提到,科学家对于他们分享多少数据和何时分享数据持有不同的观点。题干中的hold different opinions对应原文中的disagree; the extent and timing对应原文中的how much and when,故答案为B)。

B) The open-data shift poses a confusing problem for junior researchers. On the one hand, the drive to share is gathering official steam. Since 2013, global scientific bodies have begun to back policies that support increased public access to research. On the other hand, scientists disagree about how much and when they should share data, and they debate whether sharing it is more likely to accelerate science and make it more robust, or to introduce vulnerabilities and problems. As more journals and funders adopt data-sharing requirements, and as a growing number of enthusiasts call for more openness, junior researchers must find their place between adopters and those who continue to hold out, even as they strive to launch their own careers.


43. Potential problems related to data sharing should be made known to and discussed by all participants at the beginning of a joint research project.

【译文】 关于数据共享的潜在问题,在一项共同研究项目的一开始就应该让所有参与者知晓和讨论。

【定位】 由题干中的关键词Potential problems和discussed 定位到[O]段第二句。

【详解】 [O]段提到,对于开放科学的担心在研究之初就应该加以讨论。题干中的at the beginning of是对原文中at the outset of的同义转述,故答案为O)。

O) Communication also helps for those who worry about jeopardizing a collaboration, he says. Concerns about open science should be discussed at the outset of a study. “Whenever you start a project with someone, you have to establish a clear understanding of expectations for who owns the data, at what point they go public and who can do what with them,” he says.


44. Sharing data and handling data-related issues can be time-consuming.

【译文】 共享数据和处理数据相关的问题可能会很费时间。

【定位】 由题干中的关键词handling和time-consuming定位到[I]段第二句。

【详解】 [I]段最后一句提到,一旦数据和相关材料出现在存储库中,回答问题和处理投诉会花费很多时间。题干中的be time-consuming对应原文中的take many hours,故答案为I)。

I) Researchers also point to the time sink that is involved in preparing data for others to view. Once the data and associated materials appear in a repository (存储库), answering questions and handling complaints can take many hour.


45. Junior researchers may have no say when it comes to sharing data.

【译文】 初级研究者在共享数据的问题上可能没有话语权。

【定位】 由题干中的关键词Junior researchers和have no say定位到[F]段第二句。

【详解】 [F]段提到,研究生和博士后通常是依靠实验室主管的资金,如果他们的主管或者其他资深的同事反对共享的话,他们可能也没有别的选择。题干中的Junior researchers对应原文中的Graduate students and postdocs; have no say对应原文中的have no choice,故答案为F)。

F) But many young researchers, especially those who have not been mentored in open science, are uncertain about whether to share or to stay private. Graduate students and postdocs, who often are working on their lab head’s grant, may have no choice if their supervisor or another senior colleague opposes sharing.