在许多领域中,公开数据分享者仍然只占少数。(46)尽管很多研究人员公开认同让大众接触到原始数据 将推动科学发展,但大多数人还是不大愿意在网上公开他们自己的研究结果。
(47) 有些研究群体已经同意进行网上分享————例如,遗传学专家们将DNA序列上传到了基因银行数据库 中, 而天文望远镜观测而天文学家们则习惯于从“斯隆数字天空观测”中调取星系和恒星的照片,这台天文望远镜观测了大约5亿 个天体————但是,这些仍然只是特例,不是惯例。一直以来,科学家们以诸多理由拒绝共享资源:工作量庞大;到 目前为止,还没有出现好的数据库;基金设立者们并不敦促分享;数据格式的标准很难统一;以及对共享数据如 何归功没有统一方式。
(48-1/49)但这些障碍在逐渐消除,部分原因是全球的期刊和基金机构都在鼓励科学家公升自己的研究数据。 (48-2)去年,英国伦敦皇家学会在其报告中称,科学家们应该“扭转将数据视为私人专利的研究风气”。基 金机构则提出由公众出资的数据应该是公开信息,而科学界也逐渐意识到现在数据可以以前所未有的数字化方 式进行共享。为满足日益增长的需求,各种服务层出不穷,使得在线发表研究结果更加容易,也让其他研究人员 能够发现和加以引用。
(50)尽管共享数据的号召常常着眼于共享的道德优势,但是这种做法也并不纯粹是利他的。进行共享的 研究者个人也会大获神益,包括与同事更多的接触、提高知名度和数据引用频率。最成功的共享者们————他们 的数被频繁的下载和引用一获得关注,而且其著作也常被引用。例如,多学科数据库传德律阿得斯中最受欢 迎的数据集之一是关于全球木材密度的数据;目前该数据集已经被下载5,700多次了。合著者艾米扎内认为 使用者很可能囊括了从想要估算生物炭储量的气候变化研究者到寻找不同等级木材信息的林业工作者。“我十 分乐意自己的数据为带着自身问题的最广泛的人群所使用,”她说道,“让读者和评论者们看到你是如何得出结 论的,这很重要。发布数据和编码能让你的科学得以再生。
即使其数据不那么受欢迎的研究人员也能够受益。通过对文件进行整合和标注,让他人能够理解,这样的 努力使科学家更加有条理和自律,避免日后出现混淆。