为什么数据库鼓励期刊“长期存档”?

期刊无疑已经进入了电子化时代,这大大促进了学术成果的交流传播。但随之而来的一个问题就是:如何保存大量的过刊论文?如何保证过刊数据安全、稳定、长期有效?如何建立一种有针对性的机制来应对这些问题,并规避可能存在的风险?当下,一些有影响力的国际数据库都鼓励期刊使用第三方平台的“长期存档(long-term archiving)”服务。具有长期存档安排已然成为了期刊申请数据库的一个加分项。那么到底什么是长期存档服务,这种服务有什么作用呢?一般来讲,长期存档服务可以分为三类,我们一一来看。

broken image


针对停刊风险的长期存档

尽管期刊中不乏“百年老店”,但不可避免的是,多数期刊有着不可抗拒的生命周期。根据一项原载于《Nature》的调查报告,21世纪头20年,仅研究者能够证实的开放获取期刊的停刊就发生了176起,还有900本期正处于停刊的边缘。尚有大量的停刊事件无法被统计,因为停刊往往并不会主动向社会通告。一旦停刊,其网站很快就会关闭或陷入无人维护的状态,过刊文章从此便无法获取

CLOCKSS、PKP PN、Portico等平台主要针对这种风险而设立。其基本的合作模式如下:以会员制合作,会员分两种,图书馆出版商。出版商(期刊)成为会员后,可以把论文存入平台。平时存入的文章不会向公众开放,一旦发生停刊,非OA期刊的文章将会释放给会员图书馆,提供阅读;OA期刊的文章则会免费提供给公众阅读。这种“长期存档”就像是一种保险模式:平时交足保费,一旦发生意外,则文章的获取可以继续得到保证。

平台除收取会员年费外,上传单篇文章可能还要收取小额的处理费。为尽量降低会员的资金负担,收费标准和机构的收入挂钩。中国的期刊大多数盈利能力不强,因此费用不会太高。以CLOCKSS为例,每年花费在数千元人民币左右;PNP PN则对期刊免费注册。

broken image


针对技术风险的长期存档 

尽管期刊论文的电子保存看起来比纸质保存可靠得多,似乎一篇文章一旦被电子化就可以随时拷贝、下载、永远不会消失,但事实远非如此。首先数据和软件本来就存在意外损坏的风险,硬件和存储介质同样可能会发生老化物理毁坏而无法使用。更不用说信息技术的更新换代如此迅速,在三五十年这个时间尺度上,设备的种类、数据的格式、系统的兼容性都可能发生翻天覆地的变化。毕竟,30年前风靡一时的5.5寸软盘现在全国可能都找不到几台读取设备,10年前笔记本电脑标配的“光驱”现也已难觅踪迹。那么谁又能保证时下流行的USB插口PDF格式在50年后依然能够被彼时的软硬件系统所兼容处理呢?


broken image

CINES、LOCKSS等平台的服务主要针对这一类技术风险。他们为期刊数据的存储提供更为强大的技术支持。这些平台并不仅仅是将数据简单备份(back-up),或仅仅提供类似网盘一样的存储空间,而是对数据的安全性可获取性可读取性全面负责。无论硬件、软件、格式、操作系统如何更新换代,都保证论文数据能够被随时调取、以便以最新的形式进行复制和传播。这一类平台直接与网站或出版商合作,合作前会对期刊进行全面的技术评估。平台大都属于“非盈利机构”,一般不收费收费较低。另外Internet Archiving等平台因具有存储网页快照的功能,也可以提供类似的期刊长期存档的技术服务。


具有传播价值的长期存档 

第三类长期存档服务和前两类完全不同。前两类存档的数据除非必要,正常状态下不会释放给公众;而第三类存档则会和期刊同步向读者提供阅读和下载,或者说它本身就是一部有影响力的数据库。前两类存档服务都要收取一定费用,而第三类服务一般并不收费。但是第三类存储机构会对期刊的学科范围学科质量都有一定的挑选,相比之下前两类存档几乎不会对合作设置门槛。

broken image

第三类存档最典型的是PubMed下属的PubMed Central(PMC)。PMC是生物医学和生命科学领域的全文数据库,论文全文向公众免费开放。即使是非OA期刊,如果与PMC合作,也必须在该数据中提供免费全文阅读,但可以有一定的时滞(这也是PMC和MEDLINE的一个重大差别)。

PMC被许多数据库认可为“长期存档”的服务提供商,一个重要原因在于,其主办方是美国国立医学图书馆,具有深厚的官方背景,为数据长期安全提供了保障。事实上,任何国家级图书馆的期刊电子存档,都会被数据库认为是符合要求的长期存档安排。但是据了解,中国国家图书馆目前并没有开展大规模的期刊电子存档业务,而中文学术界常见的知网、万方、维普、超星等平台暂时没有被数据库认可为符合要求的长期存储平台。

broken image

由此可见,期刊是学术交流的平台,每一篇文章都是相关学者的独创,有着不可替代的价值。科学出版物的意外丢失是一件不该发生的事情。保证过刊论文数据的安全性和稳定性,也越来越被看作期刊出版商的一项责任。从国内的情况来看,过刊文章的电子化保存方兴未艾,不少期刊已经在其官网实现了开放获取,并追溯了长达几十年的过刊数据,但对数据长期安全性尚缺乏妥善的安排。我们建议,有余力的期刊编辑部能够选取一个或数个第三方平台进行过刊的长期存档,这无论对于申请数据库还是期刊长期发展都有许多好处。同时我们更盼望着不久的将来能有被世界认可的中国机构提供期刊长期存储服务。

 

了解更多行业信息,请扫码联系科置科学小秘书

broken image