开放获取期刊资源采集策略:细粒度、复杂性与多变性应对

需积分: 0 0 下载量 167 浏览量 更新于2024-08-04 收藏 134KB DOCX 举报
开放获取期刊资源采集方法探究深入探讨了如何有效地收集和管理这一类特殊的学术资源。针对开放获取期刊资源的特性,研究者黄政和张学福首先进行了广泛的调研,他们选择了134个国内和15个国外的知名开放获取期刊网站,以及期刊仓储作为研究对象。这些资源的显著特点是描述粒度极细,元数据字段繁多,涵盖了期刊基本信息(如名称、年份、卷期)和论文信息(如标题、关键词、摘要、作者等),远超一般网络资源的需求。 描述的复杂性体现在元数据字段的展现方式上,既有单独展示的,如标题和摘要,也有整合在一起的信息,如年卷期。这种复杂性使得单纯的数据抓取和解析变得更具挑战性。此外,描述载体结构的多样性也显现出来,即同一份资源在不同网站上的呈现可能大相径庭,需要灵活应对各种格式。 基于以上特点,研究者将开放获取期刊资源划分为单一型资源和组合型资源,分别对应于那些元数据结构相对简单和复杂的资源类型。对于元数据采集方法的对比分析,他们探讨了现有技术如Web信息采集和元数据抓取工具的适用性,强调了针对不同类型资源选择恰当采集策略的重要性。 通过实证采集分析,作者验证了采用不同方法能够有效地捕获各类开放获取期刊资源。这个案例研究不仅提供了实践指导,还强调了个性化采集和开放资源平台建设中开放获取期刊资源采集方法的策略性应用。 这篇论文深入剖析了开放获取期刊资源的特性,提出了一套针对不同类型的采集方法,对于图书馆、学术机构以及开放获取平台优化资源获取和管理具有实际意义。未来的研究可以进一步探索自动化和智能化的采集工具,以适应开放获取期刊资源的快速增长和多样化。