当前位置 首页 >经典赏析 >

沈阳航空航天大学IR建设研究

作者:jkyxc 浏览数:


打开文本图片集

摘  要:该文首先介绍了什么是机构知识库,现阶段国内机构库的建设现状;其次结合沈阳航空航天大学的实际情况,提出该校自己的机构库建设思路及建设原则;最后列举了该校机构知识库的部分建设内容,包括数据仓储、成果认领、成果检索与展示、成果关联挖掘与统计等平台模块建设,并详细说明如何进行数据去重、切分、关联及后期的数据管理。

关键词:机构库  沈阳航空航天大学  资源服务

中图分类号:G250   文献标识码:A 文章编号:1672-3791(2019)07(a)-0203-03

机构知识库(Institutional Repository,简称IR)的概念最早由Raym Crow在2002年提出[1],后来受到图书馆界的广泛关注。机构库是开放获取的重要组成部分,是教育与科研机构存储本机构学术研究成果和智力资产的服务平台。图书馆通过机构知识库建设和服务进一步促进服务转型,在助力科研以及支持决策管理等方面,逐渐开始呈现信息集合和利用,以及跨部门信息共享与协作等问题,实现服务的拓展和转型。

1  高校机构知识库建设现状及存在的问题

从2016年11月11日在Open DOAR上收录的机构知识库分布情况来看,我国被收录的机构知识库共有103个,其中大陆地区共有34个,港澳地区有9个,台湾地区有60个。在大陆地区被收录的34个中,有26个是中国科学院系统的机构知识库,6个是大学机构知识库[2]。

实际上,近年来我国的机构知识库发展迅速,数量远不止这么多,但由于Open DOAR是国外机构建立的英文网站,对中国很多以中文为基础语言搭建的机构知识库的发现能力有限,导致很多已经建立且功能完全的机构知识库未能被统计进去。

2  建设机构知识库的思路与原则

机构知识库可以实现机构的知识资产管理、传播以及利用知识资产开展拓展性服务,采取自下而上的建设模式,由图书馆作为主导发起并具体实施建设。结合机构中有特色或有代表性的资源或部门,作为试点和示范,着重建设、宣传和推广,获得机构内相关职能部门的认同(如科研管理部门、研究生院等),赢得机构管理层和决策层支持,在职能部门的政策要求和引导下,建设具有本机构特色的机构知识库系统平台(见图1)。从保障系统架构完整性的基础上,系统建设需遵循如下原则。

2.1 全面系统性原则

機构知识库作为一个机构知识资产的储存平台,需要对机构产生和拥有的各类知识资产全面系统地保存、组织、揭示,以促进知识资产的保存、传播、利用和管理。同时,从系统性考虑,机构知识库要实现对不同格式、不同版本、不同类型、不同来源知识资产的长期保存。

2.2 开放拓展性原则

该项目机构知识库在保存知识资产的同时,更重要的是促进机构知识资产的传播利用和管理,提升机构影响力和学术声誉,为此,机构知识库需要以开放性为原则,确保机构知识库自身数据和信息的顺利访问、检索、浏览与获取。实现与外部数据和信息的整合,以及相关系统的数据和信息共享。同时,机构知识库应具备拓展性,能够根据用户需求不断完善和丰富机构知识库的资产类型、表现形式和服务功能,实现功能自定义或模块化,确保其开放性、灵活性和先进性,实现可持续发展。

2.3 权威规范性原则

机构知识库作为学校的信息基础设施之一,要实现对机构知识资产的保存、传播、共享和利用,在建设过程中,需要确保内容的真实性、准确性,确保数据的权威性。同时,从规范性的原则出发,结合法律、法规及政策规定,对涉及的各类资产进行规范化存储、描述、组织、管理,既保障机构知识库内容建设质量,实现高效利用,又确保机构知识库内容和成果得到法律政策的保护,实现成果权益最大化普及。

3  沈阳航空航天大学机构知识库内容建设

按照笔者设想,该校机构知识库内容建设包括数据仓储平台、成果认领平台[3]、成果检索与展示平台及成果关联、挖掘与统计。

3.1 数据仓储平台

针对该校各类知识资产进行收割、管理与共享,数据仓储功能是机构知识库的基本功能,可存储不同类型、不同格式的学术成果资源,作为系统服务的基本要素,需建设具有可拓展性的数据 仓储系统,并收割本机构的相关数据资源。

3.2 成果认领平台

系统应支持自动收割方式,支持来自主流信息源的数据库自动收割和自动清理,并建立成果认领机制确保成果收割的准确率,主要包括以下功能。

自存缴方式:作者可根据元数据模板补充存缴其他成果,支持批量导入。

第三方存缴:作者可以通过系统委托他人存缴成果,同一成果类型支持批量导入。

成果去重:制定完备的去重策略并自动实现,同时也允许少量成果由人工审核清理并去重(至少到院、系;所级别等)。

3.3 成果检索与展示平台

作为机构知识服务系统的前端服务平台,成果检索与展示需以检索便利、成果展示多元化为设计与开发原则,具体需具有以下功能。

分面与浏览:支持主要定义字段的数据分类管理,对于各类知识资产,实现多维度、多途径、多方式浏览。

类型检索:支持简单检索、高级检索、二次检索等检索方式,支持根据不同的条件对结果进行多种维度、多种方式的筛选、排序和导出。

多维度展示:除按出版物各字段展示外,还需要提供学者学术履历、学术轨迹展示、院系机构学术展示、科研活动展示等。除此之外,能够灵活组合各类描述字段,根据需要进行多维度、多视角的统计分析,自动完成基本的学者/院系/团队的学术统计、学术贡献、趋势判断等基本分析功能并可视化呈现。

个性化资源定制:用户可根据个人专注的研究领域进行成果资源定制,定制模式包括RSS等。

数据可视化:具有可视化数据表现形式,并支持文本格式导出;支持多维度统计分析并可视化展示学者、机构、学科相关学术信息。提供可视化数据分析工具,支持自定义数据字段拖拽分析挖掘,支持自定义图标展示方式。

3.4 成果关联、挖掘与统计

在数据基础上,系统应提供有创新性的成果关联功能,并可对成果数据进行数据挖掘与统计,以期为学校的科研发展、成果统计提供权威评价基础。

3.4.1 数据去重

流程为,勾选数据后,按照之前设定的不同来源库中的去重规则进行数据去重,去重规则设可由馆员自行设置,并且目前能够支持数据的多流程去重,即按照不同的数据去重规则分别去重。勾选数据后,默认将数据进行补丁,合并之后的字段保留也是按照既定的模板进行字段的替换。

数据去重分为同源数据去重与异源数据去重。去重规则可由馆员进行配置,配置完成后形成类似于公式的去重准侧,在配置有限级时直接调用即可。

3.4.2 数据的切分

数据可切分的字段很多,比如说作者位次信息,通过读取数据中每个作者之间的分隔方式,进行作者位次的输出,排名第一的默认为第一作者,数据切分后自动将信息归并到数据表中。平台应持切分规则定制与输出字段的定制开发。需要新增的切分字段包括:单篇发文人数、单篇发文机构数等。

3.4.3 数据关联

成果数据关联:基于成果数据,兼容CERIF模型,提供丰富的资源表现形式,包括人与出版物信息、人与机构、人与各类教学研究活动等之间的动态关联。通过数据挖掘或统计分析,体现机构、团队以及个人的成果目录和聚类,同时,能够为作者科研协作关系、机构科研协作关系、课题协作关系、成果引证关系、特定領域研究发展轨迹等提供关联。

3.4.4 数据管理

系统管理模块以系统模块间数据交换、角色定义、权限控制等功能。分为集成统一认证、角色设置、数据共享管理。

4  结语

基于以上的内容建设描述,涉及子系统及功能模块,需要根据馆内实际情况及未来需求,详细论证各平台子系统的实施。而未来随着机构知识库向数据化、语义化、关联化和智能化的方向不断发展,将打破自身资源建设的局面,使之在整个科研环境之中,成为支撑科研机构科研过程监控和绩效管理的重要平台和手段。

参考文献

[1] Crow R.The Case for Institutional Repositories:A SPARC Position Paper[M].ARL Bimonthly Report,2002:1-37.

[2] 朱立禄,宋世俊,王琳.国内外机构知识库建设现状及建议[J].现代情报,2017,37(3):109-115.

[3] 王序文,李军莲,黄利辉,等.机构知识库建设实践研究[J].医学信息学杂志,2018,39(7):54-59.

推荐访问:航空航天大学 建设 研究 沈阳 IR

相关文章:

Top