ReCiter开源系统:实现学术机构作者身份的精确识别与维护

需积分: 9 0 下载量 7 浏览量 更新于2024-12-31 收藏 195.11MB ZIP 举报
它由Java应用程序、DynamoDB数据库和一组RESTful微服务组成,使得机构能够高效维护和更新数千名作者的出版物列表。该系统通过集成机构提供的身份数据如部门、关系、电子邮件地址和学位等,提升搜索效率,节省时间,并增加数据的准确性。 ReCiter的主要功能包括: 1. 接收指定人员信息,猜测其在PubMed上的出版物列表; 2. 利用机构维护的身份数据辅助搜索,提高搜索结果的相关性和准确性; 3. 每天运行ReCiter可以确保新出版物被及时发现和更新; 4. 支持高效率的多线程检索,一次可处理最多10个检索请求,大幅提高搜索速度。 技术细节方面,ReCiter需要以下先决条件: - Java 1.8版本:Java是编写ReCiter的编程语言,Java 1.8是其运行的最低要求版本; - Maven:一个项目管理和构建自动化工具,ReCiter的构建和项目管理依赖于最新版本的Maven。 ReCiter系统使用的主要技术标签包括: - Java:编程语言,用于开发ReCiter软件; - AWS:亚马逊网络服务,提供了包括DynamoDB在内的云服务,用于托管数据库; - Algorithm:算法,指ReCiter在数据处理中使用的算法; - Spring Boot:Java开发框架,可能用于简化ReCiter后端服务的开发和部署; - Maven:构建和项目管理工具; - Clustering:在微服务架构中,可能指的是如何对服务进行集群管理以提高系统可用性和稳定性; - DynamoDB:AWS提供的NoSQL数据库服务,ReCiter使用它托管数据库; - Machine Learning Algorithms:机器学习算法,可能应用于身份识别和数据挖掘; - Entity Resolution:实体解析,指在数据处理中用于解决数据项一致性问题的技术; - S3:AWS提供的简单存储服务,可能用于存储检索结果或备份; - PubMed:主要的医学文献数据库; - Scopus:一个广泛的同行评审摘要和引文数据库; - ElasticBeanstalk:AWS提供的用于部署和扩展Web应用程序和Web服务的服务; - AWS CodeBuild 和 CodePipeline:AWS提供的持续集成和持续部署服务,用于自动化代码构建、测试和部署流程; - AlgorithmJava:指使用Java语言开发的算法。 最后,提供的文件名称列表“ReCiter-master”表明这是一个包含ReCiter系统源代码的压缩包文件名,主版本通常意味着包含了系统的核心或最新版本代码。"