基于中文医学知识库的ChatGLM指令微调与交互式测试

153 浏览量更新于2024-10-01 收藏 795KB ZIP 举报

资源摘要信息:"人工智能-ChatGLM-基于中文医学知识的ChatGLM指令微调" 知识点概述: 1. 人工智能与自然语言处理人工智能(AI)是计算机科学的一个分支，致力于研究和开发智能机器和软件。自然语言处理(NLP)是AI领域中的一个重要子领域，它涉及到计算机理解和处理人类语言的能力。NLP技术能够使计算机理解、解析、生成自然语言。 2. ChatGLM指令微调技术指令微调是指通过训练数据集对预训练模型进行进一步的调整和优化，以适应特定任务的需求。在这种情况下，ChatGLM是一个基于GPT（Generative Pre-trained Transformer）架构的预训练语言模型，特别针对中文语言环境进行了微调，以实现更好的中文交互体验。指令微调允许模型在特定领域内，如医学知识领域，进行更准确和相关的回答。 3. 中文医学知识库的构建医学知识库是存储医学知识的集合，通常由各种疾病、症状、药物、治疗方法等信息组成。在这个项目中，中文医学知识库的构建主要参考了cMeKG（Chinese Medical Knowledge Graph）。构建知识库时，围绕疾病、药物、检查指标等关键信息进行字段设计，包括并发症、高危因素、组织学检查、临床症状、药物治疗、辅助治疗等，以构建出结构化的医学信息集合。这些信息有助于提升医学知识的理解和应用能力。 4. GPT3.5接口应用 GPT3.5接口指的是一个能够使用GPT3.5架构进行交互式文本生成的API接口。在本项目中，通过GPT3.5接口，围绕构建的医学知识库构建问答数据集。问答数据集的构建意味着可以通过不同的Prompt（提示）形式来引导模型输出有针对性的回答。 5. 交互式测试流程交互式测试是验证模型实际工作效果的重要步骤。在本项目中，交互式测试的流程可以通过执行python infer.py脚本来进行。这个脚本负责初始化模型，并让使用者能够与模型进行实时的对话，以此来检验模型在医学知识领域的问答能力。 6. 数据集构建与应用数据集是机器学习和深度学习模型训练的基础，尤其是对于深度学习模型来说，数据集的质量和相关性直接影响模型的表现。在本项目中，数据集的构建包括收集公开的中文医学数据以及自建医学数据，这些数据被用来训练和微调模型，以确保模型能够准确理解和响应医学相关的查询。 7. 字段及其意义数据集中的字段包含了与医学知识相关的多维度信息，比如中心词、相关疾病、相关症状、所属科室、发病部位等。这些字段的设置使得模型能够获得更全面的上下文信息，从而提供更准确和专业的医学建议。 8. 技术的实践意义这项研究展示了人工智能在特定领域（如医学）的潜在应用，特别是在提供准确、及时的医学信息和建议方面。通过针对中文医学知识进行的指令微调，这项技术可以辅助医生和医疗工作者，甚至普通大众获取专业而准确的医学信息。此外，它也指出了构建专业领域知识库对于提升人工智能系统性能的重要性。

资源目录

收起资源包目录

基于中文医学知识库的ChatGLM指令微调与交互式测试（11个子文件）

settings 11B

chat_dataset.py 4KB

put model here 0B

train.txt 2.49MB

requirements.txt 259B

modeling_chatglm.py 47KB

infer.py 556B

tokenization_chatglm.py 12KB

sft_medchat.sh 750B

run_clm.py 24KB

configuration_chatglm.py 4KB

共 11 条

博士僧小星

粉丝: 2433
资源: 5997

基于中文医学知识库的ChatGLM指令微调与交互式测试

ChatGLM-Med: 基于中文医学知识的ChatGLM模型微调.zip

langchain-ChatGLM.tar.gz

ChatGPT平替-ChatGLM环境搭建与部署运行.zip

Fine-tuning ChatGLM-6B with PEFT _ 基于 PEFT 的高效 ChatGLM 微调.zip

大模型LoRA微调-基于ChatGLM3-6B模型的LoRA方法微调实现-附项目源码+流程教程-优质项目实战.zip

人工智能-大模型-基于internlm-chat-7b的保险知识大模型微调

大模型微调-基于Deepspeed实现多卡的ChatGLM微调-付项目源码+流程教程-优质项目实战.zip

基于ChatGLM-6B、ChatGLM2-6B、ChatGLM3-6B模型，进行下游具体任务微调，全参微调

人工智能-大模型-基于DPO算法微调语言大模型，简单好上手

人工智能-大模型-基于已有基座模型微调的算命大模型

最新资源