本地开源大语言模型汇总:跟踪与分类

9 下载量 86 浏览量 更新于2024-08-03 收藏 329KB PDF 举报
本文档是一份开源大语言模型(LLM)的汇总,涵盖了多个由研究机构和社区开发的大规模语言模型。随着ChatGPT的流行,本地运行大模型的需求增加,作者定期更新这份清单,旨在帮助用户追踪最新的开源模型及其衍生版本。以下是一些主要模型的概述: 1. **Alpaca (Stanford)** - 由斯坦福大学的研究团队开发的指令遵循型LLaMA模型,官网链接:<https://crfm.stanford.edu/2023/03/13/alpaca.html>。模型本身不可商用,但其开源代码可以在GitHub上获取:<https://github.com/tatsu-lab/stanford_alpaca>。Alpaca有多种衍生版本,如Alpaca.cpp和Alpaca-LoRA。 2. **Baize, Cabrita, BELLE, Luotuo, Vicuna (FastChat), Chinese-Vicuna** - 这些模型都是基于基础模型进行定制或扩展,可能包含特定领域的优化或者针对不同语言的适应。 3. **GPT4All** - 这个名字表明它可能是一个多用途的、跨领域的模型。 4. **Koala, llama.cpp, Lit-LLaMABLOOM (BigScience)** - 另外几个开源项目,其中lit-LLaMABLOOM是由BigScience团队创建的,BLOOM-LoRA是其变体。 5. **Flamingo (Google/Deepmind)** - Google与DeepMind合作的模型,提供PyTorch和OpenFlamingo版本,显示了跨平台的灵活性。 6. **FLAN (Google)** - Google开发的模型,衍生版本如Flan-Alpaca和Flan-UL2,表明其在与其他模型融合中的应用。 7. **GLM (GeneralLanguageModel)** - 一个通用的大语言模型,有不同大小的版本,如GLM-130B和ChatGLM-6B。 8. **GPT-J (EleutherAI)** - EleutherAI团队的贡献,展示了不同的开源组织在模型开发上的参与。 9. **Dolly (Databricks)** - Databricks的模型,可能涉及大数据处理和云计算场景。 10. **Cerebras-GPT (Cerebras)** - Cerebras Systems公司基于其硬件平台的模型,强调硬件与模型的协同优化。 11. **GPT-NeoX** - 又一个知名的大规模语言模型,可能与OpenAI的GPT系列有关。 12. **HuggingGPT** - 通常指代来自Hugging Face的模型,这是一个流行的自然语言处理库。 13. **Polyglot** - 支持多语言的模型,体现了对多语言场景的关注。 14. **Pythia** - 可能是一个专注于特定任务或平台的模型。 15. **SegmentAnything** - 名称暗示该模型可能特别适用于文本分割或内容提取任务。 16. **TheRWKVLanguageModel** - 可能是某个特定组织或研究团队的模型。 17. **XGLM** - 未知的具体模型,但表明存在更多的大型语言模型探索。 这些模型不仅提供了丰富的语言生成能力,而且通过开源形式促进了人工智能技术的普及和创新。用户可以根据自己的需求选择合适的模型,并参与到模型的改进和扩展中。值得注意的是,尽管这些模型是开源的,但在使用时应确保遵守相关的许可证协议,并考虑到数据隐私和伦理问题。