本地开源大语言模型汇总：跟踪与分类

86 浏览量更新于2024-08-03 收藏 329KB PDF 举报

本文档是一份开源大语言模型（LLM）的汇总，涵盖了多个由研究机构和社区开发的大规模语言模型。随着ChatGPT的流行，本地运行大模型的需求增加，作者定期更新这份清单，旨在帮助用户追踪最新的开源模型及其衍生版本。以下是一些主要模型的概述： 1. **Alpaca (Stanford)** - 由斯坦福大学的研究团队开发的指令遵循型LLaMA模型，官网链接：<https://crfm.stanford.edu/2023/03/13/alpaca.html>。模型本身不可商用，但其开源代码可以在GitHub上获取：<https://github.com/tatsu-lab/stanford_alpaca>。Alpaca有多种衍生版本，如Alpaca.cpp和Alpaca-LoRA。 2. **Baize, Cabrita, BELLE, Luotuo, Vicuna (FastChat), Chinese-Vicuna** - 这些模型都是基于基础模型进行定制或扩展，可能包含特定领域的优化或者针对不同语言的适应。 3. **GPT4All** - 这个名字表明它可能是一个多用途的、跨领域的模型。 4. **Koala, llama.cpp, Lit-LLaMABLOOM (BigScience)** - 另外几个开源项目，其中lit-LLaMABLOOM是由BigScience团队创建的，BLOOM-LoRA是其变体。 5. **Flamingo (Google/Deepmind)** - Google与DeepMind合作的模型，提供PyTorch和OpenFlamingo版本，显示了跨平台的灵活性。 6. **FLAN (Google)** - Google开发的模型，衍生版本如Flan-Alpaca和Flan-UL2，表明其在与其他模型融合中的应用。 7. **GLM (GeneralLanguageModel)** - 一个通用的大语言模型，有不同大小的版本，如GLM-130B和ChatGLM-6B。 8. **GPT-J (EleutherAI)** - EleutherAI团队的贡献，展示了不同的开源组织在模型开发上的参与。 9. **Dolly (Databricks)** - Databricks的模型，可能涉及大数据处理和云计算场景。 10. **Cerebras-GPT (Cerebras)** - Cerebras Systems公司基于其硬件平台的模型，强调硬件与模型的协同优化。 11. **GPT-NeoX** - 又一个知名的大规模语言模型，可能与OpenAI的GPT系列有关。 12. **HuggingGPT** - 通常指代来自Hugging Face的模型，这是一个流行的自然语言处理库。 13. **Polyglot** - 支持多语言的模型，体现了对多语言场景的关注。 14. **Pythia** - 可能是一个专注于特定任务或平台的模型。 15. **SegmentAnything** - 名称暗示该模型可能特别适用于文本分割或内容提取任务。 16. **TheRWKVLanguageModel** - 可能是某个特定组织或研究团队的模型。 17. **XGLM** - 未知的具体模型，但表明存在更多的大型语言模型探索。这些模型不仅提供了丰富的语言生成能力，而且通过开源形式促进了人工智能技术的普及和创新。用户可以根据自己的需求选择合适的模型，并参与到模型的改进和扩展中。值得注意的是，尽管这些模型是开源的，但在使用时应确保遵守相关的许可证协议，并考虑到数据隐私和伦理问题。

开源大语言模型开源大语言模型(LLM)汇总汇总

随着ChatGPT的火爆，越来越多人希望在本地运行一个大语言模型。为此我维护了这个开源大语言模型汇总，跟踪每天

不发的大语言模型和精调语言模型。

我将根据个模型采用的基础大模型进行分类，每个大模型下列出各派生模型。

Alpaca (Stanford)

Alpaca.cpp

Alpaca-LoRA

Baize

Cabrita

BELLE

Luotuo

Vicuna (FastChat)

Chinese-Vicuna

GPT4All

Koala

llama.cpp

Lit-LLaMA 

BLOOM (BigScience)

下载后可阅读完整内容，剩余9页未读，立即下载

毕业课程设计

粉丝: 2297
资源: 1728

本地开源大语言模型汇总：跟踪与分类

大型语言模型 (LLM)全解读.pdf

大型语言模型 LLM：2023 年完整指南.pdf

开源大语言模型(LLM)汇总

高效定制 大型语言模型 (LLM).pdf

LLM原理与ChatPDF实现.pdf

大语言模型开源安全环境报告.pdf

如何利用LLM来设计社交游戏.pdf

2023 AIGC大型语言模型(LLM)实例代码合集.zip

全新大语言模型驱动的Agent.pdf.zip

大语言模型的工作原理与发展.pdf

最新资源

高效定制大型语言模型 (LLM).pdf