小于2b的大语言模型有哪些
时间: 2024-05-21 22:08:33 浏览: 23
目前小于2B的大语言模型主要有以下几种:
1. GPT-Neo:由EleutherAI团队开发,是一个开源的模型,参数量约1.3B。
2. DeBERTa:由Microsoft团队开发,参数量约1.5B,在NLU任务上表现较为优秀。
3. Meena:由Google团队开发,参数量约2.6B,主要用于对话生成任务。
4. GShard:由Google团队开发,参数量约1.7B,使用分布式训练技术,可实现更快的训练速度和更大的模型规模。
5. T5:由Google团队开发,参数量约1.3B,可用于多种NLP任务,如文本分类、问答、文本摘要等。
相关问题
miniCPM大模型
MiniCPM大模型是基于MiniCPM-2B的多模态模型MiniCPM-V,其能力超越了基于Phi-2的同参数级别的多模态模型[^1]。MiniCPM大模型的部署相对简单,可以在一台1080/2080显卡上进行高效参数微调,也可以在一台3090/4090显卡上进行全参数微调。此外,MiniCPM大模型的二次开发成本较低,可以在一台机器上持续训练,并且完全开源MiniCPM-2B的模型参数供学术研究和有限商用。未来,MiniCPM团队还计划发布训练过程中的所有Checkpoint和大部分非专有数据,以供模型机理研究。
YEJ2B5系列三相异步电动机有多重
YEJ2B5系列三相异步电动机有两种重量,其中一种是普通型电机的重量,另一种是防爆型电机的重量。普通型电机的重量取决于电机的功率、转速、极数和安装方式等因素,而防爆型电机的重量则会比普通型电机更加重,因为它需要在外壳和内部构造方面增加一些额外的设计和制造要求,以满足防爆的需求。因此,具体的重量需要根据具体的型号和参数来确定。
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)