微软 torchscale
时间: 2023-08-31 08:14:35 浏览: 193
微软的TorchScale是一个用于扩展Transformer模型的工具。通过TorchScale,可以轻松地扩大模型规模,并支持任意的网络深度和宽度。这个工具的目标是通过基础性的研究创新,通过数学或理论上的指导和启发,在Transformer模型扩展的工作中取得更好的效果,而不仅仅是通过调参或工程层面的改进来部分缓解问题。使用TorchScale,只需要几行代码就可以实现多模态模型的训练。\[2\]\[3\]
#### 引用[.reference_title]
- *1* *2* [如何高效训练 Transformer?微软亚研院开源TorchScale工具包](https://blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/129153007)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item]
- *3* [让天下没有难训练的大模型,微软亚洲研究院开源TorchScale](https://blog.csdn.net/moxibingdao/article/details/129173440)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^control_2,239^v3^insert_chatgpt"}} ] [.reference_item]
[ .reference_list ]
阅读全文