首页transformer预训练模型T5调用

transformer预训练模型T5调用

时间: 2024-02-28 15:51:10 浏览: 206

T5（Text-to-Text Transfer Transformer）是一种基于Transformer架构的预训练模型，由Google开发。它在多个自然语言处理任务上取得了很好的效果，包括文本摘要、翻译、问答等。要使用T5模型进行文本转换任务，可以使用Hugging Face提供的transformers库。以下是一个使用T5模型进行文本转换的示例代码： ```python from transformers import T5Tokenizer, T5ForConditionalGeneration # 加载T5模型和分词器 model_name = 't5-base' tokenizer = T5Tokenizer.from_pretrained(model_name) model = T5ForConditionalGeneration.from_pretrained(model_name) # 输入文本 input_text = "Translate this sentence to French: Hello, how are you?" # 对输入文本进行编码 input_ids = tokenizer.encode(input_text, return_tensors='pt') # 使用T5模型进行文本转换 output = model.generate(input_ids) # 解码输出文本 output_text = tokenizer.decode(output[0], skip_special_tokens=True) print("Output:", output_text) ``` 在上述代码中，我们首先加载了T5模型和分词器。然后，我们提供了一个输入文本，并使用分词器对其进行编码。接下来，我们使用T5模型的generate方法生成输出。最后，我们使用分词器对输出进行解码，并打印出结果。需要注意的是，上述代码中使用的是T5的基础模型（t5-base），你还可以根据具体任务的需求选择其他预训练模型，如t5-large、t5-3b等。

阅读全文