首页bert ner输入

bert ner输入

时间: 2023-11-12 17:55:50 浏览: 134

BERT_NER

BERT NER的输入格式可以通过设置return_offsets_mapping=True来获取word_ids属性。由于BERT的词表会将一些词切分为后缀形式，因此在tokenize过程中需要记住这些词被切分成了哪几个词，并将输出结果相应地标记。例如，如果"Hacker"代表B-PER，在tokenize之后可能分解为["Hack", "##er"]，那么需要将输出结果标记为["B-PER", "B-PER"]。

阅读全文