bert ner输入
时间: 2023-11-12 17:55:50 浏览: 134
BERT_NER
BERT NER的输入格式可以通过设置return_offsets_mapping=True来获取word_ids属性。由于BERT的词表会将一些词切分为后缀形式,因此在tokenize过程中需要记住这些词被切分成了哪几个词,并将输出结果相应地标记。例如,如果"Hacker"代表B-PER,在tokenize之后可能分解为["Hack", "##er"],那么需要将输出结果标记为["B-PER", "B-PER"]。
阅读全文