首页bert-bilstm-crf 数据格式

bert-bilstm-crf 数据格式

时间: 2023-06-30 21:09:06 浏览: 199

BERT-BiLSTM-CRF-master.zip

命名实体识别代码，解压即可用 # BERT-BiLSTM-CRF BERT-BiLSTM-CRF的Keras版实现 ## BERT配置 1. 首先需要下载Pre-trained的BERT模型，本文用的是Google开源的中文BERT模型： - https://storage.googleapis.com/bert_models/2018_11_03/chinese_L-12_H-768_A-12.zip 2. 安装BERT客户端和服务器 pip install bert-serving-server pip install bert-serving-client，源项目如下： - https://github.com/hanxiao/bert-as-service 3. 打开服务器，在BERT根目录下，打开终端，输入命令： - bert-serving-start -pooling_strategy NONE -max_seq_len 144 -mask_cls_sep -model_dir chinese_L-12_H-768_A-12/ -num_worker 1

BERT-BiLSTM-CRF是一种序列标注模型，用于解决文本分类等任务。其输入数据格式通常是以下三种之一： 1. 每行为一个字符，每个字符后面跟着其对应的标签，字符和标签之间用空格隔开，不同句子之间用空行隔开。例如： ``` 我 O 爱 O 自 B-PER 然 I-PER 而 O 你 O 呢 O ？ O ``` 2. 每行为一个字符及其对应的标签，每个句子之间用空行隔开。例如： ``` 我 O 爱 O 自 B-PER 然 I-PER 而 O 你 O 呢 O ？ O ``` 3. 每行为一个句子，句子中的词语用空格隔开，每个词语后面跟着其对应的标签，词语和标签之间用“/”隔开。例如： ``` 我/O 爱/O 自/B-PER 然/I-PER 而/O 你/O 呢/O ？/O ``` 其中，B表示实体的开始，I表示实体的中间部分，O表示非实体部分。

阅读全文