自定义函数并实现识别文本中的产品名、公司名和技术名 1.创建产品名、公司名和技术名列表
时间: 2024-11-30 22:20:11 浏览: 110
在Python中,我们可以自定义一个函数来识别文本中的产品名、公司名和技术名。首先,你需要准备一些预定义的产品词库、公司词库和技术词库。这里我会给出一个简单的示例,假设我们已经有了三个包含关键词的列表:
```python
# 定义产品名、公司名和技术名的列表
product_keywords = ['iPhone', 'Samsung Galaxy', 'Macbook']
company_keywords = ['Apple', 'Samsung', 'Microsoft']
tech_keywords = ['AI', 'Machine Learning', 'Blockchain']
def extract_entities(text):
# 使用正则表达式或自然语言处理库如NLTK或spaCy进行分词和匹配
from nltk.tokenize import word_tokenize
# 分词
tokens = word_tokenize(text)
# 初始化结果字典
entity_dict = {'products': [], 'companies': [], 'technologies': []}
for token in tokens:
if token.lower() in product_keywords:
entity_dict['products'].append(token)
elif token.lower() in company_keywords:
entity_dict['companies'].append(token)
elif token.lower() in tech_keywords:
entity_dict['technologies'].append(token)
return entity_dict
text_to_check = "Apple's latest iPhone X features advanced AI technology."
entities = extract_entities(text_to_check)
print("产品名:", entities['products'])
print("公司名:", entities['companies'])
print("技术名:", entities['technologies'])
#
阅读全文