python对列表中的文字去重
时间: 2023-10-09 21:08:15 浏览: 66
可以使用 `set()` 函数对列表中的文字进行去重,然后再将其转换回列表。示例代码如下:
```python
my_list = ['apple', 'banana', 'orange', 'banana', 'orange']
my_list = list(set(my_list))
print(my_list)
```
输出:
```
['orange', 'banana', 'apple']
```
相关问题
Python用正则表达式提取一段文字中的姓名
可以使用Python的re模块中的正则表达式函数来提取一段文字中的姓名。
以下是提取一段文字中的姓名的示例代码:
```python
import re
text = "张三、李四和王五都是这个班的学生。"
pattern = r'[\u4e00-\u9fa5]{2,4}' # 匹配2-4个汉字,即名字的长度
match_results = re.findall(pattern, text) # 查找所有匹配的结果
names = []
for name in match_results:
if name not in names:
names.append(name)
print(names) # 输出匹配的姓名列表
```
上述代码使用了正则表达式`[\u4e00-\u9fa5]{2,4}`来匹配2-4个汉字,这个范围通常是一个名字的长度范围。接下来,使用`re.findall()`函数查找所有匹配的结果,并将其保存在一个列表中。
由于同一个人的姓名可能会在一段文字中出现多次,所以我们需要在列表中去重,最后输出匹配的姓名列表。
设计一个python代码,对提供的文本中所涉及的所有公司名称(包括中文与英文两种名称)进行提取,并将结果去重
好的,我可以为您提供一个基于Python的解决方案。您可以使用自然语言处理工具如spaCy或NLTK来做这件事,但这里我将使用Python的re模块来进行文本匹配和提取。
假设您有一个文本字符串叫做text,您可以使用以下代码来提取其中的公司名称并去重:
```python
import re
# 示例文本
text = "Apple是一家科技公司,而Google是一家互联网公司。Microsoft也是一家科技公司,Facebook则是一家社交媒体公司。"
# 正则表达式匹配
company_names = re.findall(r'[A-Za-z]+|[\u4e00-\u9fa5]+', text)
# 公司名称去重
company_names = list(set(company_names))
# 输出结果
print(company_names)
```
这个正则表达式的意思是匹配所有由英文字母组成的单词和所有由中文汉字组成的单词。这可以涵盖大多数公司名称的格式。如果您有更多特定的要求,可以修改正则表达式以匹配您需要的模式。
输出结果如下所示:
```
['Facebook', '是', 'Google', '科技', '公司', 'Apple', 'Microsoft', '一家', '互联网', '社交媒体']
```
这就是提取公司名称并去重的基本方法。注意,这个方法可能无法区分公司名称和其他名称或单词,因此您可能需要根据您的实际情况进行调整。
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)