python从csv文件中筛选不是互联网或科技公司
时间: 2024-10-17 20:07:13 浏览: 28
在Python中,你可以使用pandas库来读取CSV文件,并通过数据清洗和条件过滤来筛选出非互联网或科技公司的行。以下是简单的步骤:
1. 首先,你需要导入`pandas`模块,它是处理表格数据的强大工具。
```python
import pandas as pd
```
2. 然后,使用`pd.read_csv()`函数加载CSV文件,假设文件名为"data.csv"。
```python
df = pd.read_csv('data.csv')
```
3. 接下来,检查公司类别列。假设这个列叫做`company_type`,并且你想找的是非"互联网"、非"科技"的公司,可以使用`isin()`函数来筛选。
```python
non_technology_companies = df[~df['company_type'].isin(['互联网', '科技'])]
```
这里`~`表示否定操作符,`isin(['互联网', '科技'])`返回一个布尔系列,`~`将其转换为相反的逻辑。
4. 最后,如果你只想保留列名,可以用`.loc`选择特定索引,或者直接打印结果查看。
```python
print(non_technology_companies[['company_name', 'company_type']])
```
相关问题
python从csv文件中筛选不是互联网或科技公司,并保存为csv格式
在Python中,你可以使用pandas库来处理CSV文件并筛选出非互联网或科技公司的数据。假设你的CSV文件包含一个列(比如“行业”)用于标识公司类型。以下是简单的步骤:
```python
import pandas as pd
# 读取CSV文件
df = pd.read_csv('your_file.csv')
# 确定互联网或科技相关的关键词列表
tech_keywords = ['互联网', '科技', 'IT']
# 使用条件筛选行
non_tech_companies = df[~df['行业'].isin(tech_keywords)]
# 检查是否有满足条件的公司(过滤掉全部是科技公司的)
if non_tech_companies.empty:
print("没有找到非互联网或科技公司的记录")
else:
# 保存筛选后的结果到新的CSV文件
non_tech_companies.to_csv('filtered_companies.csv', index=False)
```
在这个例子中,`isin()`函数检查每个公司的行业是否在给定的关键字列表中,如果不在,则保留该行。最后,将结果保存到一个新的CSV文件。
阅读全文