查看每一列的缺失值数量 并将每一列缺失指数量的结果存成dataframe
时间: 2024-03-06 08:51:57 浏览: 23
您可以使用以下代码来查看每一列的缺失值数量,并将结果存储为一个DataFrame:
```python
import pandas as pd
# 读取数据文件
df = pd.read_csv("your_data_file.csv")
# 查看每一列的缺失值数量
missing_values = df.isnull().sum()
# 将结果存储为DataFrame
missing_df = pd.DataFrame(missing_values, columns=["Missing_Values"])
# 打印结果
print(missing_df)
```
其中,`df.isnull()`会返回一个DataFrame,其中缺失值为True,否则为False;`sum()`函数会对每一列进行求和,返回每一列的缺失值总数。接着,我们将缺失值数量存储为一个新的DataFrame,并指定列名为"Missing_Values"。最后,打印结果即可。
相关问题
怎么将csv文件每一列的缺失值存成Dataframe
您可以使用Python中的pandas库来读取csv文件,并将每一列的缺失值存储为一个新的DataFrame。以下是一个示例代码:
``` python
import pandas as pd
# 读取csv文件
df = pd.read_csv("your_csv_file.csv")
# 获取每一列的缺失值
missing_values = df.isnull().sum()
# 将缺失值存储为新的DataFrame
missing_df = pd.DataFrame({'column_name': df.columns, 'missing_count': missing_values})
# 打印新的DataFrame
print(missing_df)
```
这段代码将读取名为“your_csv_file.csv”的csv文件,获取每一列的缺失值数量,并将这些缺失值存储为名为“missing_df”的新DataFrame。您可以根据需要修改代码来满足您的需求。
怎么将缺失值数量的Dataframe倒排结果存为一列新数据
您可以使用pandas库中的`isna()`和`sum()`函数来确定每列中缺失值的数量,并使用`sort_values()`函数进行倒排排序。最后,您可以使用`reset_index()`函数来将结果转换为一个新的DataFrame并将缺失值数量存储在一列中。以下是示例代码:
```python
import pandas as pd
# 创建一个示例DataFrame
df = pd.DataFrame({'A': [1, 2, 3, 4, None], 'B': [5, None, 7, None, 9], 'C': [10, 11, 12, 13, 14]})
# 确定每列中缺失值的数量
missing_values = df.isna().sum()
# 进行倒排排序
missing_values_sorted = missing_values.sort_values(ascending=False)
# 将结果转换为一个新的DataFrame并将缺失值数量存储在一列中
result_df = missing_values_sorted.reset_index()
result_df.columns = ['Column', 'Missing Values']
# 输出结果
print(result_df)
```
输出结果为:
```
Column Missing Values
0 B 2
1 A 1
2 C 0
```
在这个示例中,我们首先使用`isna()`函数确定每列中缺失值的数量。然后,我们使用`sort_values()`函数将结果进行倒排排序,并使用`reset_index()`函数将结果转换为一个新的DataFrame。最后,我们将新DataFrame的列名修改为“Column”和“Missing Values”,并输出结果。