import pandas as pd import numpy as np # 读取数据 df = pd.read_csv('time_series_covid19_confirmed_global.csv') # 查看数据的行与列 print("数据行数：", df.shape[0]) print("数据列数：", df.shape[1]) # 处理缺失值和重复值 df.drop_duplicates(inplace=True) df.dropna(inplace=True) # 删除无关属性 df.drop(['Province/State', 'Lat', 'Long'], axis=1, inplace=True) # 数据规范化 df_norm = (df - df.min()) / (df.max() - df.min()) # 连续属性离散化 bins = [-1, 0.2, 0.4, 0.6, 0.8, 1] df_discrete = pd.cut(df_norm['3/23/20'], bins, labels=[0, 1, 2, 3, 4]) # 输出结果 print("规范化后的数据：\n", df_norm) print("离散化后的数据：\n", df_discrete)，上述python代码中的import pandas as pd import numpy as np # 读取数据 df = pd.read_csv('time_series_covid19_confirmed_global.csv') # 查看数据的行与列 print("数据行数：", df.shape[0]) print("数据列数：", df.shape[1]) # 处理缺失值和重复值 df.drop_duplicates(inplace=True) df.dropna(inplace=True) # 删除无关属性 df.drop(['Province/State', 'Lat', 'Long'], axis=1, inplace=True) # 数据规范化 df_norm = (df - df.min()) / (df.max() - df.min()) # 连续属性离散化 bins = [-1, 0.2, 0.4, 0.6, 0.8, 1] df_discrete = pd.cut(df_norm['3/23/20'], bins, labels=[0, 1, 2, 3, 4]) # 输出结果 print("规范化后的数据：\n", df_norm) print("离散化后的数据：\n", df_discrete)如何解决？

时间: 2024-02-19 21:01:13 浏览: 119

这段代码中似乎没有明显的错误，但是如果你在运行代码时遇到了问题，可以检查以下几个方面： 1. 文件路径是否正确。确保你已将数据文件' time_series_covid19_confirmed_global.csv '放在正确的位置，并且文件路径与代码中的路径一致。 2. 数据文件中是否存在缺失值或重复值。如果存在，则在对数据进行规范化和离散化之前，你需要先处理这些问题。你可以尝试使用drop_duplicates()和dropna()方法来删除重复值和缺失值。 3. 数据是否已正确地离散化。你可以检查输出结果，确保df_discrete是一个包含分类标签的Series对象。如果你遇到了其他错误，请提供更多的上下文或错误信息，以便我能够更好地帮助你解决问题。

相关问题

我需要在一个csv文件里选取部分列存储到另一个csv文件中，使用python帮我补全代码import pandas as pd import numpy as np df_orgin = pd.read_csv('C:/Users/86188/Desktop/spark大作业数据集/covid.csv')

好的，以下是代码示例： ```python import pandas as pd import numpy as np # 读取原始csv文件 df_origin = pd.read_csv('C:/Users/86188/Desktop/spark大作业数据集/covid.csv') # 选择需要的列 columns_to_keep = ['column1', 'column2', 'column3'] df_new = df_origin[columns_to_keep] # 存储到新的csv文件 df_new.to_csv('C:/Users/86188/Desktop/spark大作业数据集/new_covid.csv', index=False) ``` 其中，`columns_to_keep` 是需要保留的列的列名列表，可以根据实际需求进行修改。`index=False` 表示不在输出文件中包含行索引。

阅读全文

相关推荐

CSDN会员

开通CSDN年卡参与万元壕礼抽奖

海量 VIP免费资源千本正版电子书商城会员专享价千门课程&专栏

全年可省5,000元立即开通