见US_Crime_Rates_1960_2014.csv数据集 步骤 1. 导入数据 2. 将Year的数据类型转换为 datetime64 3. 将Year设置为DataFrame的索引 4. 对Year进行resample,并进行汇总 5. 计算各种类犯罪在总人口中的占比(单纯的犯罪数量,没有比较没有占比几乎没有意义,所以这里计算占比) 6. 对各类数据占比进行可视化(选做) 7. 美国最危险&最安全的时期 8. 对2020年犯罪率进行预测
时间: 2023-06-10 21:05:48 浏览: 312
R数据挖掘实例
4星 · 用户满意度95%
地区是哪里?
好的,我会根据您的要求回答您的问题。
对于您的第一个问题,见US_Crime_Rates_1960_2014.csv数据集的步骤如下:
1. 首先将数据集导入到Python环境中(例如使用Pandas库进行读取)。
2. 将“Year”列的数据类型转换为datetime64形式,以便后续可以对时间序列进行处理。
3. 将“Year”列设置为数据集的索引,以便后续可以对时间序列进行resample和汇总。
4. 对“Year”进行resample,此时可以选择要按照哪种时间周期进行汇总(例如按年、季度、月份等)。
5. 计算各种类犯罪在总人口中的占比,可以分别计算不同类型犯罪的数量,并与总人口进行比较。
6. 可以对各类型犯罪的占比进行可视化,以便更加直观地展示数据。
7. 美国最危险地区可以通过对不同地区的犯罪数据进行比较得出,这需要根据具体数据集进行分析。
阅读全文