datas = pd.read_csv("贝壳二手房列表).csv",index_col=["houseinfo","价格","单价","当前时间1"],encoding="gbk")
时间: 2023-11-20 19:58:48 浏览: 41
根据提供的代码,可以看出这是使用pandas库中的read_csv函数读取csv文件,并将"houseinfo"、"价格"、"单价"、"当前时间1"这四列作为索引列,编码方式为gbk。但是代码中的文件名似乎有误,应该是"贝壳二手房列表.csv"而不是"贝壳二手房列表).csv"。
需要注意的是,如果文件名或路径有误,会导致读取失败。此外,如果文件中的数据格式有误,也可能会导致读取失败或读取结果不正确。
相关问题
datas = pd.read_csv("/home/zyy/Atime/Autoformer_me/data/7m.csv") AttributeError: 'numpy.ndarray' object has no attribute 'read_csv'怎么解决
这个错误的原因是使用了`numpy.ndarray`对象调用了`read_csv`方法,而`read_csv`方法是`pandas`库中的一个函数,所以需要将数据类型转换为`pandas`的`DataFrame`对象。
你可以尝试将数据读取为`DataFrame`对象,然后再进行相关操作。具体代码如下:
```python
import pandas as pd
# 读取csv文件为DataFrame对象
datas = pd.read_csv('/home/zyy/Atime/Autoformer_me/data/7m.csv')
# 进行相关操作
# ...
# 将修改后的数据写入新的csv文件
datas.to_csv('/home/zyy/Atime/Autoformer_me/data/new_7m.csv', index=False)
```
如果你已经有了`numpy.ndarray`对象,可以使用`pandas`中的`DataFrame`函数将其转换为`DataFrame`对象,具体代码如下:
```python
import pandas as pd
import numpy as np
# 生成numpy.ndarray对象
arr = np.array([[1, 2], [3, 4]])
# 将numpy.ndarray对象转换为DataFrame对象
datas = pd.DataFrame(arr)
# 进行相关操作
# ...
# 将修改后的数据写入新的csv文件
datas.to_csv('/home/zyy/Atime/Autoformer_me/data/new_7m.csv', index=False)
```
希望这些代码可以帮助到你。
调试并运行下述案例代码,给代码做注释。在此基础上补充票房 TOP10 的柱状 图展示。 import pandas as pd import numpy as np from matplotlib import pyplot as plt from matplotlib.ticker import MultipleLocator datas = pd.read_csv(r'2015-2020.txt', index_col=0) datas = datas.sort_index(ascending=False) datas = pd.DataFrame(datas.values, index=range(1, 11), \ columns=datas.columns) data2020 = pd.read_csv(r'2020.txt') def drawLines(): ax = plt.subplot(131) for date in datas.columns: plt.plot([10 - i for i in range(datas.shape[0])], \ datas[date], label=date) plt.ylim(0, 600000) ymajorLocator = MultipleLocator(50000) xmajorLocator = MultipleLocator(1) ax.yaxis.set_major_locator(ymajorLocator) ax.xaxis.set_major_locator(xmajorLocator) plt.title('2015-2020 年度票房 Top10 折线图') plt.xlabel('票房名次') plt.grid() plt.legend() def drawPie(): plt.subplot(233) plt.pie(datas['2019'], autopct='%1.1f%%') plt.title('2019 年度票房 Top10 饼图') plt.subplot(236) plt.rcParams['font.sans-serif'] = ['SimHei'] plt.rcParams['font.family'] = 'sans-serif' plt.pie(data2020['boxoffice'], autopct='%1.1f%%', \ labels=data2020['name']) plt.title('2020 年度票房 Top10 饼图') if __name__ == '__main__': plt.subplots(figsize=(20, 8)) drawLines() drawPie() plt.show()
```python
# 导入 pandas, numpy, pyplot 和 MultipleLocator 库
import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
from matplotlib.ticker import MultipleLocator
# 读取数据并按照时间降序排序
datas = pd.read_csv(r'2015-2020.txt', index_col=0)
datas = datas.sort_index(ascending=False)
# 将数据转换为 DataFrame 格式,索引是票房排名,列是年份
datas = pd.DataFrame(datas.values, index=range(1, 11), columns=datas.columns)
# 读取 2020 年数据
data2020 = pd.read_csv(r'2020.txt')
# 绘制 2015-2020 年度票房 Top10 折线图
def drawLines():
ax = plt.subplot(131) # 创建子图
for date in datas.columns: # 循环每年的票房数据
plt.plot([10 - i for i in range(datas.shape[0])], datas[date], label=date) # 绘制折线图
plt.ylim(0, 600000) # 设置 y 轴范围
ymajorLocator = MultipleLocator(50000) # 设置 y 轴主刻度
xmajorLocator = MultipleLocator(1) # 设置 x 轴主刻度
ax.yaxis.set_major_locator(ymajorLocator) # 设置 y 轴主刻度
ax.xaxis.set_major_locator(xmajorLocator) # 设置 x 轴主刻度
plt.title('2015-2020 年度票房 Top10 折线图') # 设置标题
plt.xlabel('票房名次') # 设置 x 轴标签
plt.grid() # 显示网格线
plt.legend() # 显示图例
# 绘制 2019 年度票房 Top10 饼图和 2020 年度票房 Top10 饼图
def drawPie():
plt.subplot(233) # 创建子图
plt.pie(datas['2019'], autopct='%1.1f%%') # 绘制饼图
plt.title('2019 年度票房 Top10 饼图') # 设置标题
plt.subplot(236) # 创建子图
plt.rcParams['font.sans-serif'] = ['SimHei'] # 设置字体
plt.rcParams['font.family'] = 'sans-serif'
plt.pie(data2020['boxoffice'], autopct='%1.1f%%', labels=data2020['name']) # 绘制饼图
plt.title('2020 年度票房 Top10 饼图') # 设置标题
if __name__ == '__main__':
plt.subplots(figsize=(20, 8)) # 创建画布
drawLines() # 绘制折线图
drawPie() # 绘制饼图
plt.show() # 显示图形
```
补充票房 TOP10 的柱状图展示如下:
```python
import pandas as pd
import numpy as np
from matplotlib import pyplot as plt
# 读取数据并按照时间降序排序
datas = pd.read_csv(r'2015-2020.txt', index_col=0)
datas = datas.sort_index(ascending=False)
datas = pd.DataFrame(datas.values, index=range(1, 11), columns=datas.columns)
# 绘制柱状图
plt.subplots(figsize=(20, 8))
plt.bar(datas.index, datas['2020'])
plt.xticks(datas.index, datas.index)
plt.title('2020 年度票房 Top10 柱状图')
plt.xlabel('票房排名')
plt.ylabel('票房(万元)')
plt.show()
```
柱状图展示如下:
注意:柱状图只显示了 2020 年的数据。如果需要同时显示所有年份的数据,可以将 `datas` DataFrame 中的数据按照年份分组,再分别绘制柱状图,并将柱状图放在同一张图中。