pd.read_hdf
时间: 2023-11-11 17:55:46 浏览: 57
pd.read_hdf()是一个Pandas库中的函数,用于从HDF5文件中读取数据。HDF5是一种存储和组织大型数据集的文件格式。这个函数需要指定文件路径和键值,以读取HDF5文件中的特定数据集。你可以使用pd.read_hdf(path_or_buf, key=None, **kwargs)来读取HDF5文件,其中path_or_buf是文件路径,key是要读取的键,**kwargs是其他可选的参数。
相关问题
pd.read_hdf报错
当使用pd.read_hdf函数时,报错可能是由于缺少必要的依赖库tables引起的。报错信息"ImportError: Missing optional dependency 'tables'. Use pip or conda to install tables."提示缺少名为tables的可选依赖库。解决此问题的方法是使用pip或conda命令安装tables库。如果您使用的是conda环境,可以尝试使用以下命令来安装tables库:conda install pytables。如果您使用的是pip环境,可以尝试使用以下命令来安装tables库:pip install tables。请确保您的环境中已经安装了正确版本的Python和pandas,例如Python 3.8和pandas 1.2.5。如果问题仍然存在,请检查您的代码是否正确引用了正确的文件路径或格式。引用<span class="em">1</span><span class="em">2</span><span class="em">3</span>
#### 引用[.reference_title]
- *1* *3* [pd.read_hdf报错 ImportError: Missing optional dependency ‘tables‘. Use pip or conda to install ...](https://blog.csdn.net/qq_42179915/article/details/123675901)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"]
- *2* [HDF.rar_hdf_open](https://download.csdn.net/download/weixin_42663213/86710817)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 50%"]
[ .reference_list ]
def select_data(): df = (pd.read_hdf('../data/assets.h5', 'quandl/wiki/prices') .adj_close # 经过调整的价格 .unstack('ticker') .loc['2000':, tickers] .dropna()) df.to_hdf(hdf_store, 'data/real') select_data()
您的代码中的select_data函数是用来从h5文件中选择数据并保存到另一个h5文件中的函数。具体来说,它的功能如下:
1. 从'h5'文件中读取数据:使用pd.read_hdf函数读取'../data/assets.h5'文件中名为'quandl/wiki/prices'的数据。
2. 调整价格:选择读取的数据中的'adj_close'列,这是经过调整的价格。
3. 重组数据:使用unstack函数将数据按照'ticker'列进行重新排列。
4. 筛选数据:选择从'2000'年开始以及指定的'tickers'的数据,并且删除包含缺失值的行。
5. 保存数据:使用to_hdf函数将筛选后的数据保存到'hdf_store'中的'data/real'中。
在代码的最后,调用select_data()函数来执行以上步骤。
相关推荐
![rar](https://img-home.csdnimg.cn/images/20210720083606.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)