2.apple数据分析 (1) 导入实验数据‘apple.csv’ (2) 查看每一列的数据类型 (3) 将Date列转化为datetime数据类型 (4) 将Date列设置为行索引 (5) 有重复的日期吗? (6) 将index设置为升序 (7) 选择2012的数据 (8) 选择2012-07数据 (9) 选择2012-07-25数据 (10) 选取2011-12-01之后的数据 (11) 选取2011-12-01之前的数据 (12) 把2013-12-01到2014-05-01之间的数据选出来 (13) 数据集中最早的日期和最晚的日期相差多少天? (14) 以年为单位对数据进行重采样(聚合方式为求平均) (15) 以月为单位对数据进行重采样(聚合方式为求平均) (16) 找到每个月的最后一个交易日(business day) (17) 在数据中一共有多少个月?
时间: 2023-10-10 20:11:05 浏览: 119
截至2024年2月最畅销手机的数据集 CSV(100+记录)
5星 · 资源好评率100%
好的,我会依次回答您的每一个问题。
1. 导入实验数据‘apple.csv’:
```python
import pandas as pd
apple = pd.read_csv('apple.csv')
print(apple.head())
```
2. 查看每一列的数据类型:
```python
print(apple.dtypes)
```
3. 将Date列转化为datetime数据类型:
```python
apple['Date'] = pd.to_datetime(apple['Date'])
print(apple.dtypes)
```
4. 将Date列设置为行索引:
```python
apple = apple.set_index('Date')
print(apple.head())
```
5. 有重复的日期吗?
```python
print(apple.index.duplicated().any())
```
6. 将index设置为升序:
```python
apple = apple.sort_index()
print(apple.head())
```
7. 选择2012的数据:
```python
apple_2012 = apple['2012']
print(apple_2012.head())
```
8. 选择2012-07数据:
```python
apple_2012_07 = apple['2012-07']
print(apple_2012_07.head())
```
9. 选择2012-07-25数据:
```python
apple_2012_07_25 = apple.loc['2012-07-25']
print(apple_2012_07_25)
```
10. 选取2011-12-01之后的数据:
```python
apple_after_2011_12_01 = apple.loc['2011-12-01':]
print(apple_after_2011_12_01.head())
```
11. 选取2011-12-01之前的数据:
```python
apple_before_2011_12_01 = apple.loc[:'2011-12-01']
print(apple_before_2011_12_01.tail())
```
12. 把2013-12-01到2014-05-01之间的数据选出来:
```python
apple_between_2013_12_01_and_2014_05_01 = apple.loc['2013-12-01':'2014-05-01']
print(apple_between_2013_12_01_and_2014_05_01.head())
```
13. 数据集中最早的日期和最晚的日期相差多少天?
```python
days_diff = (apple.index.max() - apple.index.min()).days
print(days_diff)
```
14. 以年为单位对数据进行重采样(聚合方式为求平均):
```python
apple_resampled_yearly = apple.resample('Y').mean()
print(apple_resampled_yearly)
```
15. 以月为单位对数据进行重采样(聚合方式为求平均):
```python
apple_resampled_monthly = apple.resample('M').mean()
print(apple_resampled_monthly)
```
16. 找到每个月的最后一个交易日(business day):
```python
apple_monthly_last_bday = apple.resample('M').apply(lambda x: x.index.max())
print(apple_monthly_last_bday)
```
17. 在数据中一共有多少个月?
```python
num_months = apple.resample('M').size().shape[0]
print(num_months)
```
阅读全文