怎么将将会计截止日期的年份小于等于2018的存为训练集数据train,大于2018的数据存入test。
时间: 2024-02-22 19:59:07 浏览: 15
假设您有一个名为 `df` 的 Pandas DataFrame,其中包含一个名为 `fiscal_year_end` 的列,可以按照以下方式将数据拆分为训练集和测试集:
```python
import pandas as pd
# 读取数据到 Pandas DataFrame
df = pd.read_csv('your_data.csv')
# 将 'fiscal_year_end' 列转换为 datetime 对象
df['fiscal_year_end'] = pd.to_datetime(df['fiscal_year_end'])
# 将小于等于 2018 年的行分配给训练集,其余行分配给测试集
train = df[df['fiscal_year_end'].dt.year <= 2018]
test = df[df['fiscal_year_end'].dt.year > 2018]
# 打印训练集和测试集的行数
print('Train set:', len(train))
print('Test set:', len(test))
```
在上述代码中,我们使用 `pd.to_datetime()` 将 `fiscal_year_end` 列转换为 datetime 对象,并使用 `dt.year` 访问每个 datetime 对象的年份。然后,我们使用类似于 `df[df['fiscal_year_end'].dt.year <= 2018]` 的语句将小于等于 2018 年的行分配给训练集 `train`,将其他行分配给测试集 `test`。最后,我们打印训练集和测试集的行数。
相关推荐
![py](https://img-home.csdnimg.cn/images/20210720083646.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)