在代码import random import pandas as pd from datetime import datetime, timedelta start_date = datetime(2023, 1, 1) end_date = datetime(2023, 12, 31) dates = [] sales = [] for i in range((end_date - start_date).days + 1): date = start_date + timedelta(days=i) sales_amt = round(random.uniform(300, 600), 2) dates.append(date) sales.append(sales_amt) data = {'日期': dates, '销售额': sales} df = pd.DataFrame(data) print(df) 产生的DataFrame保存为excel文件。
时间: 2023-11-12 08:04:20 浏览: 78
可以使用pandas中的to_excel方法将DataFrame保存为excel文件,代码如下:
```python
import random
import pandas as pd
from datetime import datetime, timedelta
start_date = datetime(2023, 1, 1)
end_date = datetime(2023, 12, 31)
dates = []
sales = []
for i in range((end_date - start_date).days + 1):
date = start_date + timedelta(days=i)
sales_amt = round(random.uniform(300, 600), 2)
dates.append(date)
sales.append(sales_amt)
data = {'日期': dates, '销售额': sales}
df = pd.DataFrame(data)
# 保存为excel文件
df.to_excel('sales_data.xlsx', index=False)
```
这样就会在当前目录下生成一个名为sales_data.xlsx的excel文件,其中包含DataFrame数据。注意,to_excel方法的参数index=False表示不保存索引列。
相关问题
import numpy as np from datetime import datetime, timedelta import pandas as pd test = pd.read_excel("C:\\Users\\1data\\Desktop\\DBM成本收入核算\\test.xlsx") start_date = pd.to_datetime(test['合同开始日期']) end_date = pd.to_datetime(test['合同截止日期']) test['合同周期月数'] = round((end_date - start_date) / np.timedelta64(1, 'M')) start_date_col = '合同开始日期' end_date_col = '合同截止日期' new_col = '日期' for index, row in test.iterrows(): start_date = pd.to_datetime(row[start_date_col]) end_date = pd.to_datetime(row[end_date_col]) date_list = [] if start_date.day <= 15: while start_date <= end_date: date_list.append(start_date) start_date = start_date + timedelta(days=30) else: start_date = start_date + timedelta(days=30) while start_date <= end_date + timedelta(days=30): date_list.append(start_date) start_date = start_date + timedelta(days=30) test.loc[index, new_col] = ','.join([str(date.date()) for date in date_list]) df_tmp=test['日期'].str.split(',',expand=True) df_tmp=df_tmp.stack() df_tmp = df_tmp.reset_index(level=1,drop=True) df_tmp.name='日期' df_new = test.drop(['日期'], axis=1).join(df_tmp).reset_index().drop(columns='index') print(df_new) df_new.to_excel('income_test.xlsx',index=False) 将这段代码导出的excel中合同开始日期字段不显示时分秒且新增日期字段的取年月的字段合同周期年月
要将导出的 Excel 中的合同开始日期字段只显示年月日,可以使用 pandas 的 to_datetime 方法中的 strftime 函数将日期格式化为字符串再导出到 Excel 中。修改代码如下:
```
import numpy as np
from datetime import datetime, timedelta
import pandas as pd
test = pd.read_excel("C:\\Users\\1data\\Desktop\\DBM成本收入核算\\test.xlsx")
start_date = pd.to_datetime(test['合同开始日期'])
end_date = pd.to_datetime(test['合同截止日期'])
test['合同周期月数'] = round((end_date - start_date) / np.timedelta64(1, 'M'))
start_date_col = '合同开始日期'
end_date_col = '合同截止日期'
new_col = '日期'
for index, row in test.iterrows():
start_date = pd.to_datetime(row[start_date_col])
end_date = pd.to_datetime(row[end_date_col])
date_list = []
if start_date.day <= 15:
while start_date <= end_date:
date_list.append(start_date)
start_date = start_date + timedelta(days=30)
else:
start_date = start_date + timedelta(days=30)
while start_date <= end_date + timedelta(days=30):
date_list.append(start_date)
start_date = start_date + timedelta(days=30)
# 格式化日期字符串为年月日
date_str_list = [date.strftime('%Y-%m-%d') for date in date_list]
test.loc[index, new_col] = ','.join(date_str_list)
# 将日期字段拆分为多列
df_tmp = test['日期'].str.split(',', expand=True)
df_tmp = df_tmp.stack()
df_tmp = df_tmp.reset_index(level=1, drop=True)
df_tmp.name = '日期'
# 将拆分后的日期列与原始 DataFrame 合并
df_new = pd.concat([test.drop(['日期'], axis=1), df_tmp], axis=1)
df_new = df_new.reset_index().drop(columns='index')
# 计算合同周期年月
df_new['合同周期年月'] = df_new['合同周期月数'].apply(lambda x: f"{int(x//12)}年{int(x%12)}月")
# 导出到 Excel
df_new.to_excel('income_test.xlsx', index=False)
```
这样导出的 Excel 文件中的合同开始日期字段只显示年月日,而新增日期字段的取年月的字段合同周期年月也被计算出来了。
from datetime import datetime, timedelta import pandas as pd test = pd.read_excel("C:\\Users\\1data\\Desktop\\DBM成本收入核算\\test.xlsx") # 定义开始日期和结束日期的列名 start_date_col = test['合同开始日期'] end_date_col = test['合同截止日期'] # 定义新列名 new_col = '日期' # 遍历每一行数据 for index, row in test.iterrows(): start_date = row[start_date_col] end_date = row[end_date_col] date_list = [] # 判断开始日期在每月15号之前还是之后 if start_date.day <= 15: # 开始日期在每月15号之前,直接逐月累加 while start_date <= end_date: date_list.append(start_date) start_date = start_date + timedelta(days=30) else: # 开始日期在每月15号之后,推迟一个月再逐月累加 start_date = start_date + timedelta(days=30) while start_date <= end_date + timedelta(days=30): date_list.append(start_date) start_date = start_date + timedelta(days=30) # 在原表后追加新列 test.loc[index, new_col] = ','.join([str(date.date()) for date in date_list]) # 输出结果 print(test)以上这段代码报错AttributeError: 'Series' object has no attribute 'day',如何修改
这个错误通常是因为 `start_date_col` 和 `end_date_col` 被赋值为 Series 对象而不是列名。在 Pandas 中,当你使用 DataFrame 的列名来访问某一列时,返回的是一个 Series 对象。因此,在这种情况下,你应该直接将列名传递给 `start_date_col` 和 `end_date_col` 变量,而不是使用 Series 对象。
另外,你需要将 `start_date` 和 `end_date` 转换为 datetime 对象,以便你可以在它们上面调用 `day` 属性。你可以使用 Pandas 的 `to_datetime()` 函数将字符串列转换为 datetime 对象。例如:
``` python
from datetime import datetime, timedelta
import pandas as pd
test = pd.read_excel("C:\\Users\\1data\\Desktop\\DBM成本收入核算\\test.xlsx")
# 定义开始日期和结束日期的列名
start_date_col = '合同开始日期'
end_date_col = '合同截止日期'
# 定义新列名
new_col = '日期'
# 遍历每一行数据
for index, row in test.iterrows():
start_date = pd.to_datetime(row[start_date_col]) # 将字符串转换为 datetime 对象
end_date = pd.to_datetime(row[end_date_col]) # 将字符串转换为 datetime 对象
date_list = []
# 判断开始日期在每月15号之前还是之后
if start_date.day <= 15:
# 开始日期在每月15号之前,直接逐月累加
while start_date <= end_date:
date_list.append(start_date)
start_date = start_date + timedelta(days=30)
else:
# 开始日期在每月15号之后,推迟一个月再逐月累加
start_date = start_date + timedelta(days=30)
while start_date <= end_date + timedelta(days=30):
date_list.append(start_date)
start_date = start_date + timedelta(days=30)
# 在原表后追加新列
test.loc[index, new_col] = ','.join([str(date.date()) for date in date_list])
# 输出结果
print(test)
```
这应该可以解决你遇到的问题。
阅读全文