利用Python完成.首先在,三省站点.xlsx 文件中,遍历福建省所有的‘区站号’既A列内容。 2.根据已得福建省的‘区站号’,在 MON 文件夹下遍历出所有福建省文件,每个文件名中都包含区站号,为后五位数字。 3.将第二步所得福建省所有(.txt)文件转为 excel 文件,excel 文件后缀要求.xlsx(所有涉及 到的 excel 文件都要求后缀.xlsx),并且插入表头,‘Year’ ‘Mon’ ‘Day’ ‘PRE’。 4.遍历所有已得 excel 文件的开始年份(站点开始可能年份不一致),将所有站点的开始年 份,写入到新的 excel 文件中,并将其命名为 Starting year,
时间: 2024-04-10 21:34:12 浏览: 178
你可以使用以下代码来完成你的需求:
```python
import os
import pandas as pd
# 读取三省站点.xlsx文件
df = pd.read_excel('三省站点.xlsx')
# 获取福建省的所有区站号
fujian_stations = df[df['省份'] == '福建']['区站号']
# 遍历MON文件夹下的所有福建省文件
mon_folder = 'MON'
fujian_files = []
for filename in os.listdir(mon_folder):
# 检查文件名是否包含福建省的区站号
for station in fujian_stations:
if str(station)[-5:] in filename:
fujian_files.append(os.path.join(mon_folder, filename))
break
# 将所有匹配的TXT文件转化为Excel文件
output_file = '福建省文件.xlsx'
output_df = pd.DataFrame(columns=['Year', 'Mon', 'Day', 'PRE'])
for file in fujian_files:
if file.endswith('.txt'):
txt_df = pd.read_csv(file, sep='\t') # 根据实际的分隔符修改参数
output_df = output_df.append(txt_df)
output_df.to_excel(output_file, index=False)
# 遍历所有已得Excel文件的开始年份
starting_years = {}
for file in fujian_files:
if file.endswith('.xlsx'):
excel_df = pd.read_excel(file)
starting_year = excel_df['Year'].min()
starting_years[os.path.basename(file)] = starting_year
# 将开始年份写入新的Excel文件
starting_year_file = 'Starting year.xlsx'
starting_year_df = pd.DataFrame(starting_years.items(), columns=['文件名', '开始年份'])
starting_year_df.to_excel(starting_year_file, index=False)
```
请确保将代码中的文件名和文件夹名字按照实际情况进行修改。此代码将遍历三省站点.xlsx文件中的区站号,并在MON文件夹下查找包含福建省区站号的文件(以.txt和.xlsx结尾)。然后将这些TXT文件转化为一个Excel文件,并添加表头。接着,遍历所有已得Excel文件的开始年份,并将这些信息写入一个新的Excel文件中,文件名为"Starting year.xlsx"。
阅读全文