用def函数写出python代码，有注释。用argparse，pandas。功能是能在任何文件夹读取Log并选择分类进行绘图。具体如下： 1.读取log，当读取到最后一次出现"My name is kitty"时，从下一行开始读 2.删除所有重复的行，只留第一行 3.逐行写入csv 4.第1行按照正则规则1提取单词，然后分列，分列后才知道有多少列，分列符号也不知道有几个空格。 5.从第2行开始按照正则规则2分列后，才知道有多少列，分列符号也不知道有几个空格。 6.读取CSV文件Output 7.把标题行分为4类，第一类是标题为ABC,DFG，TBC,DHHG,lop,kki的6列，第二类是CAT开头的几列，第三类是DOG开头的几列，第四类是Fish和food开头的几列 8.把4类标题画成4个曲线图，在一张画布上，标注每条线的标题 9.在一张画布从上到下分成4份，把4类标题画成4个曲线图，颜色随机，刻度比例适当 10.查看4个图的时候，可以使用筛选器，可以让我选择每次看哪个图

时间: 2024-03-10 19:51:15 浏览: 60

python实现读取文件夹下所有excel文件内容上传MySQL数据库，并附带生成log文件，同时上传成功之后清空文件夹

在Python编程中，将文件夹中的所有Excel文件内容读取并导入MySQL数据库是一项常见的任务，尤其在数据处理和分析场景中。以下是如何实现这一过程的详细步骤，同时附带生成日志文件并在上传成功后清空文件夹的功能。确保你已经安装了必要的库，包括`pandas`用于处理Excel文件，`pymysql`或`mysql-connector-python`连接MySQL数据库，以及`logging`模块来记录日志信息。你可以通过以下命令安装： ```bash pip install pandas pymysql logging ``` 1. **读取Excel文件**：使用`pandas`库的`read_excel()`函数可以轻松读取Excel文件。例如，读取一个名为`example.xlsx`的文件： ```python import pandas as pd df = pd.read_excel('example.xlsx') ``` 2. **连接MySQL数据库**：创建一个数据库连接，使用`pymysql`或`mysql-connector-python`。你需要提供数据库的主机名、用户名、密码、数据库名和端口号： ```python import pymysql db = pymysql.connect(host='localhost', user='username', password='password', db='database_name', port=3306) cursor = db.cursor() ``` 3. **将DataFrame写入数据库**：假设DataFrame的列名与数据库表的字段匹配，可以使用`to_sql()`方法将DataFrame直接写入数据库： ```python df.to_sql('table_name', con=db, if_exists='append', index=False) ``` 4. **生成日志文件**：使用`logging`模块创建一个logger，设置日志级别、格式和输出位置： ```python import logging logging.basicConfig(filename='upload.log', level=logging.INFO, format='%(asctime)s - %(levelname)s - %(message)s') ``` 在关键操作处添加日志记录，例如在成功导入数据时： ```python logging.info('Data successfully imported into the database.') ``` 5. **遍历文件夹并上传所有Excel文件**：使用`os`库遍历指定文件夹下的所有Excel文件： ```python import os folder_path = 'path_to_folder' for filename in os.listdir(folder_path): if filename.endswith('.xlsx'): full_path = os.path.join(folder_path, filename) # 读取并上传文件，这里假设文件名和表名相同 df = pd.read_excel(full_path) df.to_sql(filename[:-5], con=db, if_exists='append', index=False) logging.info(f'{filename} imported successfully.') ``` 6. **清空文件夹**：上传完成后，如果希望清空文件夹，可以使用`shutil`库的`rmtree()`函数： ```python import shutil shutil.rmtree(folder_path) logging.info('Folder emptied.') ``` 7. **关闭数据库连接**：别忘了关闭数据库连接： ```python cursor.close() db.close() ``` 整合以上代码，你可以创建一个完整的脚本来实现标题和描述中的功能。这个脚本会读取指定文件夹下的所有Excel文件，将内容导入MySQL数据库，生成日志文件记录过程，并在上传成功后清空文件夹。注意，确保在运行前备份好数据，因为清空文件夹操作是不可逆的。

好的，下面是代码实现： ```python import argparse import pandas as pd import re import matplotlib.pyplot as plt import random # 定义 argparse parser = argparse.ArgumentParser() parser.add_argument("log_file", help="log 文件的路径") parser.add_argument("csv_file", help="CSV 文件的路径") args = parser.parse_args() # 读取 log 文件 with open(args.log_file, 'r') as f: log_lines = f.readlines() # 找到 "My name is kitty" 并从下一行开始读取 start_line = 0 for i, line in enumerate(log_lines): if "My name is kitty" in line: start_line = i + 1 data_lines = log_lines[start_line:] # 删除重复行并写入 csv 文件 with open(args.csv_file, 'w') as f: f.write("line\n") unique_lines = set() for line in data_lines: if line not in unique_lines: unique_lines.add(line) f.write(line) # 读取 csv 文件 data = pd.read_csv(args.csv_file) # 正则规则 1：提取单词 regex1 = re.compile(r"\b\w+\b") matches = regex1.findall(data.iloc[0]["line"]) num_cols = len(matches) # 分列 data = pd.DataFrame([x.split()[:num_cols] for x in data["line"]], columns=matches[:num_cols]) # 正则规则 2：分列 regex2 = re.compile(r"\s+") num_cols = len(regex2.split(data.iloc[1]["line"])) # 分列 data = pd.DataFrame([x.split()[:num_cols] for x in data["line"]], columns=data.columns) # 分类标题 category1 = ["ABC", "DFG", "TBC", "DHHG", "lop", "kki"] category2 = [col for col in data.columns if col.startswith("CAT")] category3 = [col for col in data.columns if col.startswith("DOG")] category4 = [col for col in data.columns if col.startswith(("Fish", "food"))] # 画图 fig, axs = plt.subplots(4, 1, figsize=(10, 12)) # 画分类 1 的图 axs[0].set_title("Category 1") for col in category1: axs[0].plot(data[col], label=col) axs[0].legend() # 画分类 2 的图 axs[1].set_title("Category 2") for col in category2: axs[1].plot(data[col], label=col) axs[1].legend() # 画分类 3 的图 axs[2].set_title("Category 3") for col in category3: axs[2].plot(data[col], label=col) axs[2].legend() # 画分类 4 的图 axs[3].set_title("Category 4") for col in category4: axs[3].plot(data[col], label=col) axs[3].legend() # 随机设置颜色 colors = [plt.cm.tab10(i) for i in range(10)] random.shuffle(colors) # 画随机颜色的图 fig, axs = plt.subplots(4, 1, figsize=(10, 12)) for i, category in enumerate([category1, category2, category3, category4]): axs[i].set_title("Category {}".format(i+1)) for j, col in enumerate(category): axs[i].plot(data[col], label=col, color=colors[j]) axs[i].legend() # 筛选器 plt.show() category = input("Which category do you want to see? ") if category == "1": fig, ax = plt.subplots() ax.set_title("Category 1") for col in category1: ax.plot(data[col], label=col) ax.legend() elif category == "2": fig, ax = plt.subplots() ax.set_title("Category 2") for col in category2: ax.plot(data[col], label=col) ax.legend() elif category == "3": fig, ax = plt.subplots() ax.set_title("Category 3") for col in category3: ax.plot(data[col], label=col) ax.legend() elif category == "4": fig, ax = plt.subplots() ax.set_title("Category 4") for col in category4: ax.plot(data[col], label=col) ax.legend() else: print("Invalid category") ```

阅读全文

相关推荐

在Python中，可以使用内置的csv模块或者pandas库来读取CSV文件 以下是两种方法的示例：

读取文件_读取文件夹里所有文件并提取_python_

Python在机器学习中的基础应用

Python数据组织与检索：字典在列表中应用的最佳实践

【动态图表制作】：IPython交互式绘图，用plotly和ipywidgets

自动化数据报告制作：Python与CSV文件的终极指南

【Python日志可视化】：将日志数据转化为可操作图形和报告的工具

【xlrd深度解析】：揭秘Excel文件读取的后台逻辑与6大优化方法

机器学习结果可视化：用Plotly交互式展示模型结果（技术攻略）

【java毕业设计】校内跑腿业务系统源码（springboot+vue+mysql+说明文档）.zip

【java毕业设计】大学志愿填报系统源码（springboot+vue+mysql+说明文档）.zip

基于java的网吧管理系统答辩PPT.pptx

基于java的基于SSM架构的网上书城系统答辩PPT.pptx

tornado-6.1-cp37-cp37m-win32.whl

气泡排序、插入排序、选择排序、快速排序、希尔排序、堆排序、合并排序-SortAlgorithm.zip

Keyboard Maestro 11.0.3-macwk.dmg

基于微信小程序的鲜花销售微信小程序答辩PPT.pptx

【java毕业设计】智能推荐旅游平台源码（springboot+vue+mysql+说明文档）.zip

最新推荐

Python读取txt某几列绘图的方法

Python使用pandas对数据进行差分运算的方法

使用Python做垃圾分类的原理及实例代码附

Pandas读取并修改excel的示例代码

使用Python Pandas处理亿级数据的方法

Aspose资源包：转PDF无水印学习工具

管理建模和仿真的文件

【R语言高性能计算秘诀】：代码优化，提升分析效率的专家级方法

在构建视频会议系统时，如何通过H.323协议实现音视频流的高效传输，并确保通信的稳定性？

Go语言控制台输入输出操作教程

在Python中，可以使用内置的csv模块或者pandas库来读取CSV文件以下是两种方法的示例：