selenium1.python读取txt文本中的编号（00001，00002，00003…）2.在网页表格编码列中遍历相应信息3.同时在类型列中筛选重点和非重点信息4.提取时间列、单位列、类型列、总数列中对应行的信息5.将提取的数据分别根据类型列的中重点和非重点写入EXCEL

时间: 2024-12-06 12:26:34 浏览: 15

selenium读取txt,xls,csv.docx

在软件测试自动化领域，Selenium 是一个广泛使用的工具，主要用于模拟用户与网页的交互。然而，Selenium 本身并不直接支持读取或写入文件，如文本文件（txt）、电子表格（xls、xlsx）或逗号分隔值文件（csv）。这些功能通常需要结合其他Python库来实现。以下是如何使用Python和相关的库来处理这些文件格式： 1. **读取文本文件 (txt)**: 要读取 `.txt` 文件，我们可以使用Python内置的 `codecs` 库。这个库允许我们指定文件的编码方式，例如 `utf-8`。以下是一个简单的例子： ```python import codecs source = codecs.open("path_to_file/3333test.txt", "r", "utf-8") value = source.readlines() for line in value: print(line) ``` 这段代码会打开指定路径的文本文件，并逐行读取内容。 2. **读取 CSV 文件**: 对于 `.csv` 文件，Python 内置的 `csv` 模块是理想的选择。以下是如何读取 CSV 文件的示例： ```python import csv with open("path_to_file/2222info.csv", "r") as op_csv: csv_reader = csv.reader(op_csv) for row in csv_reader: print(row) ``` 这段代码会遍历 CSV 文件中的每一行并打印出来。 3. **读取 Excel 文件 (xls)**: 在 Python 3 中，对于 `.xls` 文件，我们可以使用 `xlrd` 库。请注意，`xlrd` 不支持 `.xlsx` 格式，对于 `.xlsx` 文件，你需要使用 `openpyxl` 或 `pandas` 库。以下是一个使用 `xlrd` 读取 `.xls` 文件的例子： ```python import xlrd import sys readbook = xlrd.open_workbook_xls("path_to_file/info.xls") sheet_name = readbook.sheet_names() # 打印所有 sheet 名称 sheet = readbook.sheet_by_index(0) # 根据索引读取第一个 sheet # 打印 sheet 信息 print(sheet.name, sheet.nrows, sheet.ncols) # 获取第二列的内容 content = sheet.col_values(1) print(content) # 读取第一行第二列的内容 content1 = sheet.cell(0, 1) print(content1.value) ``` 在实际的自动化测试场景中，这些操作可能会用于读取配置文件、测试数据或者测试结果。例如，你可以用 `.txt` 文件存储配置信息，`.csv` 文件存储测试数据，而 `.xls` 文件则可以用来保存测试报告。通过结合Selenium和其他文件处理库，你可以创建更复杂的自动化测试框架，实现对不同数据源的灵活操作。

在Python中，你可以使用Selenium库配合BeautifulSoup或者pandas等数据处理库来完成这个任务。以下是步骤概述： 1. **读取TXT文件中的编号**: 使用`open()`函数读取txt文件，并通过字符串操作或正则表达式解析编号。例如： ```python with open('numbers.txt', 'r') as f: lines = f.readlines() numbers = [line.strip() for line in lines] ``` 2. **网页表单遍历**: 使用Selenium模拟浏览器操作打开网页并定位表格元素，然后使用如`find_elements_by_xpath`或`find_elements_by_css_selector`来获取所有单元格。 3. **筛选类型列**: 通过元素属性（如`text`）判断重点和非重点信息，比如包含特定关键词的单元格被视为重点。 4. **提取数据**: 对每个单元格内容做进一步处理，提取时间、单位、类型和总数信息，可以使用`BeautifulSoup`解析HTML，或者直接从`td`标签中提取值。 5. **写入Excel**: 使用pandas库创建DataFrame存储数据，然后使用`to_excel`函数按照类型列的不同值（重点和非重点）写入两个不同的工作表： ```python import pandas as pd df重点 = pd.DataFrame(...) # 重点数据 df非重点 = pd.DataFrame(...) # 非重点数据 df重点.to_excel('output重点关注.xlsx', index=False) df非重点.to_excel('output一般关注.xlsx', index=False) ``` 这里假设`df重点`和`df非重点`已正确填充了数据。

阅读全文

相关推荐

selenium + python 获取table数据的示例讲解

Python自动办公实例-批量更改Excel文件中200多个工作表的内容.zip

selenium1.python根据txt文本中的编号（00001，00002，00003…）2.在指定的网页表格中遍历对应信息3.将指定的数据写入EXCE中

Python3.6+selenium2.53.6自动化测试_读取excel文件的方法

自动化测试实战：Python与Selenium结合的用例读取方法

Selenium2Python自动化测试：csv文件操作与实战序言

Python3 Selenium3 测试框架搭建与定制

python 读取表格数据，自动填写网页表格

python读取EXCEL表格中第一列中的链接打开并截图

使用selenium爬取网页表格

python爬取动态网页图片读取不同text1和text2文件中内容，获取不同cookie1和cookie2信息，爬取相关网页图片并存入本地文件image1和image2

import unittest from time import sleep from ddt import ddt, data, unpack from selenium import webdriver import openpyxl from selenium.webdriver.common.by import By def read_excel(): xlsx = openpyxl.load_workbook("D:\python\project\case\xl.xlsx") #打开路径内的xl

我如何利用python读取excel表格中每个单元格的内容，再将每个单元格里的内容依次粘贴到我所指定的输入框中

python selenium怎么处理动态生成的表格数据与下一页按钮

从一个CSV文件中读取URL，然后访问这些URL并从网页中提取表格数据，最后将所有数据合并到一个DataFrame中并保存到一个新的CSV文件中python代码如何写

python selenium数据驱动excel

Vue + Vite + iClient3D for Cesium 实现限高分析

最新推荐

selenium + python 获取table数据的示例讲解

selenium中get_cookies()和add_cookie（）的用法详解

Python实现爬虫抓取与读写、追加到excel文件操作示例

Vue + Vite + iClient3D for Cesium 实现限高分析

PureMVC AS3在Flash中的实践与演示：HelloFlash案例分析

管理建模和仿真的文件

YRC1000 EtherNet_IP通信协议：掌握连接与数据交换的6个关键策略

如何设置 OpenFileDialog 用户只能在固定文件夹及其子文件夹里选择文件

掌握Makefile多目标编译与清理操作

"互动学习：行动中的多样性与论文攻读经历"