按照Excel表格中网址列表,依次打开网页并提出标题和问题,存储到TXT格式文件中,使用python代码
时间: 2024-05-01 14:24:04 浏览: 119
python实现Excel文件转换为TXT文件
5星 · 资源好评率100%
下面是一个示例代码,可以帮助您完成所需的任务:
```
import openpyxl # 导入 openpyxl 库
import requests # 导入 requests 库
from bs4 import BeautifulSoup # 导入 BeautifulSoup 库
# 从 Excel 表中读取网址列表
# 请注意,您需要在下面的代码中替换 "file.xlsx" 为您的 Excel 文件的名称
# 并且替换 "Sheet1" 为您的工作表的名称
# 并且替换 "A1:A10" 为您的网址列表所在的单元格区域
workbook = openpyxl.load_workbook("file.xlsx")
worksheet = workbook["Sheet1"]
urls = [cell.value for row in worksheet["A1:A10"] for cell in row]
# 遍历网址列表,依次打开网页并提取标题和问题
titles_and_questions = []
for url in urls:
response = requests.get(url)
soup = BeautifulSoup(response.text, "html.parser")
title = soup.find("title").text
question = soup.find("p").text
titles_and_questions.append((title, question))
# 将标题和问题写入 TXT 文件
with open("output.txt", "w") as f:
for title, question in titles_and_questions:
f.write(title + "\n")
f.write(question + "\n")
```
请注意,这仅仅是一个示例代码,可能需要根据实际情况进行修改。例如,您可能需要调整网址列表的单元格区域,或者调整代码中的 HTML 元素选择器,以确保正确地提取标题和问题。
阅读全文