首页使用Python编写程序，爬取网页内容并将其写入CSV文件中

使用Python编写程序，爬取网页内容并将其写入CSV文件中

时间: 2024-04-19 07:27:34 浏览: 13

当然可以！以下是一个简单的示例代码，使用Python中的requests和BeautifulSoup库来爬取网页内容并将其写入CSV文件中： ```python import csv import requests from bs4 import BeautifulSoup def crawl_website(url): # 发起GET请求 response = requests.get(url) # 解析HTML内容 soup = BeautifulSoup(response.text, 'html.parser') # 找到需要的数据 data = [] # 假设你要爬取的网页上有一个表格，每行有两列数据 table = soup.find('table') # 假设表格在HTML中的标签是<table> rows = table.find_all('tr') # 假设每行在HTML中的标签是<tr> for row in rows: cols = row.find_all('td') # 假设每列在HTML中的标签是<td> if len(cols) == 2: # 假设每行都有两列数据 data.append([cols[0].text.strip(), cols[1].text.strip()]) # 将每一行的两列数据添加到data列表中 return data def write_to_csv(data, filename): # 将数据写入CSV文件 with open(filename, 'w', newline='') as file: writer = csv.writer(file) writer.writerow(['Column 1', 'Column 2']) # 写入表头 writer.writerows(data) # 写入数据 # 使用示例 url = 'https://example.com' # 替换为你要爬取的网页URL data = crawl_website(url) write_to_csv(data, 'output.csv') # 替换为你想要保存的CSV文件路径 ``` 请注意，上述示例代码是一个基本的框架，你需要根据你要爬取的具体网页的HTML结构来进行适当的修改。另外，请遵守网站的爬取规则和法律法规，确保你的爬虫行为合法合规。