首页from requests_html import HTMLSession import csv session = HTMLSession() file = open('movies.csv', 'w', newline='') csvwriter = csv.writer(file) csvwriter.writerow(['名称', '年份']) links = ['https://movie.douban.com/subject/1292052/', 'https://movie.douban.com/subject/26752088/', 'https://movie.douban.com/subject/1962665/'] for link in links: r = session.get(link) title = r.html.find('#content > h1 > span:nth-child(1)', first=True) year = r.html.find('#content > h1 > span.year', first=True) csvwriter.writerow(title.text, year.text) file.close()

from requests_html import HTMLSession import csv session = HTMLSession() file = open('movies.csv', 'w', newline='') csvwriter = csv.writer(file) csvwriter.writerow(['名称', '年份']) links = ['https://movie.douban.com/subject/1292052/', 'https://movie.douban.com/subject/26752088/', 'https://movie.douban.com/subject/1962665/'] for link in links: r = session.get(link) title = r.html.find('#content > h1 > span:nth-child(1)', first=True) year = r.html.find('#content > h1 > span.year', first=True) csvwriter.writerow(title.text, year.text) file.close()

时间: 2024-03-14 21:49:24 浏览: 106

html转成csv文件

4星 · 用户满意度95%

如html格式的文件，很难进行数据处理，本软件将html格式的文件转化为CSV文件以作进一步处理。

这段代码是用Python爬虫爬取豆瓣电影的名称和年份，并将结果以CSV文件的形式保存。它使用了requests_html库来发送HTTP请求和解析HTML页面，使用了csv库来处理CSV文件。具体来说，它首先定义了一个HTMLSession对象，然后打开一个CSV文件并写入表头。接着，它循环遍历电影链接列表，对于每个链接，发送HTTP请求并解析页面中的电影名称和年份，然后将它们写入CSV文件中。最后，它关闭CSV文件。

阅读全文