from requests_html import HTMLSession import csv session = HTMLSession() file = open('movies.csv', 'w', newline='') csvwriter = csv.writer(file) csvwriter.writerow(['名称', '年份']) links = ['https://movie.douban.com/subject/1292052/', 'https://movie.douban.com/subject/26752088/', 'https://movie.douban.com/subject/1962665/'] for link in links: r = session.get(link) title = r.html.find('#content > h1 > span:nth-child(1)', first=True) year = r.html.find('#content > h1 > span.year', first=True) csvwriter.writerow(title.text, year.text) file.close()
时间: 2024-03-14 21:49:24 浏览: 106
html转成csv文件
4星 · 用户满意度95%
这段代码是用Python爬虫爬取豆瓣电影的名称和年份,并将结果以CSV文件的形式保存。它使用了requests_html库来发送HTTP请求和解析HTML页面,使用了csv库来处理CSV文件。具体来说,它首先定义了一个HTMLSession对象,然后打开一个CSV文件并写入表头。接着,它循环遍历电影链接列表,对于每个链接,发送HTTP请求并解析页面中的电影名称和年份,然后将它们写入CSV文件中。最后,它关闭CSV文件。
阅读全文