Python从sitemap里提取链接,如果是sitemap-index则抓取xml文件,再通过xml文件抓取url和时间,把url和时间放在一起,存入sqlite数据库
时间: 2023-04-02 13:03:57 浏览: 91
利用Python3分析sitemap.xml并抓取导出全站链接详解
你可以使用Python的requests和BeautifulSoup库来从sitemap中提取链接。如果是sitemap-index,则需要先抓取xml文件,然后再从xml文件中抓取url和时间。可以使用Python的xml库来解析xml文件。最后,将url和时间放在一起,存入sqlite数据库中。
阅读全文