python爬取人民网标题和链接并用sqlite保存在数据库中

时间: 2023-11-13 17:04:41 浏览: 41
好的,以下是Python爬取人民网标题和链接并用sqlite保存在数据库中的代码示例: ```python import requests from bs4 import BeautifulSoup import sqlite3 # 请求人民网国内新闻页面 url = 'http://world.people.com.cn/GB/1015/index1.html' r = requests.get(url) # 解析HTML页面 soup = BeautifulSoup(r.content, 'html.parser') # 获取新闻标题和链接 news_list = soup.find_all('div', class_='title') title_list = [n.find('a').get_text() for n in news_list] link_list = [n.find('a').get('href') for n in news_list] # 将数据存入数据库 conn = sqlite3.connect('news.db') cursor = conn.cursor() cursor.execute('CREATE TABLE IF NOT EXISTS news (title TEXT, link TEXT)') for i in range(len(title_list)): sql = "INSERT INTO news (title, link) VALUES (?, ?)" val = (title_list[i], link_list[i]) cursor.execute(sql, val) conn.commit() conn.close() ``` 在这个示例中,我们首先使用requests库请求人民网国内新闻页面,并用BeautifulSoup库解析HTML页面。我们使用find_all()方法查找所有的新闻标题和链接,并将它们分别存储在title_list和link_list中。然后,我们使用sqlite3库将这些数据存入news.db数据库中。我们使用cursor()方法创建一个游标对象,并使用execute()方法执行SQL语句。如果news表不存在,则使用CREATE TABLE语句创建该表。然后,我们使用INSERT INTO语句将数据插入到news表中。最后,我们使用commit()方法提交事务并关闭数据库连接。

相关推荐

最新推荐

recommend-type

Python SQLite3数据库操作类分享

主要介绍了Python SQLite3数据库操作类分享,需要的朋友可以参考下
recommend-type

c++获取sqlite3数据库表中所有字段的方法小结

本文给大家分享c++获取sqlite3数据库表中所有字段的三种常用方法,本文针对每一种方法给大家详细介绍,需要的的朋友通过本文一起学习吧
recommend-type

Python实现读写sqlite3数据库并将统计数据写入Excel的方法示例

主要介绍了Python实现读写sqlite3数据库并将统计数据写入Excel的方法,涉及Python针对sqlite3数据库的读取及Excel文件相关操作技巧,需要的朋友可以参考下
recommend-type

android创建数据库(SQLite)保存图片示例

主要介绍了android创建数据库,保存图片到数据库再从数据库取图片的方法,大家参考使用吧
recommend-type

Python实现读取TXT文件数据并存进内置数据库SQLite3的方法

主要介绍了Python实现读取TXT文件数据并存进内置数据库SQLite3的方法,涉及Python针对txt文件的读取及sqlite3数据库的创建、插入、查询等相关操作技巧,需要的朋友可以参考下
recommend-type

zigbee-cluster-library-specification

最新的zigbee-cluster-library-specification说明文档。
recommend-type

管理建模和仿真的文件

管理Boualem Benatallah引用此版本:布阿利姆·贝纳塔拉。管理建模和仿真。约瑟夫-傅立叶大学-格勒诺布尔第一大学,1996年。法语。NNT:电话:00345357HAL ID:电话:00345357https://theses.hal.science/tel-003453572008年12月9日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire
recommend-type

实现实时数据湖架构:Kafka与Hive集成

![实现实时数据湖架构:Kafka与Hive集成](https://img-blog.csdnimg.cn/img_convert/10eb2e6972b3b6086286fc64c0b3ee41.jpeg) # 1. 实时数据湖架构概述** 实时数据湖是一种现代数据管理架构,它允许企业以低延迟的方式收集、存储和处理大量数据。与传统数据仓库不同,实时数据湖不依赖于预先定义的模式,而是采用灵活的架构,可以处理各种数据类型和格式。这种架构为企业提供了以下优势: - **实时洞察:**实时数据湖允许企业访问最新的数据,从而做出更明智的决策。 - **数据民主化:**实时数据湖使各种利益相关者都可
recommend-type

用matlab绘制高斯色噪声情况下的频率估计CRLB,其中w(n)是零均值高斯色噪声,w(n)=0.8*w(n-1)+e(n),e(n)服从零均值方差为se的高斯分布

以下是用matlab绘制高斯色噪声情况下频率估计CRLB的代码: ```matlab % 参数设置 N = 100; % 信号长度 se = 0.5; % 噪声方差 w = zeros(N,1); % 高斯色噪声 w(1) = randn(1)*sqrt(se); for n = 2:N w(n) = 0.8*w(n-1) + randn(1)*sqrt(se); end % 计算频率估计CRLB fs = 1; % 采样频率 df = 0.01; % 频率分辨率 f = 0:df:fs/2; % 频率范围 M = length(f); CRLB = zeros(M,1); for
recommend-type

JSBSim Reference Manual

JSBSim参考手册,其中包含JSBSim简介,JSBSim配置文件xml的编写语法,编程手册以及一些应用实例等。其中有部分内容还没有写完,估计有生之年很难看到完整版了,但是内容还是很有参考价值的。