在数据库中建立新表并导入数据通过 PyMySQL 库存储“http://www.tipdm.com/gsjj/index.jhtml ”网页内容,在 MySQL 的 test 库中建立一个新表,并将提取的文本内容存入该表内,之后查询该表内容,确认是否存储成功。
时间: 2024-11-05 20:27:22 浏览: 14
首先,确保已经安装了PyMySQL库,如果没有,可以通过pip安装:
```bash
pip install pymysql
```
接下来,按照以下步骤在MySQL中创建表、导入网页数据并查询结果:
1. **连接到MySQL数据库**:
```python
import pymysql
# 连接参数(替换为你自己的数据库信息)
db_config = {
'host': 'your_host',
'user': 'your_username',
'password': 'your_password',
'database': 'test'
}
# 创建连接
conn = pymysql.connect(**db_config)
cursor = conn.cursor()
```
2. **创建新表**:
```sql
CREATE TABLE IF NOT EXISTS page_content (
id INT AUTO_INCREMENT PRIMARY KEY,
content TEXT
);
```
运行上述SQL命令,如果表不存在则自动创建。
3. **下载并解析网页内容**(这部分与前面BeautifulSoup部分相同):
...(这部分代码见上一个问题的回答)
4. **插入数据到表中**:
```python
# 获取到提取的文本内容后,将其插入表中
cursor.execute("INSERT INTO page_content (content) VALUES (%s)", (extracted_content,))
conn.commit() # 确保数据保存
```
5. **查询表内容确认是否存储成功**:
```python
cursor.execute("SELECT * FROM page_content WHERE content LIKE %s", ('%' + extracted_content + '%',))
results = cursor.fetchall()
for row in results:
print(f"ID: {row[0]}, Content: {row[1]}")
```
这会显示所有包含提取内容的行,如果成功存储,应该能看到一条或多条匹配的数据。
阅读全文