python爬虫基本语法
时间: 2023-11-08 17:00:01 浏览: 102
Python爬虫入门.zip
Python爬虫的基本语法包括使用urllib库发送HTTP请求和处理HTTP响应,使用正则表达式进行文本匹配和提取,以及使用pymysql库进行与MySQL数据库的交互。
1. 使用urllib库发送HTTP请求和处理HTTP响应的基本方法如下:
- 引入urllib库:`import urllib`
- 发送GET请求:`response = urllib.request.urlopen(url)`
- 发送POST请求:`response = urllib.request.urlopen(url, data)`
- 读取响应的内容:`content = response.read()`
- 解码响应的内容:`decoded_content = content.decode('utf-8')`
2. 使用正则表达式进行文本匹配和提取的基本方法如下:
- 引入re库:`import re`
- 匹配字符串:`result = re.match(pattern, string)`
- 搜索字符串:`result = re.search(pattern, string)`
- 替换字符串:`new_string = re.sub(pattern, replacement, string)`
3. 使用pymysql库进行与MySQL数据库的交互的基本方法如下:
- 引入pymysql库:`import pymysql`
- 建立数据库连接:`conn = pymysql.Connect(host='localhost', port=3306, db='python', user='root', passwd='123456', charset='utf8')`
- 创建游标对象:`cursor = conn.cursor()`
- 执行SQL查询:`cursor.execute(sql)`
- 获取查询结果:`result = cursor.fetchone()`
- 关闭数据库连接:`conn.close()`
请告诉我还有什么其他问题。
阅读全文