python爬取裁判文书网
时间: 2023-08-10 14:23:14 浏览: 296
用python下载裁判文书网文书脚本
可以使用Python的requests和BeautifulSoup库来爬取裁判文书网。以下是一个简单的示例代码:
```python
import requests
from bs4 import BeautifulSoup
# 设置请求头
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3'}
# 构造请求url
url = 'http://wenshu.court.gov.cn/List/List?sorttype=1&conditions=searchWord+1+AJLX++案件类型:行政案件'
# 发送请求
response = requests.get(url, headers=headers)
# 解析返回的html
soup = BeautifulSoup(response.text, 'html.parser')
# 打印解析结果,这里只是打印出html内容
print(soup.prettify())
```
以上代码中的url是一个示例,你需要根据自己的需求构造请求url。同时,需要注意的是,裁判文书网有反爬机制,需要使用一些反反爬的方法来避免被封禁或者被识别为机器人。
阅读全文