请用Python写出获取网页数据的代码
时间: 2023-03-16 10:44:11 浏览: 84
使用Python获取网页数据的代码如下:import requests
url = 'http://www.example.com/'
response = requests.get(url)
data = response.text
相关问题
用python写出爬取淘宝网页的代码
好的,以下是使用Python爬取淘宝网页的代码示例:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://www.taobao.com'
# 构造请求头,模拟浏览器访问
headers = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36'
}
# 发送请求,获取页面
response = requests.get(url, headers=headers)
html = response.text
# 解析网页,并提取数据
soup = BeautifulSoup(html, 'html.parser')
# 获取所有商品的名称和价格
goods = soup.find_all('div', class_='item-title')
prices = soup.find_all('div', class_='item-price')
for i in range(len(goods)):
print(goods[i].text + '的价格是' + prices[i].text)
```
此代码可以爬取淘宝主页上的商品名称和价格。需要注意的是,在爬取淘宝等电商网站时,需要模拟浏览器的请求头,否则容易被识别为机器人并被封禁。
用python写出 获取一个网页html的json包数据
要获取网页的json数据,需要先确定网页中哪些数据是以json格式呈现的,然后使用Python中的requests和json库来获取和解析数据。
以下是一个示例代码,演示如何获取Github API返回的用户信息:
```python
import requests
import json
# 设置API请求参数
username = 'octocat'
url = f'https://api.github.com/users/{username}'
# 发送API请求并获取响应
response = requests.get(url)
# 解析响应中的json数据
data = json.loads(response.text)
# 打印用户信息
print(f"Username: {data['login']}")
print(f"Name: {data['name']}")
print(f"Bio: {data['bio']}")
```
在这个示例中,我们使用requests库发送一个GET请求到Github API,获取一个用户的信息。然后,使用json库将响应中的json数据解析成Python对象,然后打印出用户的用户名、姓名和个人简介等信息。
需要注意的是,不是所有的网站都提供了以json格式返回数据的API,有些网站可能使用其他格式(如XML)来返回数据。在这种情况下,需要使用不同的库来解析响应。
阅读全文