请编写一个python脚本,抓取网页图片并保存
时间: 2023-04-08 16:03:25 浏览: 110
以下是一个简单的 Python 脚本,可以抓取网页图片并保存到本地:
```python
import requests
import os
url = 'https://www.example.com/image.jpg' # 图片的 URL
filename = 'image.jpg' # 保存的文件名
response = requests.get(url)
if response.status_code == 200:
with open(filename, 'wb') as f:
f.write(response.content)
print('图片已保存到', os.getcwd())
else:
print('无法下载图片')
```
你可以将 `url` 和 `filename` 替换为你需要下载的图片的 URL 和保存的文件名。如果下载成功,脚本会在当前目录下保存图片,并输出保存的路径。
相关问题
编写一个可以抓取淘宝商家好评率排名的python脚本
由于淘宝商家好评率排名是需要登录后才能查看的,因此需要先进行登录操作。这里使用Selenium和Chrome浏览器来模拟登录和抓取数据。
```python
from selenium import webdriver
import time
# 设置Chrome浏览器
options = webdriver.ChromeOptions()
options.add_argument('--ignore-certificate-errors')
options.add_argument('--ignore-ssl-errors')
options.add_argument('--headless') # 无头模式,不弹出浏览器窗口
browser = webdriver.Chrome(options=options)
# 登录淘宝
def login(username, password):
browser.get('https://login.taobao.com/member/login.jhtml')
browser.find_element_by_id('fm-login-id').send_keys(username)
browser.find_element_by_id('fm-login-password').send_keys(password)
browser.find_element_by_class_name('fm-button').click()
time.sleep(5) # 等待页面加载完毕
# 抓取好评率排名
def get_rank():
browser.get('https://s.taobao.com/search?q=%E6%89%8B%E6%9C%BA&sort=sale-desc')
browser.find_element_by_class_name('filter-value').click()
browser.find_elements_by_class_name('option-list')[2].find_elements_by_tag_name('li')[1].click()
time.sleep(5) # 等待页面加载完毕
ranks = []
items = browser.find_elements_by_class_name('item')
for i in range(len(items)):
rank = items[i].find_element_by_class_name('deal-cnt').text
if rank.endswith('万+'):
rank = int(float(rank[:-2]) * 10000)
else:
rank = int(rank)
ranks.append((i+1, rank))
return ranks
# 执行脚本
if __name__ == '__main__':
username = input('请输入淘宝账号:')
password = input('请输入淘宝密码:')
login(username, password)
ranks = get_rank()
print('淘宝手机店好评率排名:')
for rank in ranks:
print('第%d名:%d' % (rank[0], rank[1]))
browser.quit()
```
执行脚本后,会先提示输入淘宝账号和密码进行登录,然后抓取淘宝手机店的好评率排名并输出。
用Python写一个抓取C语言题库的脚本
好的,以下是使用Python编写抓取C语言题库的脚本的基本步骤:
1. 导入必要的库
使用Python的`requests`库可以发送HTTP请求,并使用`BeautifulSoup`库来解析HTML文档。
```python
import requests
from bs4 import BeautifulSoup
```
2. 获取网页内容
使用`requests`库发送HTTP请求,获取C语言题库网页的HTML内容。
```python
url = 'https://www.example.com/c-language-questions'
response = requests.get(url)
html_content = response.content
```
3. 解析HTML内容
使用`BeautifulSoup`库解析HTML内容,获取题目和答案的信息。
```python
soup = BeautifulSoup(html_content, 'html.parser')
questions = soup.find_all('div', {'class': 'question'})
answers = soup.find_all('div', {'class': 'answer'})
```
4. 保存题目和答案
将获取到的题目和答案保存到文件中,方便后续处理和使用。
```python
with open('c_language_questions.txt', 'w') as f:
for i in range(len(questions)):
f.write(f'Question {i + 1}: {questions[i].text}\n')
f.write(f'Answer {i + 1}: {answers[i].text}\n\n')
```
这就是一个简单的抓取C语言题库的Python脚本。需要注意的是,实际使用时可能需要对代码进行一些调整,以适应具体的网站和需求。
相关推荐
![pdf](https://img-home.csdnimg.cn/images/20210720083512.png)
![zip](https://img-home.csdnimg.cn/images/20210720083736.png)
![-](https://img-home.csdnimg.cn/images/20210720083327.png)
![-](https://img-home.csdnimg.cn/images/20210720083327.png)
![-](https://img-home.csdnimg.cn/images/20210720083327.png)
![-](https://img-home.csdnimg.cn/images/20210720083327.png)
![-](https://img-home.csdnimg.cn/images/20210720083327.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![-](https://csdnimg.cn/download_wenku/file_type_column_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)
![](https://csdnimg.cn/download_wenku/file_type_ask_c1.png)