python 获取本地html文件源码 代码
时间: 2023-06-04 18:03:36 浏览: 435
可以使用以下代码实现:
```
with open("本地文件.html", "r", encoding="utf-8") as f:
html = f.read()
```
其中,`本地文件.html`是本地的HTML文件路径,`"r"`表示以只读方式打开文件,`"utf-8"`表示文件编码为UTF-8,`f.read()`表示读取文件内容并赋值给`html`变量。注意,代码中的引号不需要输入。
相关问题
python 获取本地htm文件源码 代码
可以使用Python中的文件操作来获取本地HTML文件源码。可以使用以下代码:
```python
with open('file.html', 'r') as f:
source = f.read()
print(source)
```
其中,'file.html'是要读取的HTML文件的文件名,'r'表示以只读模式打开文件。通过read()方法读取文件内容,将其存储在变量source中,并打印出来。
url=https://www.dpm.org.cn/lights/royal/p/81.html 获取网页的源码,保存到gugong index.html文件中 2、任意5张图抓取到本地,并命名为1.jpg、2.jpg、3.jpg 用python做
要完成这个任务,你可以使用Python中的requests库来获取网页的源码,并使用BeautifulSoup库来解析HTML内容,以便找到图片链接。然后,使用requests库下载这些图片并保存到本地。以下是完成这个任务可能的步骤和代码示例:
1. 首先安装所需的库,如果你还没有安装它们,可以使用pip命令安装:
```
pip install requests
pip install beautifulsoup4
```
2. 使用requests库获取网页源码,并保存到本地文件:
```python
import requests
url = 'https://www.dpm.org.cn/lights/royal/p/81.html'
response = requests.get(url)
if response.status_code == 200:
with open('gugong/index.html', 'wb') as file:
file.write(response.content)
```
3. 解析网页源码,找到图片链接。这里假设图片链接是直接从img标签的src属性获取的,实际情况可能需要根据网页的具体结构进行调整:
```python
from bs4 import BeautifulSoup
soup = BeautifulSoup(response.content, 'html.parser')
img_tags = soup.find_all('img', limit=5) # 假设我们只找前5个图片标签
img_urls = [img['src'] for img in img_tags if 'src' in img.attrs]
```
4. 下载并保存图片:
```python
for i, img_url in enumerate(img_urls):
img_response = requests.get(img_url)
if img_response.status_code == 200:
with open(f'gugong/{i+1}.jpg', 'wb') as file:
file.write(img_response.content)
```
请注意,上述代码只是一个基础的示例,实际使用时可能需要处理一些特殊情况,例如相对路径的图片URL需要转换为绝对路径,以及网络请求失败时的错误处理等。
阅读全文