python爬虫最简单代码_Python爬虫入门(01) -- 10行代码实现一个爬虫
时间: 2024-06-08 07:07:34 浏览: 101
Python爬虫仅需一行代码—-crawl第三方库
以下是一个最简单的 Python 爬虫代码,用于爬取指定网站的 HTML 内容:
```python
import urllib.request
url = "https://www.example.com/"
response = urllib.request.urlopen(url)
print(response.read())
```
这段代码首先导入了 `urllib.request` 模块,并定义了一个 URL 变量。然后使用 `urllib.request.urlopen()` 方法打开指定的 URL,并将返回的响应对象存储在变量 `response` 中。最后,使用 `response.read()` 方法读取响应内容,并使用 `print()` 函数输出到控制台。
当然,这样的简单爬虫只能爬取静态页面,对于网站上的动态内容、AJAX 请求等都无法处理。如果需要处理这些内容,需要使用更加复杂的爬虫框架或者库。
阅读全文