python的urllib.parse模块的urlparse函数的参数及其用法
时间: 2023-11-11 09:07:20 浏览: 82
`urllib.parse.urlparse()` 函数将 URL 字符串解析为组件。它接受一个 URL 字符串作为参数,并返回一个命名元组,可以访问 URL 的各个组件。
`urllib.parse.urlparse(urlstring, scheme='', allow_fragments=True)` 函数有三个参数:
- `urlstring`:需要解析的 URL 字符串。
- `scheme`:默认的协议,如果 URL 没有指定协议,则使用该协议。默认为 `''`。
- `allow_fragments`:指定是否忽略 URL 中的片段标识符(即 # 后面的内容)。默认为 `True`。
返回值是一个命名元组,包含以下成员:
- `scheme`:URL 中的协议(例如,http、https 等)。
- `netloc`:URL 中的网络位置部分(例如,www.example.com:80)。
- `path`:URL 中的路径部分(例如,/path/to/file.html)。
- `params`:URL 中的参数部分(例如,key1=value1&key2=value2)。
- `query`:URL 中的查询字符串部分(例如,key1=value1&key2=value2)。
- `fragment`:URL 中的片段标识符部分(例如,#fragment)。
示例:
```python
from urllib.parse import urlparse
url = 'https://www.google.com/search?q=python'
result = urlparse(url)
print(result.scheme) # https
print(result.netloc) # www.google.com
print(result.path) # /search
print(result.params) # ''
print(result.query) # q=python
print(result.fragment) # ''
```
阅读全文