使用Python爬虫并输出为一个表格https://fr.oppein.com:9001/op/decision/view/report?viewlet=/%E5%A4%A9%E6%B4%A5%E5%9F%BA%E5%9C%B0/%E5%A4%A9%E6%B4%A5%E7%94%9F%E4%BA%A7%E8%AE%A1%E5%88%92%E9%87%87%E8%B4%AD%E9%83%A8/%E3%80%90MCTS%E3%80%91%E5%A4%A9%E6%B4%A5%E5%AE%B6%E5%85%B7%E5%8E%82%E4%BA%A7%E8%83%BD%E6%8F%90%E5%8D%87%E7%9B%91%E6%8E%A7%E8%A1%A8.cpt
时间: 2023-06-23 21:43:31 浏览: 119
要爬取 https://fr.oppein.com:9001/op/decision/view/report?viewlet=/%E5%A4%A9%E6%B4%A5%E5%9F%BA%E5%9C%B0/%E5%A4%A9%E6%B4%A5%E7%94%9F%E4%BA%A7%E8%AE%A1%E5%88%92%E9%87%87%E8%B4%AD%E9%83%A8/%E3%80%90MCTS%E3%80%91%E5%A4%A9%E6%B4%A5%E5%AE%B6%E5%85%B7%E5%8E%82%E4%BA%A7%E8%83%BD%E6%8F%90%E5%8D%87%E7%9B%91%E6%8E%A7%E8%A1%A8.cpt 的内容并输出为一个表格,我们可以使用 Python 中的第三方库,如 `requests` 和 `pandas`,以下是一个示例代码:
```python
import requests
import pandas as pd
url = 'https://fr.oppein.com:9001/op/decision/view/report?viewlet=/%E5%A4%A9%E6%B4%A5%E5%9F%BA%E5%9C%B0/%E5%A4%A9%E6%B4%A5%E7%94%9F%E4%BA%A7%E8%AE%A1%E5%88%92%E9%87%87%E8%B4%AD%E9%83%A8/%E3%80%90MCTS%E3%80%91%E5%A4%A9%E6%B4%A5%E5%AE%B6%E5%85%B7%E5%8E%82%E4%BA%A7%E8%83%BD%E6%8F%90%E5%8D%87%E7%9B%91%E6%8E%A7%E8%A1%A8.cpt'
res = requests.get(url)
# 读取 HTML 表格
tables = pd.read_html(res.text)
# 输出第一个表格
print(tables[0])
```
在上述代码中,我们使用 `requests.get` 函数发送 GET 请求,并使用 `pd.read_html` 函数从返回的 HTML 中读取表格数据。然后,我们使用索引 `0` 来访问第一个表格,并使用 `print` 函数输出表格内容。
需要注意的是,由于该网站使用了 HTTPS 协议,因此我们需要使用 `https` 开头的 URL,并且需要将端口号 9001 也包含在 URL 中。另外,由于该网站使用了中文编码的 URL,因此我们需要使用 URL 编码来转换 URL。
阅读全文