写一段爬取http://sef.xjtu.edu.cn/szdw/jszy.htm网站里超链接和对应标题的代码
时间: 2023-12-23 09:03:08 浏览: 34
好的,以下是代码示例:
```python
import requests
from bs4 import BeautifulSoup
url = 'http://sef.xjtu.edu.cn/szdw/jszy.htm'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
links = []
titles = []
for a in soup.find_all('a'):
link = a.get('href')
title = a.get_text()
links.append(link)
titles.append(title)
print(links)
print(titles)
```
这段代码使用了`requests`和`BeautifulSoup`库来对目标网站进行爬取和解析。我们首先定义了目标 URL,然后使用`requests.get()`方法发送一个 GET 请求,将响应内容保存到`response`变量中。
接着,我们使用`BeautifulSoup`库将`response.text`转化为 BeautifulSoup 对象。我们遍历所有的超链接`<a>`标签,并使用`get()`方法获取链接地址和标签文本。最后,我们将链接地址和标签文本分别存储到`links`和`titles`数组中,并将它们输出。
希望这段代码能够帮到你,如果你有其它问题或疑问,可以继续问我。
相关问题
Could not find jar:file:/C:/Users/hp/Downloads/spring-tool-suite-4-4.18.1.RELEASE-e4.27.0-win32.win32.x86_64.sef-extraction.jar!/
这个错误通常发生在您尝试从下载的zip文件中运行Spring Tool Suite时。它可能是由于您的zip文件已经损坏或不完整,或者您的解压缩工具无法正确解压缩文件而导致的。
您可以尝试重新下载Spring Tool Suite并重新解压缩文件,然后再次尝试运行它。确保您使用的是最新版本的Spring Tool Suite,并使用可靠的解压缩工具解压缩文件。如果您仍然遇到此错误,请尝试使用Eclipse Marketplace或Eclipse Update Site安装Spring Tool Suite插件,而不是从zip文件中运行它。
/proc/sef/pagemap
`/proc/self/pagemap` 是一个特殊的虚拟文件,提供了当前进程的虚拟内存页与物理内存页之间的映射关系。
在 Linux 内核中,每个进程都有自己的虚拟地址空间,这个虚拟地址空间由多个虚拟内存页组成。当进程访问一个虚拟内存页时,Linux 内核会将其映射到一个物理内存页上。`/proc/self/pagemap` 文件提供了当前进程的虚拟内存页与物理内存页之间的映射关系,每个虚拟内存页对应一个 64 位的条目,每个条目的值包含物理内存页的地址和一些其他信息。
可以使用 `cat` 命令读取 `/proc/self/pagemap` 文件,但需要注意的是,读取该文件需要 root 权限或者进程的所有者权限。此外,该文件只适用于当前进程,其他进程不能访问该文件。