利用beautifulsoap实现"var boxes = document.querySelectorAll('div[class*=fmJAkJ]'); \ var textArray = []; \ for (var i = 0; i < boxes.length && i < 2; i++) { \ textArray.push(boxes[i].textContent); \ } \ return textArray;"
时间: 2024-03-01 14:50:24 浏览: 57
python 3利用BeautifulSoup抓取div标签的方法示例
可以使用 BeautifulSoup 和 requests 库来实现这段 JavaScript 代码:
```python
import requests
from bs4 import BeautifulSoup
url = 'https://example.com' # 需要爬取的页面 URL
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
text_array = []
boxes = soup.find_all('div', class_=lambda x: x and 'fmJAkJ' in x.split())
for i, box in enumerate(boxes):
if i >= 2:
break
text_array.append(box.get_text())
print(text_array)
```
这段代码首先使用 requests 库获取页面 HTML,然后使用 BeautifulSoup 解析 HTML。接着,使用 `find_all()` 方法获取所有 class 中包含 'fmJAkJ' 的 div 标签,使用循环遍历这些标签,将前两个标签的文本内容添加到列表 `text_array` 中。最后打印出列表 `text_array`。
注意,在使用 BeautifulSoup 解析 HTML 时,需要指定解析器,这里使用了 Python 内置的 `html.parser`。同时,使用 `class_` 参数来匹配 class 属性,其中 `lambda x: x and 'fmJAkJ' in x.split()` 表示只要 class 中包含 'fmJAkJ' 即可。
阅读全文