将下面的html文档字符串中,将每个class为item-1的li标签作为1条新闻数据。提取a标签的文本内容以及链接。teXt=''' <div><ul> <li clas
时间: 2024-09-22 21:05:54 浏览: 57
在这个HTML文档字符串中,你可以通过JavaScript或Python等编程语言解析它来提取`<li class="item-1">`标签内的新闻数据。这里是一个基本的Python示例,使用BeautifulSoup库来完成这个任务:
```python
from bs4 import BeautifulSoup
text = '''
<div><ul>
<li class="item-1"><a href="https://example.com/news1" title="新闻标题1">新闻标题1</a></li>
<li class="item-1"><a href="https://example.com/news2" title="新闻标题2">新闻标题2</a></li>
<li class="item-1"><a href="https://example.com/news3" title="新闻标题3">新闻标题3</a></li>
</ul>
</div>
'''
soup = BeautifulSoup(text, 'html.parser')
news_data = soup.find_all('li', class_='item-1')
for news in news_data:
link = news.find('a')['href']
title = news.find('a').text
print(f'链接: {link}, 标题: {title}')
```
这将输出每一条新闻的链接和标题。
阅读全文