xpath怎么抓取em标签下的时间 - CSDN文库

要抓取em标签下的时间，可以使用以下XPath表达式来选择该元素： ``` //em[contains(text(),'时间')] ``` 这个表达式的意思是选择所有文本内容包含"时间"的em元素。如果em标签中的时间文本是唯一的，那么可以直接使用以下代码来获取该元素的文本内容： ``` time_text = html.xpath("//em[contains(text(),'时间')]/text()")[0] ``` 这个代码片段首先使用XPath表达式来选择所有包含"时间"的em元素，然后使用/text()属性来获取该元素的文本内容。注意，XPath表达式返回的是一个元素列表，所以要使用[0]来获取第一个元素。如果em标签中包含多个文本节点，可以使用以下代码来获取所有文本内容： ``` time_texts = html.xpath("//em[contains(text(),'时间')]/text()") ``` 这个代码片段会返回一个包含所有文本内容的列表。

相关问题

xpath怎么抓取span标签下的时间

要抓取span标签下的时间，可以使用XPath表达式来选择该元素。具体方法如下：假设你要抓取这样一个HTML代码片段中的时间： ``` <div> <span class="time">2021-01-01 12:00:00</span> </div> ``` 可以使用以下XPath表达式来选择该时间元素： ``` //span[@class='time'] ``` 这个表达式的意思是选择所有class属性为"time"的span元素，可以通过这个表达式来抓取到该时间元素。如果你想要抓取该元素的文本内容，可以使用以下代码： ``` time_element = html.xpath("//span[@class='time']")[0] time_text = time_element.text ``` 这个代码片段首先使用XPath表达式来选择时间元素，然后使用.text属性来获取该元素的文本内容。注意，XPath表达式返回的是一个元素列表，所以要使用[0]来获取第一个元素。

xpath获取h标签下的文本信息

可以使用以下XPath表达式获取h1-h6标签下的文本信息： ``` //h1/text() //选取所有h1标签下的文本 //h2/text() //选取所有h2标签下的文本 //h3/text() //选取所有h3标签下的文本 //h4/text() //选取所有h4标签下的文本 //h5/text() //选取所有h5标签下的文本 //h6/text() //选取所有h6标签下的文本 ``` 其中，`//`表示选取文档中的所有标签，`text()`表示选取标签内的文本内容。如果你只需要某个特定的h标签下的文本信息，可以将`//`替换为该标签的XPath路径。例如，如果你只需要获取第一个h2标签下的文本信息，可以使用以下XPath表达式： ``` //h2[1]/text() ```

相关推荐

CSDN会员

开通CSDN年卡参与万元壕礼抽奖

海量 VIP免费资源千本正版电子书商城会员专享价千门课程&专栏

全年可省5,000元立即开通