首页xpath 后去title 标签内容并且去掉 -后的内容

xpath 后去title 标签内容并且去掉 -后的内容

时间: 2024-02-05 08:45:21 浏览: 63

利用xpath提取标签下所有文本

利用xpath提取标签下所有文本html 样式xpath提取方式 html 样式该网页源代码是微博的一部分，我们需要提取博文，但发现标签下文本被分割开，这种情况应当如何处理 c 投诉一Z_c一忌甜忌辣忌油忌熬夜否则就会长痘痘变丑忌咖啡忌可可忌巧克

可以使用以下XPath表达式： ``` substring-before(normalize-space(//title), ' -') ``` 解释： 1. `//title`：选择文档中的所有`<title>`元素。 2. `normalize-space()`：移除文本中的多余空格，并将多行文本合并为一行。 3. `substring-before()`：获取第一个参数字符串中第一个出现的第二个参数字符串之前的部分，即去掉字符串中的`-`及其后面的内容。

阅读全文