提取https://www.163.com/tech/article/I2JKM85H00099504.html的正则表达式
时间: 2023-10-05 15:06:14 浏览: 66
主要参考其中的正则表达式
正则表达式可以根据不同的需求进行编写,以下是一些可能有用的正则表达式示例:
1.提取文章标题:`<title>(.*?)</title>`
2.提取文章发布时间:`<div class="post_time_source">(.*?)<\/div>`
3.提取文章正文内容:`<div class="post_text" id="post_text">(.*?)<\/div>`
4.提取文章作者:`<span class="ep-editor">(.*?)<\/span>`
5.提取文章所有图片链接地址:`<img.*?src="(.*?)".*?>`
6.提取文章所有超链接地址:`<a.*?href="(.*?)".*?>`
7.提取文章摘要:`<div class="post_sub">(.*?)<\/div>`
注意:这些正则表达式可能需要根据实际页面的结构进行调整。
阅读全文