PHP实现HTML字符串截取与自动补全标签

需积分: 6 144 浏览量更新于2024-08-30 收藏 51KB PDF 举报

"php截取html字符串及自动补全html标签的方法" 在PHP中处理HTML字符串时，有时我们需要截取一段内容并确保截取后的内容仍然是结构完整的HTML。这包括确保所有的打开标签都有相应的关闭标签，即使原始字符串中可能并未闭合。这个任务可以通过编写特定的函数来实现，而本文提供了一个这样的函数示例。该函数名为`subHtml`，其作用是截取HTML字符串，并自动补全未闭合的HTML标签。函数接受三个参数：`$html`(要截取的HTML字符串)，`$length`(允许的最大长度)，以及`$end`(当截取超出长度时，要附加到结果字符串末尾的字符串，通常用于显示省略号)。函数内部首先将HTML字符串通过正则表达式拆分为标签和非标签内容的数组。接着，遍历这个数组，对每个元素进行判断和处理： 1. 如果元素为空，跳过。 2. 如果元素是一个自闭合标签（如`<br/>`），直接添加到结果字符串。 3. 如果元素是一个关闭标签（如`</p>`），检查栈顶的元素是否是匹配的打开标签，如果是，则弹出栈顶元素，并将关闭标签添加到结果字符串。 4. 如果元素是一个打开标签（如`<div>`），将其推入栈中，并添加到结果字符串。 5. 如果元素是注释，直接添加到结果字符串。 6. 否则，如果当前字符串长度加上新元素的长度小于允许的最大长度，将元素添加到结果字符串，并更新长度。在遍历过程中，函数维护了一个标签栈(`$tagStack`)，用于存储未闭合的打开标签。当遇到关闭标签时，会检查栈顶元素是否匹配，如果匹配则关闭该标签，否则忽略。这样可以确保所有打开的标签都能找到对应的关闭标签，从而保持HTML结构的完整。这个方法对于处理用户输入的HTML或者从网页抓取的HTML片段非常有用，可以避免因为截取导致的HTML结构错误，提高显示的可读性。需要注意的是，这种方法并不适用于所有情况，例如复杂的嵌套标签或特殊的HTML实体处理。在实际应用中，可能需要结合其他库，如DOMDocument或tidy，来更全面地处理HTML内容。

php截取截取html字符串及自动补全字符串及自动补全html标签的方法标签的方法

主要介绍了php截取html字符串及自动补全html标签的方法,是php对html操作非常实用的技巧,具有一定参考借鉴

价值,需要的朋友可以参考下

本文实例讲述了php截取html字符串及自动补全html标签的方法。分享给大家供大家参考。具体分析如下：

这里总结一下关于利用php截取html字符串自动补全html标签,实际开发中会经常碰到,很多人直接先strip_tags过滤掉html标签,

但是就只剩下纯文本了,可读性非常差,下面是一个函数,代码如下:

复制代码代码如下:

/**

* 截取HTML,并自动补全闭合

* @param $html

* @param $length

* @param $end

function subHtml($html,$length) {

$result = '';

$tagStack = array();

$len = 0;

$contents = preg_split("~(<[^>]+?>)~si",$html, -1,PREG_SPLIT_NO_EMPTY| PREG_SPLIT_DELIM_CAPTURE);

foreach($contents as $tag)

{

if (trim($tag)=="") continue;

if(preg_match("~<([a-z0-9]+)[^/>]*?/>~si",$tag)){

$result .= $tag;

}else if(preg_match("~</([a-z0-9]+)[^/>]*?>~si",$tag,$match)){

if($tagStack[count($tagStack)-1] == $match[1]){

array_pop($tagStack);

$result .= $tag;

}

}else if(preg_match("~<([a-z0-9]+)[^/>]*?>~si",$tag,$match)){

array_push($tagStack,$match[1]);

$result .= $tag;

}else if(preg_match("~~si",$tag)){

$result .= $tag;

}else{

if($len + mstrlen($tag) < $length){

$result .= $tag;

$len += mstrlen($tag);

}else {

$str = msubstr($tag,0,$length-$len+1);

$result .= $str;

break;

}

while(!emptyempty($tagStack)){

$result .= '</'.array_pop($tagStack).'>';

}

return $result;

}

/**

* 截取中文字符串

* @param $string 字符串

* @param $start 起始位

* @param $length 长度

* @param $charset 编码

* @param $dot 附加字串

function msubstr($string, $start, $length,$dot='',$charset = 'UTF-8') {

$string = str_replace(array('&', '"', '<', '>',' '), array('&', '"', '<', '>',' '), $string);

if(strlen($string) <= $length) {

下载后可阅读完整内容，剩余3页未读，立即下载

weixin_38618784

粉丝: 11
资源: 884

PHP实现HTML字符串截取与自动补全标签

php对包含html标签的字符串进行截取的函数分享

PHP实现HTML标签自动补全代码

php使HTML标签自动补全闭合函数

PHP实现HTML字符串截取与自动补全标签

PHP数字字符串左侧补0、字符串填充和自动补齐的几种方法

PHP实现补齐关闭的HTML标签|angluo-php-145518.pdf

php.ctl-Editplus的PHP函数自动完成素材库

一个简单的php加密解密函数(动态加密)

字符串操作在数据结构与算法中的应用

026-SVM用于分类时的参数优化，粒子群优化算法，用于优化核函数的c,g两个参数(SVM PSO) Matlab代码.rar

最新资源