程序员人生 网站导航

php 截取字符串函数(中文字符串)

栏目:php教程时间:2014-01-16 18:37:28

php 截取字符串函数(中文字符串) 这是一款php 截取字符串函数哦,这是一款支持中文字符串哦,它可以截取html与中西文,等混合的内容,并且把html标签不算在字符截取之内,如果html标签没有闭合,程序将自动过滤多余的标签。

方法一:

  1. function mysubstr( $str$length ){ 
  2.      
  3.     $tagcnt = 0; 
  4.     $charcnt = 0; 
  5.     $tag = ''
  6.     $maxlen = strlen$str ); 
  7.     $resultstr = ''
  8.     $tagstack = array(); 
  9.     for$i = 0; $i < $length$i++ ){ 
  10.         if$str[$i] == '<' ){ 
  11.             $resultstr .= $str[$i]; 
  12.             for$j=$i$str[$j]!='>'$j++,$length++ ){ 
  13.                 $tag .= $str[$j]; 
  14.             } 
  15.             $tagcnt++; 
  16.             $length++; 
  17.             $tag .= '>'
  18.              
  19.             //如果是开始标记,则入栈,如果是与之相对应的结束标记则出栈 
  20.             if( preg_match('/<([^/]+)?>/i'$tag$r) ){ 
  21.                 echo '入栈:',htmlspecialchars($r[1]),'<br />'
  22.                 array_push($tagstack$r[1]); 
  23.             } 
  24.             elseif( preg_match( '/'.$tagstack[count($tagstack)-1].'/'$tag ) ){ 
  25.                 echo '出栈:',htmlspecialchars($tagstack[count($tagstack)-1]),'<br />'
  26.                 array_pop$tagstack ); 
  27.             } 
  28.             $tag = ''
  29.             continue
  30.         } 
  31.         $charcnt++; 
  32.         $resultstr .= $str[$i]; 
  33.     } 
  34.      
  35.     echo '<hr size=1>最后结果为:'
  36.     //栈是空的直接返回 
  37.     if(emptyempty($tagstack)){ 
  38.         return $resultstr
  39.     } 
  40.     //否则去掉没有结束标记的开始标记 
  41.     else
  42.          
  43.         while(!emptyempty($tagstack)){ 
  44.             $tag = array_pop($tagstack); 
  45.             $index = strrpos($resultstr$tag); 
  46.             for($i = $index-1; $resultstr[$i] != '>'$i++ ){ 
  47.                 $resultstr[$i] = ''
  48.             } 
  49.             $resultstr[$i++] = ''
  50.          
  51.         } 
  52.         return $resultstr
  53.     } 
  54.      
  55. $sttime = microtime(true); 
  56. $stmem = memory_get_usage(); 
  57. $str = "a1<body>b2<p>c3<em>d4</em>e5</p>f6</body>g7h8"
  58. echo '处理结果为:<br/><hr size=1>',htmlspecialchars( mysubstr( $str, 18 ) ),'<br />'
  59. echo "内存使用情况:",(memory_get_usage()-$stmem),'<br />'
  60. echo "算法运行时间(microtime):",(microtime(true)-$sttime),'<br/>'

方法二:

  1. ** 
  2.  * 函数名 html_substr 
  3.  * 功能 从html串中截取指定长度的字串,html标记不计算在内 
  4.  * 参数 
  5.  *  $str 要截取的串 
  6.  *  $len 要截取的长度 
  7.  *  $mode 不匹配的标记的处理方式 0 删去(默认),1 补齐 
  8.  * 返回 截取到的串 
  9.  * 说明 
  10.  *  未考虑多字节字符,仅已字节做计数单位 
  11.  *  未考虑可单独存在的标记 
  12.  **/ 
  13. function html_substr($str$len$mode=0) { 
  14.   $ar= preg_split('/(<!--.*-->|<[^>]*>)/s'$str, -1, preg_split_delim_capture); 
  15.   foreach($ar as $k => $v) { 
  16.     if($v{0} != '<') { 
  17.       $len = $len - strlen($v); 
  18.       if($len < 0) $ar[$k] = substr($v, 0, $len); 
  19.     }else $ar[$k] = strtolower($v); 
  20.     if($len <= 0) break
  21.   } 
  22.   $ar = array_slice($ar, 0, $k+1); 
  23.   $len = count($ar); 
  24.   foreach($ar as $k=>$v) { 
  25.     if($v{0} == '<' && $v[1] != '/') { 
  26.       $ch = str_replace('<''</'$v); 
  27.       for($i=$k+1; $i<$len && $ar[$i]!=$ch$i++); 
  28.       if($i == $len
  29.         if($mode
  30.           $ar[$len] = $ch . $ar[$len]; 
  31.         else 
  32.           $ar[$k] = ''
  33.     } 
  34.   } 
  35.   return join(''$ar); 
  36. $str = "123<em>abc</em>456<em>def</em>789"
  37. echo '<xmp>'
  38. echo html_substr($str, 5) . php_eol; 
  39. echo html_substr($str, 5, 1); 

方法三:

  1. $str = "a1<body>b2c3<p><em>d4</em>e</p>5f6</body>g7h8"
  2. $gn  = 7; 
  3. $i   = $j = $k = 0; 
  4. while( ($c = $str[$i++]) && $j < $gn )  
  5.     if$c == '<'
  6.     { 
  7.         $tag = 1; 
  8.     } 
  9.     elseif($c == '>'
  10.     { 
  11.         if(trim($tg,'/') == 'em'
  12.         { 
  13.             $tgs[$j-1] = '<'.$tg.'>'
  14.         } 
  15.         else  
  16.         { 
  17.             if($tgs[$j-1]) $ogs[$j-1] = '1|'.'<'.$tg.'>'
  18.             else $ogs[$j-1]           = '0|'.'<'.$tg.'>'
  19.         } 
  20.         $tag = 0; 
  21.         $tg  = ''
  22.     } 
  23.     elseif($tag == 1) 
  24.     { 
  25.         $tg .= $c
  26.     } 
  27.     else 
  28.     { 
  29.         $tmp[] = $c
  30.         $j++; 
  31.     } 
  32. $ts = count($tgs); 
  33. if($ts % 2) array_pop($tgs); 
  34. foreach($tmp as $k=>$v
  35.    $ba = explode('|',$ogs[$k],2); 
  36.    if$tgs[$k] && $ogs[$k]) 
  37.    { 
  38.         if($ba[0]) 
  39.         { 
  40.             $s .= $v.$tgs[$k].$ba[1]; 
  41.         }     
  42.         else $s .= $v.$ba[1].$tgs[$k]; 
  43.    } 
  44.    else $s .= $v.$tgs[$k].$ba[1]; 
  45. echo htmlspecialchars($s); 
------分隔线----------------------------
------分隔线----------------------------

最新技术推荐