程序员人生 网站导航

php simplexml_load_file 中文乱码的解决方法

栏目:php教程时间:2013-11-18 23:21:01

在PHP5.0 中,simplexml_load_file()是一个很好的读取和处理XML文件的函数,但是在读取和处理中文时会出现乱码,经过研究发现,如果是中文内容,必须经过iconv编码转换,否则显示为乱码,代码如下:

  1. $xml=simple_load_file('xml文件'); 
  2.   foreach($xml->soft as $temp){ 
  3.   echo $temp->name; //这就是软件名称了。  
  4.   echo $temp->mem; //这就是软件说明了。 

英文正确中文乱码,这个我估计就是编码问题了,后来网上找到了相关文章,如核心如下:

1、如果xml的encoding与文件类型不符,立刻报错

2、simplexml可以处理gbk的XML,即文件内容和encoding都为gbk(ANSI格式)

3、不管文件内容是什么,处理完了,都是UTF8.

具体方法如下:$chname = iconv('utf-8', 'gb2312', $table->param["name"]);

实现将编码为'utf-8'的XML文件内容转换为 gb2312 格式的内容,中文编码采用gb2312格式输出,还有一种办法本人没测试过直接摊贩页面编码转成uft8,代码如下:

  1. header("Content-type: text/html; charset=utf-8"); 
  2. //因为wordpress默认编码是utf-8,但IE默认识别为gb2312,所以用header发一下编码 
  3. $url="http://www.111cn.net"
  4. $xml =  simplexml_load_file($url); 
  5. //载入远程XML文件 
  6. $title=$xml->channel->title; 
  7. //根据节点获取博客标题(不循环) 
  8. echo $title."<br />"
  9. //如果节点循环了,可以用foreach循环取出 
  10. foreach($xml->channel->item as $item){ 
  11.  echo $item->title."<br />"
  12. //循环取出文章标题 
------分隔线----------------------------
------分隔线----------------------------

最新技术推荐