iconv函数的一个bug。iconv在转换字符”—”到gb2312时会出错,解决方法很简单,就是在需要转成的编码后加 “//IGNORE” 也就是iconv函数第二个参数后.以下为引用的内容:
iconv(“UTF-8″,”GB2312//IGNORE”,$data)
ignore的意思是忽略转换时的错误,如果没有ignore参数,所有该字符后面的字符串都无法被保存,这个iconv()这个函数,在php5中是内置的,实例代码如下:
- <?php
- echo $str= '你好,这里是卖咖啡!';
- echo '<br />';
- echo iconv('GB2312', 'UTF-8', $str);
- echo '<br />';
- echo iconv_substr($str, 1, 1, 'UTF-8');
- print_r(iconv_get_encoding());
- echo iconv_strlen($str, 'UTF-8');
-
- $content = iconv("UTF-8","gbk//TRANSLIT",$content);
- ?>
但是使用iconv函数可能会碰到如notice: iconv() [function.iconv]: detected an illegal character in input string ...错误了,原因是因为这个编码范围的问题,gb2312小于gbk小于uft8哦,所以大家转换时要注意了,不过我们php还提供了一个函数mb_detect_encoding他可以比较好的解决这个问题了,现在把它写成更专业的函数
- <?php
- function phpcharset($data, $to) {
- if(is_array($data)) {
- foreach($data as $key => $val) {
- $data[$key] = phpcharset($val, $to);
- }
- } else {
- $encode_array = array('ASCII', 'UTF-8', 'GBK', 'GB2312', 'BIG5');
- $encoded = mb_detect_encoding($data, $encode_array);
- $to = strtoupper($to);
- if($encoded != $to) {
- $data = mb_convert_encoding($data, $to, $encoded);
- }
- }
- return $data;
- }
- ?>
有时我们不知道字符的编码这时会需要先检测出编码再进行转换,代码如下:
- function asciitog($brand)
- {
- $cha=mb_detect_encoding($brand);
- if($cha=='utf-8')
- {
- $brand2 = iconv($cha,"gb2312",$brand);
- }
- $cha2=mb_detect_encoding($brand2);
- if($cha2!='ascii'){
- $brand=$brand2;
- }
-
- return $brand;
- }