json已经成为当前web开发最常用的数据格式,php也从5.2开始支持json和数组的转换函数 json_encode 和 json_decode 。但使用过程中我们会发现,(下面以“你”这个汉字为例)通过json_encode 函数转换后的中文全部变成了类似 u4f60 (你)这样的编码,虽然不影响程序执行,但是很不直观.
首先,json_encode 对中文的处理是转成了对应的 unicode 码的十六进制表示符 u4f60,(和 js 的 escape 函数类似(%u4f60)),即 0x4f60。因此,我们只需要将 unicode 码(UCS-2)转成 utf-8 编码的汉字即可,函数如下:
-
-
-
-
- function json_encode_cn($data) {
- $data = json_encode($data);
- return preg_replace("/u([0-9a-f]{4})/ie", "iconv('UCS-2', 'UTF-8', pack('H*', '$1'));", $data);
- }
在这里,首先将目标数据转成 unicode 编码码的json串,然后利用正则将对应的 u 开头的四位字母替换成对应的文字,然后再次转码即可。preg_replace 正则中的 e 允许第二个参数执行 eval 操作,首先匹配出 uxxxx ,然后通过pack 函数将十六进制数值 xxxx 转成Unicode编码的字符,然后再将 Unicode 码转成 utf-8 码,然后就可以看到正常的汉字了。
另一种json_encode()不支持中文字符的解决方案,代码如下:
-
-
-
-
-
-
-
- function wphp_urlencode($data) {
- if (is_array($data) || is_object($data)) {
- foreach ($data as $k => $v) {
- if (is_scalar($v)) {
- if (is_array($data)) {
- $data[$k] = urlencode($v);
- } else if (is_object($data)) {
- $data->$k = urlencode($v);
- }
- } else if (is_array($data)) {
- $data[$k] = wphp_urlencode($v);
- } else if (is_object($data)) {
- $data->$k = wphp_urlencode($v);
- }
- }
- }
- return $data;
- }
-
-
-
-
-
-
-
-
-
-
-
- function ch_json_encode($data) {
- $ret = wphp_urlencode($data);
- $ret = json_encode($ret);
- return urldecode($ret);
- }