PHP utf8_encode XML 解析器函数

  • 定义和用法

    utf8_encode - 将 ISO-8859-1 编码的字符串转换为 UTF-8 编码。
  • 版本支持

    PHP4 PHP5 PHP7
    支持 支持 支持
  • 语法

    utf8_encode ( string $data )
    
    该函数将 data 字符串转换为 UTF-8 编码,并返回编码后的字符串。UTF-8 是一种用于将宽字符值转换为字节流的 Unicode 的标准机制。UTF-8 对于纯 ASCII 字符来说是透明的,且是自同步的(也就是说这使得程序能够得知字符从字节流的何处开始),并可被普通字符串比较函数用以比较等操作。PHP 可将 UTF-8 编码为多达四个字节的字符,如:
    字节 表示
    1 7 0bbbbbbb
    2 11 110bbbbb 10bbbbbb
    3 16 1110bbbb 10bbbbbb 10bbbbbb
    4 21 11110bbb 10bbbbbb 10bbbbbb 10bbbbbb
    每个 UTF-8 表示一个能被用以储存字符数据的位。
  • 参数

    参数 必需的 描述
    data ISO-8859-1编码的数据
  • 返回值

    返回 UTF-8 编码的数据。
  • 示例

    //此函数可能有用,可以对数组键和值进行编码(并先检查其是否已采用UTF格式):
    public static function to_utf8($in)
    {
        if (is_array($in)) {
            foreach ($in as $key => $value) {
                $out[to_utf8($key)] = to_utf8($value);
            }
        } elseif(is_string($in)) {
            if(mb_detect_encoding($in) != "UTF-8")
                return utf8_encode($in);
            else
                return $in;
        } else {
            return $in;
        }
        return $out;
    }
    
  • 相关函数

    utf8_decode() - 将用 UTF-8 方式编码的 ISO-8859-1 字符串转换成单字节的 ISO-8859-1 字符串。