中英文混和的字符串的ASCII与UNICODE编码与解码

栏目:建站技术 2020-10-30

//1:获取中英文混合字符的编码(ASCII码与UNICODE码)
$str = "官网制作:网巢网络";
foreach (math($str) as $key => $value) {
    if (preg_match('/^[x{4e00}-x{9fa5}]+$/u',$value)) {//中文,注意中文这里暂时不转换,因为无法通过chr函数来获取中文,
        $arr_chr[]=unicode_encode($value);
    } else {//英文
        $arr_chr[]=asc($value);
    }
}
//再将数组转换成字符串
$strs = implode(",", $arr_chr);


//2:将上面的字符串解析成原来的字符串
$arr_chr = explode(",", $strs);
foreach ($arr_chr as $key => $value) {
    if(is_numeric($value))//如果是数字将ASCII码转换成英文字符
    {
        echo chr($value);
    }else{//否则将UNICODE编码后的内容进行解码成汉字
        echo unicode_decode($value);
    }
}

//函数
//php将字符串分割成数组实现中文分词
function math($string,$code ='UTF-8'){
    if ($code == 'UTF-8') {
     $pa = "/[x01-x7f]|[xc2-xdf][x80-xbf]|xe0[xa0-xbf][x80-xbf]|[xe1-xef][x80-xbf][x80-xbf]|xf0[x90-xbf][x80-xbf][x80-xbf]|[xf1-xf7][x80-xbf][x80-xbf][x80-xbf]/";
    } else {
        $pa = "/[x01-x7f]|[xa1-xff][xa1-xff]/";
    }
    preg_match_all($pa, $string, $t_string);
    $math="";
    foreach($t_string[0] as $k=>$s){
        $math[]=$s;
    }
     return $math;
}
//转换成ascii码,注意其实中文是没有ascii码的,所以最好将中文转成UNICODE编码
function asc($s) {
  if(ord($s) < 128) return ord($s);
  //return current(unpack('N', "xffxff$s"));
}
//将中文进行UNICODE编码,编码后的内容格式:u56feu7247
function unicode_encode($name)  
{  
    $name = iconv('UTF-8', 'UCS-2', $name);
    $len = strlen($name);  
    $str = '';  
    for ($i = 0; $i < $len - 1; $i = $i + 2)  
    {  
        $c = $name[$i];  
        $c2 = $name[$i + 1];  
        if (ord($c) > 0)  
        {    // 两个字节的文字  
            $str .= 'u'.base_convert(ord($c), 10, 16).base_convert(ord($c2), 10, 16);  
        }  
        else  
        {  
            $str .= $c2;  
        }  
    }  
    return $str;  
}
// 将UNICODE编码后的内容进行解码变成汉字
function unicode_decode($name)  
{  
    // 转换编码,将Unicode编码转换成可以浏览的utf-8编码  
    $pattern = '/([w]+)|(\u([w]{4}))/i';  
    preg_match_all($pattern, $name, $matches);  
    if (!empty($matches))  
    {  
        $name = '';  
        for ($j = 0; $j < count($matches[0]); $j++)  
        {  
            $str = $matches[0][$j];  
            if (strpos($str, '\u') === 0)  
            {  
                $code = base_convert(substr($str, 2, 2), 16, 10);  
                $code2 = base_convert(substr($str, 4), 16, 10);  
                $c = chr($code).chr($code2);  
                $c = iconv('UCS-2', 'UTF-8', $c);  
                $name .= $c;  
            }  
            else  
            {  
                $name .= $str;  
            }  
        }  
    }  
    return $name;  
}

相关阅读

不带www跳转到www,http跳转到https

2023-03-38

一:windows操作系统,在网站根目录下,新建web.config这个文件1:不带www跳转到www代码示例&lt;?xmlversion=&quot;1.0&quot;encoding=&quot;UTF-8&quot;?&gt;&lt;configuration&gt;&lt;system.webServer&gt;&lt;rewrite&gt;&lt…

帝国CMS-采集关键的经验总结

2020-10-1025

采集关键的几个步骤一:先建好栏目二:增加采集节点(需要选择栏目)三:录入节点名称四:如果有很多页,只需录入采集页面地址方式二中的内容地址为http://www.sznest.net/news.asp?big_class_id=3&amp;page=[page]页码从1到多少页之间、间隔倍数为1(这个多少页即被采集的网站的实际页数,注意这里修改后,在采集页面地…

删除bom标签或者bom头的php代码

2020-10-1029

有时程序的逻辑代码完全没有一问题,但是就是运行的时候出错,如果出现这种情况,那么有可能就是文件中包含了bom头所导致的,下面给出了php去除bom头的源代码,只要把下面的代码放到一个php的文件中,并且改好目录,然后运行那个文件就可以了//此文件用于快速测试UTF8编码的文件是不是加了BOM,并可自动移除=&quot;.&quot;;//修改此行为需要检测的…

如何修改文件默认打开方式为指定的程序?

2023-01-1287

一:“开始菜单”,在里面点击右侧的“运行”选项,输入“regedit”命令,打开注册表修改默认的打开方式需要在注册表中操作,在完成这个操作之前,我们先了解一下注册表中的以下的三个概念项:即左侧的类似于文件夹一样的图标数值名称:即点击“项”之后出现在右侧部分的左边的那个名称数值数据:即点击“项”之后出现在右侧部分的右边的那个数据了解了以上的三个概念之后,接下来…

如何将程序添加到右键菜单中?

2020-10-1036

方法一:在HKEY_CLASSES_ROOT*shell下面添加sublime_textCommand,修改Command项的默认值的数据数值为&quot;D:我的文档sublimetext3sublime_text.exe&quot;&quot;%1&quot;改了之后此方法你会发现不管选择什么类型的文件都会出现在右键菜单中方法二:修改HKEY_CLASS…

TP5请求信息与请求参数

2020-10-1064

&lt;?phpnamespaceappindexcontroller;usethinkController;usethinkRequest;classIndexextendsController{publicfunctionindex(){//index/index/index/name/zs/age/18/sex/nan//使用函数助手不需要usethi…