[转] 用php实现gb2312和unicode(UTF-8)间的编码转换

news/2024/7/7 1:23:38

gb2312 和 unicode (UTF-8)间的编码转换

下面的例子是将 gb2312 转换为 "全"这种形式

下面的例子是将 gb2312 转换为 "全"这种形式

php4.3.1以后的iconv函数很好用的,只是需要自己写一个uft8到unicode的转换函数
查表(gb2312.txt)也行
$text = "电子书库";
preg_match_all("/[/x80-/xff]?./",$text,$ar);
foreach($ar[0] as $v)
  echo "&#".utf8_unicode(iconv("GB2312","UTF-8",$v)).";";
?>
// utf8 -> unicode
function utf8_unicode($c) {
  switch(strlen($c)) {
    case 1:
      return ord($c);
    case 2:
      $n = (ord($c[0]) & 0x3f) << 6;
      $n += ord($c[1]) & 0x3f;
      return $n;
    case 3:
      $n = (ord($c[0]) & 0x1f) << 12;
      $n += (ord($c[1]) & 0x3f) << 6;
      $n += ord($c[2]) & 0x3f;
      return $n;
    case 4:
      $n = (ord($c[0]) & 0x0f) << 18;
      $n += (ord($c[1]) & 0x3f) << 12;
      $n += (ord($c[2]) & 0x3f) << 6;
      $n += ord($c[3]) & 0x3f;
      return $n;
  }
}
?>


下面的例子是利用php将"全"这中编码转换为gb2312.
$str = "TTL全天候自动聚焦";
$str = preg_replace("|&#([0-9]{1,5});|", "/".u2utf82gb(//1)./"", $str);
$str = "/$str=/"$str/";";

eval($str);
echo $str;

function u2utf82gb($c){
    $str="";
    if ($c < 0x80) {
         $str.=$c;
    } else if ($c < 0x800) {
         $str.=chr(0xC0 | $c>>6);
         $str.=chr(0x80 | $c & 0x3F);
    } else if ($c < 0x10000) {
         $str.=chr(0xE0 | $c>>12);
         $str.=chr(0x80 | $c>>6 & 0x3F);
         $str.=chr(0x80 | $c & 0x3F);
    } else if ($c < 0x200000) {
         $str.=chr(0xF0 | $c>>18);
         $str.=chr(0x80 | $c>>12 & 0x3F);
         $str.=chr(0x80 | $c>>6 & 0x3F);
         $str.=chr(0x80 | $c & 0x3F);
    }
    return iconv('UTF-8', 'GB2312', $str);
}
?>

或者是

function unescape($str) {
  $str = rawurldecode($str);
  preg_match_all("/(?:%u.{4})|&#x.{4};|&#/d+;|.+/U",$str,$r);
  $ar = $r[0];
print_r($ar);
  foreach($ar as $k=>$v) {
    if(substr($v,0,2) == "%u")
      $ar[$k] = iconv("UCS-2","GB2312",pack("H4",substr($v,-4)));
    elseif(substr($v,0,3) == "&#x")
      $ar[$k] = iconv("UCS-2","GB2312",pack("H4",substr($v,3,-1)));
    elseif(substr($v,0,2) == "&#") {
echo substr($v,2,-1)."
";
      $ar[$k] = iconv("UCS-2","GB2312",pack("n",substr($v,2,-1)));
    }
  }
  return join("",$ar);
}

$str = "TTL全天候自动聚焦";
echo unescape($str); //out TTL全天候自动聚焦

利用javascript来转换

<script language="JavaScript1.2">
/*
This following code are designed and writen by Windy_sk <seasonx@163.net>
You can use it freely, but u must held all the copyright items!
*/

function Str2Unicode(str){
var arr = new Array();
for(var i=0;i
  arr[i]="&#" + str.charCodeAt(i) + ";";
}
return(arr.toString().replace(/,/g,""));
}

function Unicode2oStr(str){
var re=/&#[/da-fA-F]{1,5};/ig;
var arr=str.match(re);
if(arr==null)return("");
for(var i=0;i
  arr[i]=String.fromCharCode(arr[i].replace(/[&#;]/g,""));
}
return(arr.toString().replace(/,/g,""))
}

function modi_str(){
if(document.all.text.method.checked){
  if(document.all.text.decode.value!=""){
   document.all.text.encode.value = Str2Unicode(document.all.text.decode.value);
  }else{
   document.all.text.decode.value = Unicode2oStr(document.all.text.encode.value);
  }
}else{
  if(document.all.text.encode.value!=""){
   document.all.text.decode.value = Unicode2oStr(document.all.text.encode.value);
  }else{
   document.all.text.encode.value = Str2Unicode(document.all.text.decode.value);
  }
}
}
</script>
Unicode


文本原型:

 
 

转换代码:

 
 

  正向转换
 
 
 


下面是一个显示所有全角半角的字体的查看例子


<script>
function showUni(min,max){
show.document.open();
show.document.writeln("");
show.document.writeln(min + " - " + max + "

");
var i=0;
for(i=min;i<=max;i++){
  show.document.write("&#" + i + ";");
}
show.document.close();
}
</script>








自定义: -



src="about:blank" id=show width=100% height=70% scroll=no>


下面是一个查表(gb2312),转换gb2312到utf8的例子, 现在有iconv函数,这个已经没有太大的意义了,

function gb2utf8($gb){
    if(!trim($gb))  return $gb;
    $filename="gb2312.txt";
    $tmp=file($filename);
    $codetable=array();
    while(list($key,$value)=each($tmp))
          $codetable[hexdec(substr($value,0,6))]=substr($value,7,6);

    $utf8="";
    while($gb) {
        if (ord(substr($gb,0,1))>127) {
          $this=substr($gb,0,2);
          $gb=substr($gb,2,strlen($gb)-2);
          $utf8.=u2utf8(hexdec($codetable[hexdec(bin2hex($this))-0x8080]));
        }else{
            $this=substr($gb,0,1);
            $gb=substr($gb,1,strlen($gb)-1);
            $utf8.=u2utf8($this);
        }
    }
    return $utf8;
}

function u2utf8($c){
    $str="";
    if ($c < 0x80) {
         $str.=$c;
    } else if ($c < 0x800) {
         $str.=chr(0xC0 | $c>>6);
         $str.=chr(0x80 | $c & 0x3F);
    } else if ($c < 0x10000) {
         $str.=chr(0xE0 | $c>>12);
         $str.=chr(0x80 | $c>>6 & 0x3F);
         $str.=chr(0x80 | $c & 0x3F);
    } else if ($c < 0x200000) {
         $str.=chr(0xF0 | $c>>18);
         $str.=chr(0x80 | $c>>12 & 0x3F);
         $str.=chr(0x80 | $c>>6 & 0x3F);
         $str.=chr(0x80 | $c & 0x3F);
    }
    return $str;
}

?>





http://www.niftyadmin.cn/n/3652100.html

相关文章

LVS+Keepalived实现高可用群集部署

内容概要一、Keepalived简介二、Keepalived实现原理三、KeepalivedLVS高可用部署案例1、首先配置DR负载调度器&#xff08;192.168.73.88和192.168.73.66两台一样的配置&#xff09;2、配置Web服务器&#xff08;192.168.73.188和192.168.73.166&#xff09;3、配置Keepalived&…

PHP中多张图片上传并校验的实现

单张的图片上传是不复杂的&#xff0c;这里涉及到多张图片上传和对图片格式的校验&#xff0c;保证上传的一定是图片&#xff0c;防止上传其他文件到服务器。基本实现算法是使用数组的形式&#xff0c;把所有的图片提交个一个数组&#xff0c;对数组的元素进行一个个的处理。/*…

PHP5中数据库抽象层: PDO

pdo是php5中新加入的数据库抽象层&#xff0c;为了解决访问不同数据库统一接口的问题。类似于PEAR::DB类和ADODB类的操作&#xff0c;不过它是直接封装再php扩展中&#xff0c;可以自由选择使用。目前的php5.1beta中已经更好的加入了pdo的支持&#xff0c;我们下看具体帮助。ht…

Haproxy负载均衡部署Web集群

内容概要一、HAProxy常见的的8种负载均衡策略二、HAProxy的主要特性三、Nginx、HAproxy、LVS的区别四、Haproxy参数的优化五、Haproxy搭建 Web 群集1、关闭防火墙&#xff0c;将安装Haproxy所需软件包传到/opt目录下2、编译安装 Haproxy3、Haproxy服务器配置4、添加haproxy 系统…

Mysql数据库简单介绍

内容概要一、数据库的组成二、数据库管理系统&#xff08;DBMS&#xff09;三、数据库系统&#xff08;DBS&#xff09;四、当今主流数据库五、关系型数据库介绍六、非关系型数据库介绍七、Mysql数据库介绍一、数据库的组成 1、数据&#xff1a;描述事务的符号记录&#xff0c;…

FreeBSD5.3进行CVSup升级不成功的问题

服务器刚装了FreeBSD5.3&#xff0c;想用cvsup升级一下系统于是我就先进&#xff1a;# cd /usr/ports/net/cvsup #进入Ports目录# make install #进行ports等待一段时间&#xff0c;看网速&#xff0c;我花了N个小时左右才ports完&#xff0c;我网速度很快的&#xff0c;也这…

[转] 详谈 vsftpd 的设置

VSFTPD 施文建 0 关于本文档 1 VSFTPD简述 2 VSFTPD的安装 2.1 RHL9vsftpd-1.1.3-8.i386.rpm包的安装 2.2 vsftpd-1.2.0.tar.gz的安装 3 VSFTPD的文件结构 4 VSFTPD的启动与停止 5 VSFTPD的设置选项 5.1 连接选项 5.1.1 监听地址与控制端口 5.1.2 FTP模式与数据端口 5.1.3 ASCI…

Mysql基础命令大全

内容概要一、常见的数据类型二、查看数据库三、SQL语句&#xff08;1&#xff09;DDL&#xff08;数据定义语言&#xff09;1、创建新的数据库2、创建新的表3、删除数据库中的表4、删除数据库&#xff08;2&#xff09;DML&#xff08;数据操作语言&#xff09;1、管理表中数据…