手机
当前位置:查字典教程网 >编程开发 >mysql数据库 >mysql 字符串长度计算实现代码(gb2312+utf8)
mysql 字符串长度计算实现代码(gb2312+utf8)
摘要:PHP对中文字符串的处理一直困扰于刚刚接触PHP开发的新手程序员。下面简要的剖析一下PHP对中文字符串长度的处理:PHP自带的函数如strl...

PHP对中文字符串的处理一直困扰于刚刚接触PHP开发的新手程序员。下面简要的剖析一下PHP对中文字符串长度的处理:

PHP自带的函数如strlen()、mb_strlen()都是通过计算字符串所占字节数来统计字符串长度的,一个英文字符占1字节。例:

$enStr = 'Hello,China!';

echo strlen($enStr); // 输出:12

而中文则不然,做中文网站一般会选择两种编码:gbk/gb2312或是utf-8。utf-8能兼容更多的字符,所以受到很多站长的喜爱。gbk与utf-8对中文的编码不同,导致中文在gbk与utf-8编码下所占字节也有差异。

gbk编码下每个中文字符所占字节为2,例:

$zhStr = '您好,中国!';

echo strlen($zhStr); // 输出:12

utf-8编码下每个中文字符所占字节为3,例:

$zhStr = '您好,中国!';

echo strlen($zhStr); // 输出:18

那么如何计算这组中文字符串的长度呢?有人可能会说gbk下获取中文字符串长度除以2,utf-8编码下除以3不就行了吗?但是您要考虑字符串并不老实,99%的情况会以中英混合的情况出现。

这是WordPress中的一段代码,主要思想就是先用正则将字符串分解为个体单元,然后再计算单元的个数即字符串的长度,代码如下(只能处理utf-8编码下的字符串):

复制代码 代码如下:

$zhStr = '您好,中国!';

$str = 'Hello,中国!';

// 计算中文字符串长度

function utf8_strlen($string = null) {

// 将字符串分解为单元

preg_match_all("/./us", $string, $match);

// 返回单元个数

return count($match[0]);

}

echo utf8_strlen($zhStr); // 输出:6

echo utf8_strlen($str); // 输出:9

utf8_strlen – 获得UTF8编码的字符串的长度

复制代码 代码如下:

/*

* 用于UTF8编码的程序

* 获得字符串的长度,一个中文表示3个长度

* itlearner注释

*/

function utf8_strlen($str) {

$count = 0;

for($i = 0; $i < strlen($str); $i++){

$value = ord($str[$i]);

if($value > 127) {

$count++;

if($value >= 192 && $value <= 223) $i++;

elseif($value >= 224 && $value <= 239) $i = $i + 2;

elseif($value >= 240 && $value <= 247) $i = $i + 3;

else die('Not a UTF-8 compatible string');

}

$count++;

}

return $count;

}

【mysql 字符串长度计算实现代码(gb2312+utf8)】相关文章:

Mysql varchar大小长度问题介绍

mysql下完整导出导入实现方法

mysql 字符集的系统变量说明

mysql 前几条记录语句之(limit)

mysql 控制台程序的提示符 prompt 字符串设置

mysql函数split功能实现

Mysql 默认字符集设置方法(免安装版)

mysql中为用户设置密码的多种方法

mysql 让一个存储过程定时作业的代码

mysql 忘记密码的解决方法(linux和windows小结)

精品推荐
分类导航