手机
当前位置:查字典教程网 >编程开发 >php教程 >PHP实现通过中文字符比率来判断垃圾评论的方法
PHP实现通过中文字符比率来判断垃圾评论的方法
摘要:本文实例讲述了PHP实现通过中文字符比率来判断垃圾评论的方法。分享给大家供大家参考。具体实现方法如下:一、需求:最近一段时间常常出现这类垃圾...

本文实例讲述了PHP实现通过中文字符比率来判断垃圾评论的方法。分享给大家供大家参考。具体实现方法如下:

一、需求:

最近一段时间常常出现这类垃圾评论:一大段英文字符里夹杂一两个生僻汉字,包含了中文字符,而且又没包含啥中文的敏感词,所以就堂而皇之的通过了评论过滤。对这类评论的处理可以采取判断中文字符的比率来确认,但是也会存在一定的误判。

二、解决方案:

要用到php的两个函数strlen和mb_strlen,strlen会把单个汉字长度认定为3,mb_strlen单个汉字长度为1。同一段字符通过两个函数取得的长度之差就是实际汉字字符数的二倍,除以二就得到实际的字符数,在与mb_strlen取得的长度求比值就得到汉字占总字符数的比率。

三、实现代码:

复制代码 代码如下: $len_all = strlen($comment['text']);

$len_st = mb_strlen($comment['text'], 'UTF-8');

if(($len_all-$len_st)/(2*$len_st) < 0.5){

$error = "中文字符少于百分之五十";

}

如果在评论中贴代码的话,就会造成中文字符比率低,需要过滤掉代码字段再来判断。

希望本文所述对大家的PHP程序设计有所帮助。

【PHP实现通过中文字符比率来判断垃圾评论的方法】相关文章:

PHP+shell实现多线程的方法

php一个解析字符串排列数组的方法

php实现将上传word文件转为html的方法

PHP实现过滤掉非汉字字符只保留中文字符

JavaScript实现滚动栏效果的方法

PHP中路径问题的解决方案

PHP环境搭建最新方法

php实现修改新闻时删除图片的方法

php实现比较两个字符串日期大小的方法

php将HTML表格每行每列转为数组实现采集表格数据的方法

精品推荐
分类导航