编写一个PHP中文截取无乱码的函数
19-02-26 14:09
字数 984
阅读 1669
已编辑
PHP截取字符串的函数是substr
,但是此函数在截取包含中文字符串时,有可能发生乱码情况,因为utf-8下一个中文占3个字节,所以你可能截取了一个中文字符的一部分。
为了避免这种情况,我们需要自定义一个函数。字符串编码按utf-8对待。
/**
* 中文截取无乱码
* @param $str
* @param $start
* @param $length
* @return string|null
*/
function mbSubStr($str, $start, $length)
{
// 最终返回的字符串
$resultStr = null;
// 字符串的长度
$len = strlen($str);
// 要截取的位置和对应位置长度的数组
$l2pMap = [];
// 字符的下标[中文按一个字符对待]
$index = 0;
for ($i = 0; $i < $len; $i++) {
$l2pMap[$index] = $i;
$index++;
if (ord(substr($str, $i, 1)) >= 0xa0) {
$i += 2;
}
}
// 真正要开始截取的位置
$realStartPosition = isset($l2pMap[$start]) ? $l2pMap[$start] : false;
if (false === $realStartPosition) return $resultStr;
// 截取拼接字符串
$realLength = $l2pMap[$start + $length];
for ($i = $realStartPosition; $i < $realLength; $i++) {
if (ord(substr($str, $i, 1)) >= 0xa0) {
$resultStr .= substr($str, $i, 3);
$i += 2;
} else {
$resultStr .= substr($str, $i, 1);
}
}
return $resultStr;
}
$str = "你好啊哈哈china";
$r1 = mbSubStr($str, 0, 6);
$r2 = mb_substr($str, 0, 6);
var_dump($r1, $r2);
// string '你好啊哈哈c' (length=16)
// string '你好啊哈哈c' (length=16)
其实打开php_mbstring扩展后,可以使用mb_substr
函数截取中文字符串,并且不会有乱码情况,上面的代码只是实现了和mb_substr
函数一样的效果。
0人点赞>
0 条评论
排序方式
时间
投票
快来抢占一楼吧
请登录后发表评论
相关推荐
文章归档
2024-11
1 篇
2024-06
1 篇
2024-05
2 篇
2024-04
2 篇
2024-03
2 篇
展开剩余 68 条
2024-01
1 篇
2023-10
1 篇
2023-09
1 篇
2023-08
1 篇
2023-06
1 篇
2023-04
1 篇
2022-12
2 篇
2022-06
1 篇
2022-04
4 篇
2022-03
3 篇
2022-01
6 篇
2021-12
2 篇
2021-11
2 篇
2021-10
2 篇
2021-09
1 篇
2021-08
2 篇
2021-07
4 篇
2021-06
1 篇
2021-05
3 篇
2021-04
3 篇
2021-01
2 篇
2020-11
1 篇
2020-10
3 篇
2020-09
2 篇
2020-08
1 篇
2020-07
5 篇
2020-06
5 篇
2020-05
1 篇
2020-04
1 篇
2020-03
2 篇
2020-02
3 篇
2020-01
1 篇
2019-11
5 篇
2019-10
10 篇
2019-09
12 篇
2019-08
17 篇
2019-07
8 篇
2019-05
3 篇
2019-04
8 篇
2019-03
7 篇
2019-02
8 篇
2019-01
5 篇
2018-12
7 篇
2018-11
8 篇
2018-10
4 篇
2018-09
7 篇
2018-08
12 篇
2018-07
9 篇
2018-06
6 篇
2018-05
11 篇
2018-04
18 篇
2018-03
1 篇
2018-02
2 篇
2018-01
10 篇
2017-12
14 篇
2017-11
44 篇
2017-10
13 篇
2017-09
4 篇
2017-08
12 篇
2017-07
5 篇
2017-06
4 篇
2017-05
2 篇
2017-04
3 篇
2017-03
9 篇
2017-02
3 篇
2017-01
2 篇
2016-12
10 篇
2016-11
4 篇
最新文章
最受欢迎
11-07 19:00
06-26 11:51
05-17 17:08
05-17 10:59
04-11 17:05
13 评论
11 评论
10 评论