使用mb_substr仍然会在最后破坏重音字符

Logic: I am getting username from DB and if it is greater than 30 in length then i show 30 characters with "..." appended at the end. Code is

$username = htmlspecialchars($username);
if(mb_strlen($username, 'utf-8')>30){
    $username_trimmed = mb_substr($username, 0, 30, 'utf-8').'...';
}

and in my navivation I am just printing this username

<class="userName">Hello, <?php echo $username_trimmed; ?>

My encoding in set as utf-8, and mbstring extension is enabled in php.

Output of above code : It still breaks the accent character É because it is multi-byte character and it is getting cut the in the middle. Actual word is MARCHÉS and output is:

Question what am I missing? mb_substr should not consider it as a single character and should not stop it from breaking in the middle as it does?

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
doubi2228 2016-08-22 04:19
关注
Your string is actually "É", not "É". mb_substr handles your characters just fine, it does not handle HTML entities. Don't store HTML entities in your database, store actual Unicode characters. At the very least, decode from HTML entities to actual characters using html_entity_decode($str, ENT_COMPAT, 'UTF-8') before applying mb_substr (and then apply htmlspecialchars again afterwards to preserve HTML syntax).

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报
编辑

预览
轻敲空格完成输入
显示为

卡片

标题

链接
评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

编辑

预览

报告相同问题？

关注问题

php iconv错误,php – 为什么iconv会产生非法字符错误？
2021-04-21 13:25

逃命的饼干的博客我正试图从剧本中删除警告和通知....据我了解,该行的目的是按照脚本原作者的意图,从字符串中删除非UTF-8字符,但显然输入中的任何非UTF-8字符都会导致iconv抛出非法的人物警告.为了解决这个问题,我的想法是做类似...
php 判断是否以开头,如何在PHP中检查字符串是否以“_”开头？
2021-04-25 05:15

ianva的博客是否可以访问字符串后面的char数组？有人发布了一个使用正则表达式的答案，令人惊讶地被否决了4次，理由是它"不适合使用正则表达式"。由于同龄人的压力，该答案的所有者删除了它。如果输入验证不能很好地使用正则...
php byte转宽字符,php 中的宽字符处理
2021-04-26 17:48

赵猪倌的博客编码问题简述ASCII编码，ASCII(American Standard Code for Information Interchange)，是一种字符编码标准，它的字符集为英文字符集，它规定字符集中的每个字符均由一个字节表示，指定了字符表编码表，称为ASCII...
mysql efbbbf_php 中的宽字符处理 -- 不完全描述
2021-01-27 05:56

番皂泡的博客编码问题简述ASCII编码，ASCII(American Standard Code for Information Interchange)，是一种字符编码标准，它的字符集为英文字符集，它规定字符集中的每个字符均由一个字节表示，指定了字符表编码表，称为ASCII...
php 提示宽输出,php 中的宽字符处理
2021-04-13 06:46

Books.Fan的博客编码问题简述ASCII编码，ASCII(American Standard Code for Information Interchange)，是一种字符编码标准，它的字符集为英文字符集，它规定字符集中的每个字符均由一个字节表示，指定了字符表编码表，称为ASCII...
学习正则表达式 - 匹配 Unicode 和其它字符
2023-05-09 07:18

wzy0623的博客使用 \uxxxx 任意Unicode字符；用八进制格式匹配0-255范围内的字符；通过 \p{x} 来使用Unicode字符属性；用 \cx 匹配控制字符；匹配 emoji 符号；匹配中文；汉字转拼音函数；单词首字母大写其它小写函数
php 中的宽字符处理 -- 不完全描述
2019-06-27 00:52

weixin_30360497的博客 ASCII编码，ASCII(American Standard Code for Information Interchange)，是一种字符编码标准，它的字符集为英文字符集，它规定字符集中的每个字符均由一个字节表示，指定了字符表编码表，称为ASCII码表。...
【MySQL】【翻译】8.0 GA版本的新特性 What’s New in MySQL 8.0
2018-05-01 14:10

weixin_34239592的博客 MySQL 8.0应面向MySQL开发人员的需求，带来了SQL，JSON，公共表达式，地理信息系统等方面的特性，因为很多开发人员有存储EmoJi表情的需求，在新版本中UTF8MB4成为默认的字符集。除此之外，还有对Binary数据类型按位...
PHP7 Zend 认证学习指南（二）
2024-08-03 04:07

绝不原创的飞龙的博客 strstr()在字符串中搜索子字符串，并返回干草堆中出现在第一个匹配项之后的部分。如果没有找到匹配项，则返回false。注意使用strpos()更好，因为它更快。stristr()不区分大小写的版本strstr()。strchr()返回第一次...
没有解决我的问题, 去提问

使用mb_substr仍然会在最后破坏重音字符

2条回答 默认 最新

2条回答默认最新