PHP字长密度/计算字符串的计算

Given a text, how could I count the density / count of word lengths, so that I get an output like this

1 letter words : 52 / 1%
2 letter words : 34 / 0.5%
3 letter words : 67 / 2%

Found this but for python

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
duanpang5583 2011-07-18 19:44
关注
You could start by splitting your text into words, using either explode() (as a very/too simple solution) or preg_split() (allows for stuff that's a bit more powerful) :

$text = "this is some kind of text with several words"; $words = explode(' ', $text);

Then, iterate over the words, getting, for each one of those, its length, using strlen() ; and putting those lengths into an array :

$results = array(); foreach ($words as $word) { $length = strlen($word); if (isset($results[$length])) { $results[$length]++; } else { $results[$length] = 1; } }

If you're working with UTF-8, see mb_strlen().

At the end of that loop, $results would look like this :

array 4 => int 5 2 => int 2 7 => int 1 5 => int 1

The total number of words, which you'll need to calculate the percentage, can be found either :

By incrementing a counter inside the foreach loop,

or by calling array_sum() on $results after the loop is done.

And for the percentages' calculation, it's a bit of maths -- I won't be that helpful, about that ^^
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

PHP字长密度/计算字符串的计算 php
2011-07-18 19:39

回答 4 已采纳 You could start by splitting your text into words, using either explode() (as a very/too simple so
php为什么会显示一个中文字符占3个呢，请大神指教 php
2015-09-10 02:35

回答 3 已采纳 utf-8是3，gbk/gb2312是2 http://www.cnblogs.com/showker/archive/2011/07/15/2106994.html
计算机组成原理的小疑惑其他考研
2023-01-17 00:42

回答 1 已采纳 8位指cpu一次只能处理8位，16位就分2次处理呗字长到底是多少跟cpu位数没有直接的关系，32位的cpu里也有long long这种64位的数据类型呀
国家一级职业资格证书计算机类有哪些
2020-06-05 16:12

stay_foolish12的博客对于字的长度与具体机器字长有关，有题目指定，假设机器字长16位，则每个字可以表示16个磁盘块的占用情况； 3. 指定序号为n或第n+1个磁盘，占用情况需要用m=(n+1)/16（向上取整）个字表示，字的序号为m-1。...
计算机组成原理小问题 c# c++ c语言
2022-01-11 16:33

回答 4 已采纳每个存储单元都有一个自己的地址，而一个地址中存有几位的数据不同机器是不同的，一般来说一个地址中存有8位数据也就是一个字节的长度，但是也会有16位、32位的存储器，也就是一个地址中有16、32位的数
在32位字长的计算机中，double变量如何进行大端存储和小端存储？ c++ c语言
2019-07-24 12:53

回答 2 已采纳大端和小端和计算机的字长没有关系，而是固有的特性。大端和小端是按照字节来算的，比如说double是8个字节，那么在intel的处理器（小端）上，是 b1 b2 b3 b4 b5 b6 b7 b8
x位指令长的模型机计算机组成原理 eclipse java 有问必答
2021-07-06 08:45

回答 1 已采纳可以参考这个资源，积分不够可以帮你下载：https://download.csdn.net/download/ljw_study_in_CSDN/12594356
计算机相关单词 1000+
2018-09-14 11:03

Wu_Application的博客 302.CD(Compact Disk)光盘，激光唱盘，高密度磁盘 303.customize定制，按指定规格制造 304.setting设置，调整，装配 305.screen saver屏幕保护装置（程序） 306.screen resolution屏幕分辨率 307.menu菜单...
用边界值法写测试用例，字符串长度1-6，和机器字长16位什么意思，和题目有关吗？
2017-10-15 03:07

回答 2 已采纳 1. 字符一般占一个字节 2. 但是整型的长度却跟机器字长有关系，int型一般是一个机器字长，long int 是等于一个机器字长或者两个机器字长, long long int 一定不小于两个机器字
这是一个计算机组成原理的相关问题 c++
2020-05-11 13:26

回答 3 已采纳机器字长：计算机能直接处理的二进制数据的位数，机器字长一般等于内部寄存器的大小，它决定了计算机的运算精度。指令字长：一个指令中包含二进制代码的位数。存储字长：一个存储单元存储二进制代码的长度，
储存字长和 64位机的关系? 硬件工程
2022-09-11 22:37

回答 2 已采纳 64位机 /32位机，指的是机器字长，机器字长决定计算机运算精度； &a[0] 是指的指令字长； int 是存储字长，是在头文件规定，有很多系统等于机器字长。三者是整数倍呈整数倍关系。
前端面经真题解析6:字节-抖音-电商实习（2万字长文）
2023-05-22 11:31

浪里个浪zxf的博客算法题一：有效字符串（里面就是有字符串和数字，例'{134[]}'就是有效的）我当时先过滤数字，在用栈来判断有效括号 16. 算法题二：找到数组最近的目标值（简单的算法题） 1. 自我介绍当在前端面试中进行自我介绍时...
这是一个关于计算机组成原理的问题 c++
2020-05-31 17:47

回答 3 已采纳优点：相同的地址范围可以表示更大的存储空间。也就是意味着节约了地址。访问连续大量的数据更有效率。缺点：访问零碎不连续数据效率更低，更消耗cpu
大数据开发面试知识点总结
2021-02-09 11:22

GoAI的博客它通过增加副本的形式，提高容错性 ②：某一个副本丢失以后，它可以自动恢复适合批处理即就近原则 ①：移动计算而非非数据，数据位置暴露给计算机框架 ②：本地化，数据不移动，代码（任务）移动。适合处理大数据 ...
数据库系统工程师考点笔记
2021-04-14 10:52

@北海怪兽的博客 8.4.7 字符串操作 8.4.8 集合操作 8.4.9 视图查询与更新 8.5 完整性约束 8.5.1 主键(Primary Key) 约束 8.5.2 外键(Foreign Key)约束 8.5.3 属性值上的约束 8.5.4 全局约束 8.6 授权(GRANT) 与销权(REVOKE) 8.7 创建...
【软考中级】软件设计师笔记
2023-03-10 09:32

笔触狂放的博客其中静态语义分析方法是语法制导翻译，其基本思想是将语言的语义以属性的形式赋予代表此结构的文法符号，而属性的计算以语义规则的形式赋予文法的产生式词法分析阶段：输入源程序，对构成源代码的字符串进行扫描和...
软考软件设计师必背100题
2024-03-12 23:33

ZShiJ的博客内存编址内容：按字编址（每个存储单元存放内容为机器字长—题干定义）、按字节编址（每个存储单元内容为1字节即8bit）。内存总容量=存储单元个数*编址内容。内存总容量=单位芯片容量*芯片片数。芯片片数=内存总...
【粤教版必修二《信息系统与社会》】知识总结与题目分析
2022-11-07 10:46

Cathyzq的博客培养人们计算思维方式，计算思维是指个体运用计算机科学领域的思想方法，在形成问题解决方案的过程中产生的一系列思维活动。提升人们信息意识与信息社会责任感：信息意识是指个体对信息的敏感度和对信息价值的判断...
计算机基础知识(免费、全面)
2020-12-27 08:49

MrFlySand_飞沙的博客存储程序名字功能/介绍 ENIAC美国宾夕法尼亚大学1946 第一代电子积分计算机，8位机科防计算 EDSAC英国剑桥大学在1949 时序，电子延迟存储自动计算机存储程序实现，第一代商业应用电子计算机 EDVAC冯诺依曼1994 ...
软件设计师刷题与知识点总结笔记
2021-03-08 16:34

php的绯闻女友的博客签名的验证就是计算数据块的散列值，然后使用公钥解密数据签名得到另一个散列值，比较2个散列值就可以判断数据块在签名后有没有被改动。常用的信息摘要算法有MD5，SHA等，市场上广泛使用的MD5、SHA算法的散列值分别...
没有解决我的问题, 去提问

悬赏问题

¥15 制裁名单20240508芯片厂商
¥20 易康econgnition精度验证
¥15 线程问题判断多次进入
¥15 msix packaging tool打包问题
¥28 微信小程序开发页面布局没问题，真机调试的时候页面布局就乱了
¥15 python的qt5界面
¥15 无线电能传输系统MATLAB仿真问题
¥50 如何用脚本实现输入法的热键设置
¥20 我想使用一些网络协议或者部分协议也行，主要想实现类似于traceroute的一定步长内的路由拓扑功能
¥30 深度学习，前后端连接

PHP字长密度/计算字符串的计算

4条回答 默认 最新

悬赏问题

4条回答默认最新