huhubjbbfy 2021-11-21 15:04 采纳率: 100%
浏览 56
已结题

用python的字典做数据统计

求帮忙改一下(实在改不了求告知怎么做,实在做不出来)
1.数据data.txt中给出了不同时间的各个网站的点击量。要求同学们统计整个这段时间内所有网站的点击量,并输出点击量排名前20名的网站和对应的点击次数(按照点击量从大到小输出)。

网站 点击量
品牌词产品 17600
品牌词广告 15865
百度 10858
品牌词运营 9768
百度 9228
品牌词导航 3824
品牌词运营 3673
品牌词运营 3553
四次元应用 3585
品牌词广告 3469
360 2908
品牌词产品 1858
搜狗 1996
四次元应用 1660
微信 1572
亿起发 2124
品牌词导航 1477
搜狗综会品专slm 1310
#############

import numpy as np
fr=open('data.txt','r+')
lines=fr.readlines()
retData={}
for line in lines:
    items=line.strip().split("\t")
    if items[0] in retData:
        retData[items[0]]=retData.get(items[0])+items[1]
    else:
        retData[items[0]]=items[1]
for i in range(20):
    web=items
    count=retData[i]
    print("[0:<10][1:>5]".format(web,count))

运行结果及报错内容

KeyError: 0

  • 写回答

1条回答 默认 最新

  • 关注

    字典不是直接用下标访问的
    代码修改后如下(你自己把文件读入部分和split部分改回去即可)

    import numpy as np
    fr = open('out.txt', 'r+', encoding='utf-8')
    lines = fr.readlines()
    retData = {}
    for line in lines:
        items = line.strip().split(" ")
        print(items)
        if items[0] in retData:
            retData[items[0]] = retData.get(items[0])+items[1]
        else:
            retData[items[0]] = items[1]
    sortedData=sorted(retData.items(),key=lambda x:x[1],reverse=True)
    for i in range(20):
        web = sortedData[i][0]
        count = sortedData[i][1]
        print("{0:<10}{1:>5}".format(web, count))
    

    如果你提供的数据不足20个,还是会报越界错误,但你的文件里面应该不止20条数据,所以应该没问题

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录

报告相同问题?

问题事件

  • 系统已结题 11月29日
  • 已采纳回答 11月21日
  • 创建了问题 11月21日

悬赏问题

  • ¥15 使用ue5插件narrative时如何切换关卡也保存叙事任务记录
  • ¥20 软件测试决策法疑问求解答
  • ¥15 win11 23H2删除推荐的项目,支持注册表等
  • ¥15 matlab 用yalmip搭建模型,cplex求解,线性化处理的方法
  • ¥15 qt6.6.3 基于百度云的语音识别 不会改
  • ¥15 关于#目标检测#的问题:大概就是类似后台自动检测某下架商品的库存,在他监测到该商品上架并且可以购买的瞬间点击立即购买下单
  • ¥15 神经网络怎么把隐含层变量融合到损失函数中?
  • ¥15 lingo18勾选global solver求解使用的算法
  • ¥15 全部备份安卓app数据包括密码,可以复制到另一手机上运行
  • ¥20 测距传感器数据手册i2c