爬网易新闻的评论，代码如下，遇到问题KeyError

from bs4 import BeautifulSoup
import requests
import json

headers={'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.64 Safari/537.36 Edg/101.0.1210.53'}
commentURL='https://comment.tie.163.com/H8DOPGM90519DTSV.html'

def creatURL(commentURL,offset,limit):
    s1='https://gw.m.163.com/commons-user-main/api/v1/commons/user/pc/getUserByCookie?isbtn=false&trace_id=IuKWAHFuVvX1653835134118'
    s2='/comments/newList?offset='
    name=commentURL.split('/')[-1].split('.')[0]
    u=s1+str(name)+s2+str(offset)+'&limit='+str(limit)
    return u
res=requests.get(url=creatURL(commentURL,1,40),headers=headers).content
data=json.loads(res.decode())

for key in data['comments'].keys():
    print(data['comments'][key]['comment'])

爬取网易新闻评论页的评论，遇到问题for key in data['comments'].keys():
KeyError: 'comments'，是不是长度有问题？url=creatURL(commentURL,1,40)是不是说获取40个评论？这个一页上是没有40条评论的，但是总的评论数又超过了40个
网页地址是https://comment.tie.163.com/H8DOPGM90519DTSV.html

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

法学僧转行程序猿 2022-05-30 12:14

关注

你这个问题我没找到解决办法，但是你如果仅仅是为了获取评论数据，按照我的方法可以绕过你的问题取获取，我觉得这样简单的多，我这里测试过没发现报错

import requests
import re
import time
# 看到最新评论一共有五页,翻页关键参数在offset
page=0
s=1
for page in range(1,5):
    print(f'-------------开始采集第{s}页数据----------------')
    # 开发者工具抓包找到对应数据所在链接
    url=f'https://comment.api.163.com/api/v1/products/a2869674571f77b5a0867c3d71db5856/threads/H8DOPGM90519DTSV/comments/newList?ibc=newspc&limit=30&showLevelThreshold=72&headLimit=1&tailLimit=2&offset={page}&callback=jsonp_1653882863959&_=1653882863960'
    data={}
    headers={
        'Referer': 'https://comment.tie.163.com/',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.64 Safari/537.36 Edg/101.0.1210.53'
    }
    resp=requests.get(url,headers=headers)
    # print(resp.text)
    commentId_list=re.findall('"commentId":(.*?),',resp.text)  # 用户id列表
    content_list=re.findall('"content":"(.*?)",',resp.text)  # 用户评论列表
    # print(commentId_list)
    # print(content_list)
    n=1
    for commentId in commentId_list:
        print(commentId,content_list[n-1])
        time.sleep(0.5)
        n+=1
    s+=1
    page+=30

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(3条)

报告相同问题？

关注问题

爬网易新闻的评论，代码如下，遇到问题KeyError python 爬虫
2022-05-29 23:21

回答 4 已采纳你这个问题我没找到解决办法，但是你如果仅仅是为了获取评论数据，按照我的方法可以绕过你的问题取获取，我觉得这样简单的多，我这里测试过没发现报错 import requests import re imp
python代码在运行fedformer时遇到keyerror:'Reformer'的问题 python
2023-04-11 15:53

回答 1 已采纳 self.args.model这个变量应该是 Reformer字符串，而model_dict这个字典，没有关键词 Reformer所以你程序的上下文应该有问题
python词云出现KeyError问题 python 有问必答
2021-03-19 16:53

回答 3 已采纳就代码中词云图问题，一是代码中wordlist是一个生成器对象，需要遍历出来，文本分割是全分割，其中有很多标点符号和其他字符不是中文，需要对其进行筛选剔除。wl=' '.join([x for x i
python网络爬虫
2021-11-12 20:05

愿热爱常在的博客运行环境：python3 BeautifulSoup4解析库中文文档： https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html BeautifulSoup4 是 HTML/XML 的解析器，主要的功能便是解析和提取 HTML/XML 中的数据。 ...
编写斗地主发牌代码，遇到KeyError: 50错误 python
2022-06-02 10:21

回答 2 已采纳 poker = pokers_dict[player2_key] pokers_dict这个字典里面没有50这个关键字，少了A吧
python里的KeyError是出了什么问题 python
2022-12-09 12:21

回答 1 已采纳望采纳KeyError 是一个 Python 内置的异常，表示在字典中找不到指定的键。在这个特定的情况下，似乎是在读取 CSV 文件的时候发生了这个键错误。由于代码中的字符串 'source' 大小写
python json爬虫企业信息，为什么提示keyerror呢 python 有问必答
2021-09-01 13:03

回答 4 已采纳要添加Referer头，要不返回的是{'status': -1, 'msg': '非法操作'}内容，当然会出错。。。有帮助麻烦点个采纳【本回答右上角】，谢谢~~ import requests h
python 网络爬虫
2023-06-11 09:53

圆弧YH的博客 file1.write(data) 或者用如下代码 #【舉例】 import requests webFile=requests.get("https://www.pku.edu.cn/about.html")#爬虫获得html文件 webFile.encoding="utf-8"#爬虫解析网页文件 data=webFile.text#用...
python可视化 KeyError问题 python
2022-12-14 19:37

回答 2 已采纳望采纳你新加一个cell，在里面输入yye，查看一下它是不是一个包含“营业额”的字典。这个报错，是说你的yye数据中，没有“营业额”为key的内容，所以取不出。
Python keyerror python
2022-08-29 13:06

回答 6 已采纳你最后一组数组没有user这个key
python KeyError:'index' python
2022-08-24 17:36

回答 1 已采纳因为df_pre字典中就没有 index 这个key，检查一下文件里是否有 index这一行
Python3 爬虫--公司代理问题解决
2017-12-02 14:41

NeverSettle101的博客废话好久没有造过轮子了，突发奇想解决一下一进公司写爬虫就遇到的代理的问题正文如果没有代理问题，如下代码就可以获取到网页 html 源码import urllib import urllib.request from bs4 import BeautifulSoupurl = ...
python词云图出现keyError错误 python 有问必答
2021-06-04 20:22

回答 4 已采纳你的keywords是什么样的？是不是得都是string类型的才行，建议拿短一点的中文文本先试试，如果还有问题，可以私信我，之前做过词云
python——网络爬虫快速入门【reuqests篇】
2020-08-16 11:33

Pointer-faker的博客 pip 是一个现代的，通用的 Python 包管理工具。提供了对 Python 包的查找、下载、安装、卸载的功能。官方提供的pip 示例 $ pip install requests $ pip search xml $ pip show beautifulsoup4 $ pip uninstall ...
python爬虫（6）——Selenium的使用
2019-12-06 19:10

二木成林的博客 python代码如下： from selenium import webdriver options = webdriver.ChromeOptions() # 由于浏览器安装的原因，这里自定义了浏览器的exe安装路径 options.binary_location = r"F:\谷歌浏览器\安装文件\...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 6月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 5月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月29日

悬赏问题

¥15 装 pytorch 的时候出了好多问题，遇到这种情况怎么处理？
¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
¥15 手机接入宽带网线，如何释放宽带全部速度
¥30 关于#r语言#的问题：如何对R语言中mfgarch包中构建的garch-midas模型进行样本内长期波动率预测和样本外长期波动率预测
¥15 ETLCloud 处理json多层级问题
¥15 matlab中使用gurobi时报错
¥15 这个主板怎么能扩出一两个sata口
¥15 不是，这到底错哪儿了😭
¥15 2020长安杯与连接网探
¥15 关于#matlab#的问题：在模糊控制器中选出线路信息，在simulink中根据线路信息生成速度时间目标曲线（初速度为20m/s，15秒后减为0的速度时间图像）我想问线路信息是什么

爬网易新闻的评论，代码如下，遇到问题KeyError

4条回答 默认 最新

问题事件

悬赏问题

4条回答默认最新