爬网易新闻的评论，代码如下，遇到问题KeyError

from bs4 import BeautifulSoup
import requests
import json

headers={'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.64 Safari/537.36 Edg/101.0.1210.53'}
commentURL='https://comment.tie.163.com/H8DOPGM90519DTSV.html'

def creatURL(commentURL,offset,limit):
    s1='https://gw.m.163.com/commons-user-main/api/v1/commons/user/pc/getUserByCookie?isbtn=false&trace_id=IuKWAHFuVvX1653835134118'
    s2='/comments/newList?offset='
    name=commentURL.split('/')[-1].split('.')[0]
    u=s1+str(name)+s2+str(offset)+'&limit='+str(limit)
    return u
res=requests.get(url=creatURL(commentURL,1,40),headers=headers).content
data=json.loads(res.decode())

for key in data['comments'].keys():
    print(data['comments'][key]['comment'])

爬取网易新闻评论页的评论，遇到问题for key in data['comments'].keys():
KeyError: 'comments'，是不是长度有问题？url=creatURL(commentURL,1,40)是不是说获取40个评论？这个一页上是没有40条评论的，但是总的评论数又超过了40个
网页地址是https://comment.tie.163.com/H8DOPGM90519DTSV.html

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

法学僧转行程序猿 2022-05-30 12:14

关注

你这个问题我没找到解决办法，但是你如果仅仅是为了获取评论数据，按照我的方法可以绕过你的问题取获取，我觉得这样简单的多，我这里测试过没发现报错

import requests
import re
import time
# 看到最新评论一共有五页,翻页关键参数在offset
page=0
s=1
for page in range(1,5):
    print(f'-------------开始采集第{s}页数据----------------')
    # 开发者工具抓包找到对应数据所在链接
    url=f'https://comment.api.163.com/api/v1/products/a2869674571f77b5a0867c3d71db5856/threads/H8DOPGM90519DTSV/comments/newList?ibc=newspc&limit=30&showLevelThreshold=72&headLimit=1&tailLimit=2&offset={page}&callback=jsonp_1653882863959&_=1653882863960'
    data={}
    headers={
        'Referer': 'https://comment.tie.163.com/',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.64 Safari/537.36 Edg/101.0.1210.53'
    }
    resp=requests.get(url,headers=headers)
    # print(resp.text)
    commentId_list=re.findall('"commentId":(.*?),',resp.text)  # 用户id列表
    content_list=re.findall('"content":"(.*?)",',resp.text)  # 用户评论列表
    # print(commentId_list)
    # print(content_list)
    n=1
    for commentId in commentId_list:
        print(commentId,content_list[n-1])
        time.sleep(0.5)
        n+=1
    s+=1
    page+=30

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(3条)

报告相同问题？

关注问题

爬网易新闻的评论，代码如下，遇到问题KeyError python 爬虫
2022-05-29 23:21

回答 4 已采纳你这个问题我没找到解决办法，但是你如果仅仅是为了获取评论数据，按照我的方法可以绕过你的问题取获取，我觉得这样简单的多，我这里测试过没发现报错 import requests import re imp
python代码在运行fedformer时遇到keyerror:'Reformer'的问题 python
2023-04-11 15:53

回答 1 已采纳 self.args.model这个变量应该是 Reformer字符串，而model_dict这个字典，没有关键词 Reformer所以你程序的上下文应该有问题
python词云出现KeyError问题 python 有问必答
2021-03-19 16:53

回答 3 已采纳就代码中词云图问题，一是代码中wordlist是一个生成器对象，需要遍历出来，文本分割是全分割，其中有很多标点符号和其他字符不是中文，需要对其进行筛选剔除。wl=' '.join([x for x i
python网络爬虫
2021-11-12 20:05

愿热爱常在的博客运行环境：python3 BeautifulSoup4解析库中文文档： https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html BeautifulSoup4 是 HTML/XML 的解析器，主要的功能便是解析和提取 HTML/XML 中的数据。 ...
编写斗地主发牌代码，遇到KeyError: 50错误 python
2022-06-02 10:21

回答 2 已采纳 poker = pokers_dict[player2_key] pokers_dict这个字典里面没有50这个关键字，少了A吧
python里的KeyError是出了什么问题 python
2022-12-09 12:21

回答 1 已采纳望采纳KeyError 是一个 Python 内置的异常，表示在字典中找不到指定的键。在这个特定的情况下，似乎是在读取 CSV 文件的时候发生了这个键错误。由于代码中的字符串 'source' 大小写
python json爬虫企业信息，为什么提示keyerror呢 python 有问必答
2021-09-01 13:03

回答 4 已采纳要添加Referer头，要不返回的是{'status': -1, 'msg': '非法操作'}内容，当然会出错。。。有帮助麻烦点个采纳【本回答右上角】，谢谢~~ import requests h
python 网络爬虫
2023-06-11 09:53

圆弧YH的博客 file1.write(data) 或者用如下代码 #【舉例】 import requests webFile=requests.get("https://www.pku.edu.cn/about.html")#爬虫获得html文件 webFile.encoding="utf-8"#爬虫解析网页文件 data=webFile.text#用...
python可视化 KeyError问题 python
2022-12-14 19:37

回答 2 已采纳望采纳你新加一个cell，在里面输入yye，查看一下它是不是一个包含“营业额”的字典。这个报错，是说你的yye数据中，没有“营业额”为key的内容，所以取不出。
Python keyerror python
2022-08-29 13:06

回答 6 已采纳你最后一组数组没有user这个key
python KeyError:'index' python
2022-08-24 17:36

回答 1 已采纳因为df_pre字典中就没有 index 这个key，检查一下文件里是否有 index这一行
Python3 爬虫--公司代理问题解决
2017-12-02 14:41

NeverSettle101的博客废话好久没有造过轮子了，突发奇想解决一下一进公司写爬虫就遇到的代理的问题正文如果没有代理问题，如下代码就可以获取到网页 html 源码import urllib import urllib.request from bs4 import BeautifulSoupurl = ...
python词云图出现keyError错误 python 有问必答
2021-06-04 20:22

回答 4 已采纳你的keywords是什么样的？是不是得都是string类型的才行，建议拿短一点的中文文本先试试，如果还有问题，可以私信我，之前做过词云
python——网络爬虫快速入门【reuqests篇】
2020-08-16 11:33

Pointer-faker的博客 pip 是一个现代的，通用的 Python 包管理工具。提供了对 Python 包的查找、下载、安装、卸载的功能。官方提供的pip 示例 $ pip install requests $ pip search xml $ pip show beautifulsoup4 $ pip uninstall ...
python爬虫（6）——Selenium的使用
2019-12-06 19:10

二木成林的博客 python代码如下： from selenium import webdriver options = webdriver.ChromeOptions() # 由于浏览器安装的原因，这里自定义了浏览器的exe安装路径 options.binary_location = r"F:\谷歌浏览器\安装文件\...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 6月7日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 5月30日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 5月29日

悬赏问题

¥15 使用ue5插件narrative时如何切换关卡也保存叙事任务记录
¥20 软件测试决策法疑问求解答
¥15 win11 23H2删除推荐的项目，支持注册表等
¥15 matlab 用yalmip搭建模型，cplex求解，线性化处理的方法
¥15 qt6.6.3 基于百度云的语音识别不会改
¥15 关于#目标检测#的问题：大概就是类似后台自动检测某下架商品的库存，在他监测到该商品上架并且可以购买的瞬间点击立即购买下单
¥15 神经网络怎么把隐含层变量融合到损失函数中？
¥15 lingo18勾选global solver求解使用的算法
¥15 全部备份安卓app数据包括密码，可以复制到另一手机上运行
¥20 测距传感器数据手册i2c

爬网易新闻的评论，代码如下，遇到问题KeyError

4条回答 默认 最新

问题事件

悬赏问题

4条回答默认最新