赵灵越 2024-04-06 21:05 采纳率: 99.3%
浏览 7
已结题

爬娶头条网页文章数据,就是输入链接,知道阅读量,点赞数,当然爬娶文章和评论更好,我是安卓手机pqython运行代码

/ $ /data/user/0/org.qpython.qpy/files/bin/
qpython3.sh "/storage/emulated/0/Android/da
ta/org.qpython.qpy/files/危险.py" && exit
Traceback (most recent call last):
  File "/storage/emulated/0/Android/data/org.qpython.qpy/files/危险.py", line 14, in <module>
    title = soup.find('h2', class_='title').text
            ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^
AttributeError: 'NoneType' object has no attribute 'text'
/ $
https://m.toutiao.com/is/iYrgXcWX/ - 大年初八,我们兄妹到28年未见叔叔家拜年,来到阔别28载故乡 - 今日头条

文章数据代码
  • 写回答

2条回答 默认 最新

  • GISer Liu 2024-04-06 22:34
    关注

    该回答引用自GPT-3.5,由博主GISer Liu编写:

    根据你提供的问题描述,你想要爬取今日头条网页文章的数据,包括阅读量和点赞数,并且希望能够爬取文章和评论。在你提供的代码中,出现了一个错误,提示找不到'text'属性,这是因为
    soup.find('h2', class_='title') 没有找到匹配的元素,返回了 None,因此无法获取 text 属性。要解决这个问题,你可以在调用 text 属性之前,先检查是否成功找到了标题元素。以下是修改后的代码示例:
    pythonCopy code

    import requests
    from bs4 import BeautifulSoup
    url = "https://m.toutiao.com/is/iYrgXcWX/"
    response = requests.get(url)
    soup = BeautifulSoup(response.text, "html.parser")
    title_tag = soup.find('h2', class_='title')
    if title_tag:
    title = title_tag.text
    print("标题:", title)
    else:
    print("未找到标题")
    # 以下是获取阅读量和点赞数的代码,需要根据网页结构进一步调整
    # 另外,爬取评论需要模拟浏览器行为或者使用API,具体操作会有一定的复杂度
    

    注意,要爬取评论可能需要模拟浏览器行为或者使用API,具体实现会有一定的难度。此外,爬取网页数据时,请确保你的行为符合网站的使用规定,以免触犯法律或侵犯他人权益。

    如果该回答解决了您的问题,请采纳!如果没有,请私信联系或评论您的疑惑

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 4月21日
  • 已采纳回答 4月13日
  • 创建了问题 4月6日

悬赏问题

  • ¥20 ic卡dump文件校检码解密
  • ¥15 关于:接收到的数据不是有效的JSON格式
  • ¥15 apdl语言如何增加受力分析
  • ¥15 算法对比:学校优化算法与蚁群算法对比
  • ¥15 机电一体化系统设计说明书
  • ¥20 sgy数据提取地震波速,有人能回答吗小馋
  • ¥20 c#实现打开word的功能,并且需要安装成windows服务,word打不开怎么办
  • ¥15 python用ARIMA时间预测模型预测数据出错,急!
  • ¥30 为什么后端传给前端vue的河流json数据不在地图中显示出来
  • ¥50 关于弹性波动方程求解的问题: