2301_76523335 2023-02-24 12:28 采纳率: 100%
浏览 81
已结题

爬虫运行成功但是没有结果

这个代码运行成功但是没有输出结果

import requests
from bs4 import BeautifulSoup

url = "https://fx.wanfangdata.com.cn/scholartrends/detail?scholar_name=%E5%91%A8%E4%BA%91&org_name=%E8%8B%8F%E5%B7%9E%E5%A4%A7%E5%AD%A6%E9%99%84%E5%B1%9E%E5%84%BF%E7%AB%A5%E5%8C%BB%E9%99%A2&scholar_id=a0040857820"
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36"
}
pages_to_crawl = 5

for page in range(pages_to_crawl):
    params = {
        "page": page + 1
    }
    response = requests.get(url, headers=headers, params=params)
    soup = BeautifulSoup(response.text, "html.parser")
    article_list = soup.find_all("div", class_="scholar-list-item")
    for article in article_list:
        title_elem = article.find("h4", class_="title")
        title = title_elem.text.strip()
        link = title_elem.a.get("href")
        summary_elem = article.find("div", class_="abstract")
        if summary_elem is not None:
            summary = summary_elem.text.strip()
        else:
            summary = ""
        print(f"Title: {title}\nLink: {link}\nSummary: {summary}\n")


  • 写回答

4条回答 默认 最新

  • 文盲老顾 WEB应用领新星创作者 2023-02-24 12:47
    关注

    我把你代码运行了一下,抓到的是一些html,里面全是js,没有正文的,你想抓这个站的内容,需要监测xhr信息

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(3条)

报告相同问题?

问题事件

  • 系统已结题 3月4日
  • 已采纳回答 2月24日
  • 赞助了问题酬金15元 2月24日
  • 创建了问题 2月24日

悬赏问题

  • ¥15 adb push异常 adb: error: 1409-byte write failed: Invalid argument
  • ¥15 android报错 brut.common.BrutException: could not exec (exit code = 1)
  • ¥15 nginx反向代理获取ip,java获取真实ip
  • ¥15 eda:门禁系统设计
  • ¥50 如何使用js去调用vscode-js-debugger的方法去调试网页
  • ¥15 376.1电表主站通信协议下发指令全被否认问题
  • ¥15 物体双站RCS和其组成阵列后的双站RCS关系验证
  • ¥15 复杂网络,变滞后传递熵,FDA
  • ¥20 csv格式数据集预处理及模型选择
  • ¥15 部分网页页面无法显示!