2301_76523335 2023-02-24 12:28 采纳率: 100%
浏览 80
已结题

爬虫运行成功但是没有结果

这个代码运行成功但是没有输出结果

import requests
from bs4 import BeautifulSoup

url = "https://fx.wanfangdata.com.cn/scholartrends/detail?scholar_name=%E5%91%A8%E4%BA%91&org_name=%E8%8B%8F%E5%B7%9E%E5%A4%A7%E5%AD%A6%E9%99%84%E5%B1%9E%E5%84%BF%E7%AB%A5%E5%8C%BB%E9%99%A2&scholar_id=a0040857820"
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/110.0.0.0 Safari/537.36"
}
pages_to_crawl = 5

for page in range(pages_to_crawl):
    params = {
        "page": page + 1
    }
    response = requests.get(url, headers=headers, params=params)
    soup = BeautifulSoup(response.text, "html.parser")
    article_list = soup.find_all("div", class_="scholar-list-item")
    for article in article_list:
        title_elem = article.find("h4", class_="title")
        title = title_elem.text.strip()
        link = title_elem.a.get("href")
        summary_elem = article.find("div", class_="abstract")
        if summary_elem is not None:
            summary = summary_elem.text.strip()
        else:
            summary = ""
        print(f"Title: {title}\nLink: {link}\nSummary: {summary}\n")


  • 写回答

4条回答 默认 最新

  • 文盲老顾 WEB应用领新星创作者 2023-02-24 12:47
    关注

    我把你代码运行了一下,抓到的是一些html,里面全是js,没有正文的,你想抓这个站的内容,需要监测xhr信息

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(3条)

报告相同问题?

问题事件

  • 系统已结题 3月4日
  • 已采纳回答 2月24日
  • 赞助了问题酬金15元 2月24日
  • 创建了问题 2月24日

悬赏问题

  • ¥100 任意维数的K均值聚类
  • ¥15 stamps做sbas-insar,时序沉降图怎么画
  • ¥15 unity第一人称射击小游戏,有demo,在原脚本的基础上进行修改以达到要求
  • ¥15 买了个传感器,根据商家发的代码和步骤使用但是代码报错了不会改,有没有人可以看看
  • ¥15 关于#Java#的问题,如何解决?
  • ¥15 加热介质是液体,换热器壳侧导热系数和总的导热系数怎么算
  • ¥100 嵌入式系统基于PIC16F882和热敏电阻的数字温度计
  • ¥15 cmd cl 0x000007b
  • ¥20 BAPI_PR_CHANGE how to add account assignment information for service line
  • ¥500 火焰左右视图、视差(基于双目相机)