小沐白 2023-06-26 18:23 采纳率: 50%
浏览 14

Python 爬虫并将URL 保存到excel中

问题遇到的现象和发生背景

利用python 从后台自动检测查询链接 https://www.chinabond.com.cn/Channel/21000 中发行快报的内容,并且保存URL link 到excel中,请问应该怎么操作?

发行快报:
23隆科发展债01 23农发07 23农发0523 众联国控债01 23绍旅债02

遇到的现象和发生背景,请写出第一个错误信息
用代码块功能插入代码,请勿粘贴截图。 不用代码块回答率下降 50%
运行结果及详细报错内容
我的解答思路和尝试过的方法,不写自己思路的,回答率下降 60%
我想要达到的结果,如果你需要快速回答,请尝试 “付费悬赏”
  • 写回答

2条回答 默认 最新

  • Mike Qin 2023-06-26 19:11
    关注

    您可以尝试如下代码(请您先自行导入request、BeautifulSoup和pandas库):

    # 获取链接和内容
    url = 'https://www.chinabond.com.cn/Channel/21000'
    response = requests.get(url)
    soup = BeautifulSoup(response.content, 'html.parser')
    table = soup.find('table', {'class': 'unit-table'})
    rows = table.find_all('tr')[1:]
    result = []
    for row in rows:
        cells = row.find_all('td')
        if cells:
            title = cells[1].text.strip()
            link = cells[2].find('a')['href'].strip()
            result.append({'title': title, 'link': link})
    
    # 保存链接到 Excel 文件中
    df = pd.DataFrame(result)
    df.to_excel('ChinaBond_report_links.xlsx', index=False)
    
    评论

报告相同问题?

问题事件

  • 创建了问题 6月26日

悬赏问题

  • ¥15 如何让企业微信机器人实现消息汇总整合
  • ¥50 关于#ui#的问题:做yolov8的ui界面出现的问题
  • ¥15 如何用Python爬取各高校教师公开的教育和工作经历
  • ¥15 TLE9879QXA40 电机驱动
  • ¥20 对于工程问题的非线性数学模型进行线性化
  • ¥15 Mirare PLUS 进行密钥认证?(详解)
  • ¥15 物体双站RCS和其组成阵列后的双站RCS关系验证
  • ¥20 想用ollama做一个自己的AI数据库
  • ¥15 关于qualoth编辑及缝合服装领子的问题解决方案探寻
  • ¥15 请问怎么才能复现这样的图呀