小沐白 2023-06-26 18:23 采纳率: 53.8%
浏览 12

Python 爬虫并将URL 保存到excel中

问题遇到的现象和发生背景

利用python 从后台自动检测查询链接 https://www.chinabond.com.cn/Channel/21000 中发行快报的内容,并且保存URL link 到excel中,请问应该怎么操作?

发行快报:
23隆科发展债01 23农发07 23农发0523 众联国控债01 23绍旅债02

遇到的现象和发生背景,请写出第一个错误信息
用代码块功能插入代码,请勿粘贴截图。 不用代码块回答率下降 50%
运行结果及详细报错内容
我的解答思路和尝试过的方法,不写自己思路的,回答率下降 60%
我想要达到的结果,如果你需要快速回答,请尝试 “付费悬赏”
  • 写回答

2条回答 默认 最新

  • Mike Qin 2023-06-26 19:11
    关注

    您可以尝试如下代码(请您先自行导入request、BeautifulSoup和pandas库):

    # 获取链接和内容
    url = 'https://www.chinabond.com.cn/Channel/21000'
    response = requests.get(url)
    soup = BeautifulSoup(response.content, 'html.parser')
    table = soup.find('table', {'class': 'unit-table'})
    rows = table.find_all('tr')[1:]
    result = []
    for row in rows:
        cells = row.find_all('td')
        if cells:
            title = cells[1].text.strip()
            link = cells[2].find('a')['href'].strip()
            result.append({'title': title, 'link': link})
    
    # 保存链接到 Excel 文件中
    df = pd.DataFrame(result)
    df.to_excel('ChinaBond_report_links.xlsx', index=False)
    
    评论

报告相同问题?

问题事件

  • 创建了问题 6月26日

悬赏问题

  • ¥15 前端echarts坐标轴问题
  • ¥15 CMFCPropertyPage
  • ¥15 ad5933的I2C
  • ¥15 请问RTX4060的笔记本电脑可以训练yolov5模型吗?
  • ¥15 数学建模求思路及代码
  • ¥50 silvaco GaN HEMT有栅极场板的击穿电压仿真问题
  • ¥15 谁会P4语言啊,我想请教一下
  • ¥15 这个怎么改成直流激励源给加热电阻提供5a电流呀
  • ¥50 求解vmware的网络模式问题 别拿AI回答
  • ¥24 EFS加密后,在同一台电脑解密出错,证书界面找不到对应指纹的证书,未备份证书,求在原电脑解密的方法,可行即采纳