问题遇到的现象和发生背景
利用python 从后台自动检测查询链接 https://www.chinabond.com.cn/Channel/21000 中发行快报的内容,并且保存URL link 到excel中,请问应该怎么操作?
发行快报:
23隆科发展债01 23农发07 23农发0523 众联国控债01 23绍旅债02
利用python 从后台自动检测查询链接 https://www.chinabond.com.cn/Channel/21000 中发行快报的内容,并且保存URL link 到excel中,请问应该怎么操作?
发行快报:
23隆科发展债01 23农发07 23农发0523 众联国控债01 23绍旅债02
您可以尝试如下代码(请您先自行导入request、BeautifulSoup和pandas库):
# 获取链接和内容
url = 'https://www.chinabond.com.cn/Channel/21000'
response = requests.get(url)
soup = BeautifulSoup(response.content, 'html.parser')
table = soup.find('table', {'class': 'unit-table'})
rows = table.find_all('tr')[1:]
result = []
for row in rows:
cells = row.find_all('td')
if cells:
title = cells[1].text.strip()
link = cells[2].find('a')['href'].strip()
result.append({'title': title, 'link': link})
# 保存链接到 Excel 文件中
df = pd.DataFrame(result)
df.to_excel('ChinaBond_report_links.xlsx', index=False)