宛宸. 2024-03-19 15:49 采纳率: 16.7%
浏览 2

Python爬虫问题

我需要完成这项任务,但是爬到的数据是空的,只有表头(如图2),代码如下,请问是为什么呢?

img

import requests
# 目标网址
url = 'http://www.xinhuanet.com/'
# 发送 GET 请求,获取页面内容
response = requests.get(url)
content = response.content.decode('utf-8')
from bs4 import BeautifulSoup
# 使用 BeautifulSoup 解析页面内容
soup = BeautifulSoup(content, 'html.parser')
# 提取页面中所有包含新闻标题、发布时间和链接的 div 标签
news_divs = soup.find_all('div', class_='new-data-words')
# 遍历每一个 div 标签,提取包含的信息
for news_div in news_divs:
    # 提取新闻标题
    title = news_div.find('a').text
    
    # 提取新闻发布时间
    publish_time = news_div.find('span', class_='time').text
    
    # 提取新闻链接
    link = news_div.find('a')['href']
import csv
# 打开 csv 文件
with open('news.csv', 'w', encoding='utf-8', newline='') as csvfile:
    # 定义 csv writer
    writer = csv.writer(csvfile)
    
    # 写入表头
    writer.writerow(['Title', 'Publish Time', 'Link'])
    
    # 遍历每一个 div 标签,提取包含的信息并写入 csv 文件
    for news_div in news_divs:
        # 提取新闻标题
        title = news_div.find('a').text
        
        # 提取新闻发布时间
        publish_time = news_div.find('span', class_='time').text
        
        # 提取新闻链接
        link = news_div.find('a')['href']
        
        # 写入 csv 文件
        writer.writerow([title, publish_time, link])

img

  • 写回答

2条回答 默认 最新

报告相同问题?

问题事件

  • 创建了问题 3月19日

悬赏问题

  • ¥15 Windows Script Host 无法找到脚本文件"C:\ProgramData\Player800\Cotrl.vbs”
  • ¥15 matlab自定义损失函数
  • ¥15 35114 SVAC视频验签的问题
  • ¥15 impedancepy
  • ¥15 求往届大挑得奖作品(ppt…)
  • ¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
  • ¥50 浦育平台scratch图形化编程
  • ¥20 求这个的原理图 只要原理图
  • ¥15 vue2项目中,如何配置环境,可以在打完包之后修改请求的服务器地址
  • ¥20 微信的店铺小程序如何修改背景图