Python爬虫问题

我需要完成这项任务，但是爬到的数据是空的，只有表头（如图2），代码如下，请问是为什么呢？

import requests
# 目标网址
url = 'http://www.xinhuanet.com/'
# 发送 GET 请求，获取页面内容
response = requests.get(url)
content = response.content.decode('utf-8')
from bs4 import BeautifulSoup
# 使用 BeautifulSoup 解析页面内容
soup = BeautifulSoup(content, 'html.parser')
# 提取页面中所有包含新闻标题、发布时间和链接的 div 标签
news_divs = soup.find_all('div', class_='new-data-words')
# 遍历每一个 div 标签，提取包含的信息
for news_div in news_divs:
    # 提取新闻标题
    title = news_div.find('a').text
    
    # 提取新闻发布时间
    publish_time = news_div.find('span', class_='time').text
    
    # 提取新闻链接
    link = news_div.find('a')['href']
import csv
# 打开 csv 文件
with open('news.csv', 'w', encoding='utf-8', newline='') as csvfile:
    # 定义 csv writer
    writer = csv.writer(csvfile)
    
    # 写入表头
    writer.writerow(['Title', 'Publish Time', 'Link'])
    
    # 遍历每一个 div 标签，提取包含的信息并写入 csv 文件
    for news_div in news_divs:
        # 提取新闻标题
        title = news_div.find('a').text
        
        # 提取新闻发布时间
        publish_time = news_div.find('span', class_='time').text
        
        # 提取新闻链接
        link = news_div.find('a')['href']
        
        # 写入 csv 文件
        writer.writerow([title, publish_time, link])

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2024-03-19 18:27
关注
【相关推荐】

你可以参考下这个问题的回答, 看看是否对你有帮助, 链接: https://ask.csdn.net/questions/7789745
这篇博客也不错, 你可以看下python 已知文本文件中存放了若干数字，请编程读取所有的数字，排序以后进行输出。
同时，你还可以查看手册：python-数据压缩和存档中的内容
您还可以看一下 CSDN就业班老师的Python爬虫技术和浏览器模拟，验证码识别视频教程课程中的解析库的使用2小节, 巩固相关知识点
除此之外, 这篇博客: 整理了7道Python函数的练习题，希望对你学习函数有帮助中的 2.写函数，计算传入的字符串中数字，字母，空格，以及其他的个数 部分也许能够解决你的问题, 你可以仔细阅读以下内容或跳转源博客中阅读:

def func(s): al_num =0 space_num = 0 digit_num = 0 others_num = 0 for i in s: if i.isdigit(): digit_num +=1 elif i.isspace(): space_num +=1 elif i.isalpha(): al_num +=1 else: others_num +=1 return (al_num,space_num,digit_num,others_num) result = func("asdsadjlk1212jdjakdk2 d d d d323233223下") print(result) result = func(" d d d d323233223下") print(result)

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 写成博客, 将相关链接放在评论区, 以帮助更多的人 ^-^
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫问题 python 爬虫
2022-10-09 11:41

回答 2 已采纳
python爬虫位置问题 python 爬虫
2023-03-08 13:31

回答 2 已采纳该回答引用GPTᴼᴾᴱᴺᴬᴵ如果您想要提取 div class="detail-context"标签下所有的 tr 标签，并进一步提取每个 tr 中的 td 标签内的内容，可以使用以下代码： impo
python爬虫编程习题 python 有问必答
2022-12-20 19:53

回答 6 已采纳兰州博文科技学院 http://www.bowenedu.cn/
Python 爬虫编程从入门到实践
2024-03-11 13:42

本文将深入探讨Python爬虫编程的基础知识，从入门到实践，帮助初学者掌握这一技能。首先，我们要了解什么是网络爬虫。网络爬虫是一种自动浏览互联网并收集信息的程序，它能遍历网页、抓取数据，为数据分析、信息...
python爬虫html获取不全 html python 爬虫
2022-06-24 19:43

回答 1 已采纳其实有的，但是这个网站应该是为了懒加载把url用base64密了一下，然后再动态加载，其实我下面发的这个就是url 是base64后的url 解码后就是https://s1.aigei.com/
python爬虫有一些小问题 pycharm python 爬虫
2023-03-12 01:58

回答 4 已采纳。。。。你要明白，源文件和查看元素的区别在浏览器里，使用查看元素方式得到的是已经经过浏览器渲染之后的数据而查看源文件，则是真正这个页面返回的数据那么问题来了，你在查看元素时有，但抓取时没有，那么
python爬虫使用selenium切换窗口问题 python selenium 有问必答爬虫
2022-03-18 12:30

回答 2 已采纳 driver.swith_to.window(driver.window_handles[1]),函数名写错了，不是swith是switch，少写了个c，改成：driver.switch_to.win
Python爬虫是指使用Python编程语言编写的程序，用于从互联网上获取数据爬虫程序通过模拟浏览器的行为
2024-02-21 00:37

总的来说，Python爬虫是通过Python编程语言实现的自动化数据获取工具，它涉及到网络请求、网页解析、反爬策略、数据存储等多个方面，广泛应用于数据分析、市场研究、内容监控等场景。通过不断学习和实践，我们可以...
python 爬虫爬取图片问题 python 有问必答爬虫
2022-06-06 20:12

回答 4 已采纳你题目的解答代码如下： #coding=gbk import requests from io import BytesIO from PIL import Image from selenium
关于python爬虫的问题 python 爬虫
2022-03-02 15:43

回答 1 已采纳 lis = re.findall(p, html, re.M|re.I|re.S)
python爬虫乱码问题怎么解决 python
2022-04-20 16:13

回答 2 已采纳 with open ("mybaidu.html", mode = "w", encoding = "utf-8")这里面填一个encoding就好了
Python 爬虫基础网络爬虫、数据采集、Python编程、数据处理
2023-08-12 18:32

资源描述：这个资源是关于Python爬虫基础的教程，旨在帮助初学者掌握如何使用Python编程语言构建简单的网络爬虫，从网页中抓取数据，并进行基本的数据处理和存储。内容概要：教程涵盖了Python爬虫的基本概念、...
python爬虫-Day14 网络编程入门和网络应用开发.rar
2024-08-29 09:11

python爬虫-Day14 网络编程入门和网络应用开发.rar
基于Python的网络爬虫的毕业设计
2022-02-20 11:41

首先，我们关注的是Python这一编程语言，它是网络爬虫开发的首选语言，因为其语法简洁、库丰富且适合快速开发。在Python中，最常用于网络爬虫开发的库有`requests`和`BeautifulSoup`。`requests`库用于发送HTTP...
Python爬虫数据可视化分析大作业.zip
2022-05-29 10:02

Python爬虫数据可视化分析大作业是一项综合性的任务，它涵盖了多个IT领域的知识点，包括但不限于Python编程、网络爬虫技术、数据分析以及数据可视化。下面将详细阐述这些知识点。首先，Python编程是整个作业的基础...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 3月19日

悬赏问题

¥15 Windows Script Host 无法找到脚本文件"C:\ProgramData\Player800\Cotrl.vbs”
¥15 matlab自定义损失函数
¥15 35114 SVAC视频验签的问题
¥15 impedancepy
¥15 求往届大挑得奖作品（ppt…）
¥15 如何在vue.config.js中读取到public文件夹下window.APP_CONFIG.API_BASE_URL的值
¥50 浦育平台scratch图形化编程
¥20 求这个的原理图只要原理图
¥15 vue2项目中，如何配置环境，可以在打完包之后修改请求的服务器地址
¥20 微信的店铺小程序如何修改背景图

Python爬虫问题

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新