python爬取网易国内新闻无输出

import bs4
import requests
from bs4 import BeautifulSoup
def getHtmlText(url):
try:
r=requests.get(url)
r.raise_for_status()
r.encoding=r.apparent_enconding
return r.text
except:
return""
def getheadersList(slist,url):
html=getHtmlText(url)
soup=BeautifulSoup(html,"html.parser")
ul=soup.find_all('ul',attrs={"class":"idx_cm_list idx_cm_list_h"})
for a in ul:
title=ul.find_all('a')
slist.append(title.get('href'))

    for i in range(len(slist)):
        surl=slist[i]
        nhtml=getHtmlText(surl)
        soup=BeautifulSoup(nhtml,"html.parser")
        nheader=soup.find_all('div',attrs={"class":"post_content_main"})
        content=soup.find_all('div',attrs={"class":"post_text"})
        print(nheader.find_all('h1').string)
        print(content.get_text())
        print('-------------------------分割线-----------------------')

def main():
url="http://news.163.com/domestic/"
slist=[]
main()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
JPF1024 2017-11-23 05:38
关注
估计是被拦截了把，你试试百度新闻的

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫爬取到的内容无法输出到txt文档中 python
2022-08-12 12:20

回答 3 已采纳不如换用requests库和bs4库吧。 from bs4 import BeautifulSoup as bs import requests as r url = 'https://fanqie
Python爬取存储出错 python 学习方法改行学IT
2022-10-18 00:23

回答 1 已采纳是encoding，你拼错了，有帮助的话采纳一下哦！
python 爬虫爬取网易云音乐 python
2019-04-17 19:04

回答 2 已采纳搜索“防盗链” 把request headers信息完善一下越完整，就越像真的浏览器请求
python爬取网易云音乐热歌榜实例代码
2020-09-16 10:13

在本篇文章里小编给大家整理的是关于python爬取网易云音乐热歌榜实例代码，需要的朋友们可以学习下。
如何使用python爬取canvas中的内容呢？ css javascript python
2022-04-29 10:30

回答 1 已采纳需要在浏览器上临时显示后端实时处理的图像，需要将图像数据转成json字符串传输给js绘图。后端python处理： import cv2 as cvfrom encodings import base
python 爬取表格获取不到数据 python
2020-02-17 22:52

回答 4 已采纳爬取需要在请求头里面添加Host，要不然爬取不到任何信息，另外源码是不规则的html代码，所以需要指定html解析器 ``` # -*- coding：utf-8 -*- import os
python爬取数据遇到的一些问题 python
2021-11-24 07:07

回答 5 已采纳 import requests url = r'https://hugovk.github.io/top-pypi-packages/top-pypi-packages-30-days.min.js
python爬取网易云音乐评论
2024-04-01 20:51

python爬取网易云音乐评论
python爬虫爬取图片，图片打不开 python 爬虫
2022-10-18 21:52

回答 1 已采纳图片是从cdn上过来的，做了防盗链。在headers中添加Refer，指向该网站就行了。 import re import requests import os if not os.path.ex
python爬取音乐 python
2023-01-11 17:11

回答 2 已采纳可以先从post data中查看url请求时提交的参数，根据参数名在js源码中检索，大致梳理一下代码执行的流程，在可疑处附近打上断点
python 爬虫，如何爬取相关数据 python 有问必答爬虫
2021-11-11 11:15

回答 1 已采纳先确定需要爬取的网站，然后分析网站的数据来源，是后端生成数据还是ajax生成数据，确定数据来源方式就根据HTTP请求编写代码，这个涉及一些请求参数的加密、转换等等处理，然后清洗数据和数据入库
Python爬取网易云音乐热门评论
2020-12-24 04:29

最近在研究文本挖掘相关的内容，所谓巧妇难为无米之炊，要想进行文本分析，首先得到有文本吧。获取文本的方式有很多，比如从网上下载现成的文本文档，或者通过第三...因为python不仅有着内置的功能强大的网络库，还有诸
python爬取并下载的文件为什么是空白且加载不出来？ python
2021-08-08 11:16

回答 2 已采纳你只是爬取了html网页，，怎么能让你运行人家的网页呢你说的加载不出来那是肯定的这个样子应该你只是爬了个外壳，css和js都不能用了，所以背景是白的，按钮都是没有样式的如果明白了，点击右上角给个采纳哦
python爬取网易飙升歌单
2023-10-13 11:48

python爬取网易云飙升歌单
python爬取网易新闻_Python正则抓取网易新闻的方法示例
2020-12-04 05:25

weixin_39910963的博客本文实例讲述了Python正则抓取网易新闻的方法。分享给大家供大家参考，具体如下：自己写了些关于抓取网易新闻的爬虫，发现其网页源代码与网页的评论根本就对不上，所以，采用了抓包工具得到了其评论的隐藏地址(每个...
没有解决我的问题, 去提问

悬赏问题

¥15 高德地图点聚合中Marker的位置无法实时更新
¥15 DIFY API Endpoint 问题。
¥20 sub地址DHCP问题
¥15 delta降尺度计算的一些细节，有偿
¥15 Arduino红外遥控代码有问题
¥15 数值计算离散正交多项式
¥30 数值计算均差系数编程
¥15 redis-full-check比较两个集群的数据出错
¥15 Matlab编程问题
¥15 训练的多模态特征融合模型准确度很低怎么办

python爬取网易国内新闻无输出

2条回答 默认 最新

悬赏问题

2条回答默认最新