python爬虫爬取有地方出错了?

本人新手小白，在看了慕课老师课程后写了尝试爬取静态股票信息。网站是对的，spider上也没报错。就是没出结果，也没发现保存文档。求大佬指正。

代码如下：

import requests
from bs4 import BeautifulSoup
import traceback
import re

def getHTMLText(url, code="utf-8"):
    try:
        r = requests.get(url)
        r.raise_for_status()
        r.encoding = code
        return r.text
    except:
        return ""

def getStockList(lst, stockURL):
    html = getHTMLText(stockURL, "GB2312")
    soup = BeautifulSoup(html, 'html.parser') 
    a = soup.find_all('a')
    for i in a:
        try:
            href = i.attrs['href']
            lst.append(re.findall(r"[s][hz]\d{6}", href)[0])
        except:
            continue

def getStockInfo(lst, stockURL, fpath):
    count = 0
    for stock in lst:
        url = stockURL + stock + ".html"
        html = getHTMLText(url)
        try:
            if html=="":
                continue
            infoDict = {}
            soup = BeautifulSoup(html, 'html.parser')
            stockInfo = soup.find('div',attrs={'class':'stock-bets'})

            name = stockInfo.find_all(attrs={'class':'bets-name'})[0]
            infoDict.update({'股票名称': name.text.split()[0]})

            keyList = stockInfo.find_all('dt')
            valueList = stockInfo.find_all('dd')
            for i in range(len(keyList)):
                key = keyList[i].text
                val = valueList[i].text
                infoDict[key] = val

            with open(fpath, 'a', encoding='utf-8') as f:
                f.write( str(infoDict) + '\n' )
                count = count + 1
                print("\r当前进度: {:.2f}%".format(count*100/len(lst)),end="")
        except:
            count = count + 1
            print("\r当前进度: {:.2f}%".format(count*100/len(lst)),end="")
            continue

def main():
    stock_list_url = 'https://quote.eastmoney.com/stock_list.html'
    stock_info_url = 'https://gupiao.baidu.com/stock/'
    output_file = 'C:/BaiduStockInfo.txt'
    slist=[]
    getStockList(slist, stock_list_url)
    getStockInfo(slist, stock_info_url, output_file)

main()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
threenewbee 2019-06-17 15:11
关注
html = getHTMLText(url)
这里是输出下，有没有html

然后调试下
stockInfo = soup.find('div',attrs={'class':'stock-bets'})
这里

把try except曲调，看报什么错误

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬虫爬小说时，爬了一百多张就会报错，从新启动后爬取速度变慢了 python 有问必答爬虫
2022-08-17 20:13

回答 5 已采纳可能是访问次数频繁，被禁止访问，解决方法：使用代理 python 关于Max retries exceeded with url 的错误_Lucas__liu的博客-C
用python爬取数据出错 python selenium 有问必答爬虫
2022-01-06 18:29

回答 2 已采纳那不很明显吗, 底层少包, 用pip安装 openpyxl
Python网络爬虫中json解析失败 json python 有问必答爬虫
2022-02-26 20:51

回答 2 已采纳这个接口返回的是jsonp数据，不是json，要获取text替换掉回调函数名称和前后的括号后才是json数据
Python爬虫爬取图片
2021-05-02 22:34

W~J~L的博客 Python爬虫爬取网站指定图片（多个网站综合经验结论分享） ** 我想以这篇文章来记录自己学习过程以及经验感受，因为我也是个初学者。接下来我将分享几个我爬取过的图片网站，给大家们分享下自己的方法经验。嘿嘿！ ...
python爬取小说十章，程序可以运行，但什么都没有跑出来，想请教下代码哪里出错了？（电脑是Mac） python 有问必答爬虫
2021-09-08 07:35

回答 2 已采纳改成下面的就行，有帮助麻烦点个采纳【本回答右上角】，谢谢~~你的问题主要在于获取内容的代码未放如for循环中，save也未调用，还有一些小问题看注释 import requests import r
python爬虫通过xpath无法正常解析欲爬取元素 html python 爬虫
2022-01-04 18:04

回答 2 已采纳我是JAVA的xpath html.xpath("//table[@id='main_table_countries_today']/tbody/tr[@style=' ']").你看着修改下
scrapy下爬虫爬取子页面详细信息部分代码出错 python 爬虫
2021-12-07 21:42

回答 1 已采纳流程通了细节没改 import copy from scrapy import Request from scrapy.spiders import Spider class AniRank(S
python爬虫爬取百度图片_Python爬虫爬取百度图片
2020-12-03 21:11

weixin_40006265的博客代码流程：读取上述名单，遍历每一个人名，爬取30张关于他的百度图片，保存在以他名字命名的文件夹中。ps：默认情况下，网址的一页是60张图，如何翻页呢？注意到所爬网址的最后是pn=60，只要每次加60就会到新的一页...
为什么python爬虫的结果存储不到MySQL中？ mysql python
2022-06-21 19:56

回答 2 已采纳可能你根本没爬取到
python爬取疫情数据存到数据库失败 python 数据库爬虫
2023-02-09 20:29

回答 1 已采纳你的sql表名写错了，你的表是details，sql里写的是datails
python爬虫使用json()方法将response结果转化为JSON格式时报错 json python 爬虫
2022-02-11 13:01

回答 4 已采纳网站设计了相应的反扒策略，需要把Cookie添加到headers中，这种问题一般从headers入手，有的限制User-Agent必须有，有的限制Cookie headers = { 'Cooki
Python爬虫爬取知乎用户信息+寻找潜在客户
2017-07-27 17:50

Wengs95的博客【Python应用】寻找社交网络中的目标用户这是我们学校的软件工程课程设计的题目，要求自行编写爬虫或者利用开放的API获取新浪微博、知乎等社交网站的用户信息，利用数据挖掘的相关算法进行分析, 从大规模的用户群体...
python爬虫问题出错原因求助 python
2017-08-14 13:17

回答 4 已采纳 python的爬虫经常会爬取到none这种节点，当你获取的节点是none，还要继续对它进行操作的时候就会报错，这种问题只能是小心翼翼地判断每个读到的节点是什么类型，建议你对照要爬的页面的结构并且在代码
Python爬虫进阶之多线程爬取数据并保存到数据库
2020-12-21 21:54

今天刚看完崔大佬的《python3网络爬虫开发实战》，顿时觉得自己有行了，准备用appium登录QQ爬取列表中好友信息，接踵而来的是一步一步的坑，前期配置无数出错，安装之后连接也是好多错误，把这些错误解决之后，找APP...
python爬虫爬取豆瓣图书
2021-06-06 13:43

「已注销」的博客先要做个说明,如果你是编程高手的话,这边文章你就不用看了,如果你是个python爬虫小白的话,可以看看这篇原创我将用到的软件是pycharm,将要用到的模块是requets, BeautifulSoup. 爬虫很关键的是对网页原代码的分析,...
没有解决我的问题, 去提问

悬赏问题

¥20 sub地址DHCP问题
¥15 delta降尺度计算的一些细节，有偿
¥15 Arduino红外遥控代码有问题
¥15 数值计算离散正交多项式
¥30 数值计算均差系数编程
¥15 redis-full-check比较两个集群的数据出错
¥15 Matlab编程问题
¥15 训练的多模态特征融合模型准确度很低怎么办
¥15 kylin启动报错log4j类冲突
¥15 超声波模块测距控制点灯，灯的闪烁很不稳定，经过调试发现测的距离偏大

python爬虫爬取有地方出错了?

1条回答 默认 最新

悬赏问题

1条回答默认最新