爬取股票信息，python没报错但不能爬取出结果！急求大神啊！！？？？

# -*- coding: utf-8 -*-
from bs4 import BeautifulSoup
import traceback
import re
import time
import requests

def GetHTMLSource(url):
 try:
  r=requests.get(url)
  r.raise_for_status ()
  r.encoding = r.apparent_encoding
  return r.text
 except:
  print ( "异常" )
  return ""


def SetFileName():
 dirname = time.strftime ( '%Y%m%d' , time.localtime ( time.time () ) ) #获取当前日期
 dirname += 'sh'
 return dirname

def getStockList(lst , stock_list_url): # 获得东方财富网上以sh6开头的股票代码
 html = GetHTMLSource ( stock_list_url )
 soupdata = BeautifulSoup ( html , 'html.parser' )
 a = soupdata.find_all ( 'a' ) # 用find_all方法遍历所有'a'标签，并取出在'a'标签里面的’href’数据
 for i in a:
  try:
   href = i.attrs[ 'href' ]
   lst.append ( re.findall ( r"sh6d{5}" , href )[ 0 ] )
  except:
   continue

def getStockInfo(lst , stock_info_url , fpath):
 ndate = time.strftime ( '%Y%m%d' , time.localtime ( time.time () ) )
 for stock in lst:
  url = stock_info_url + stock + '.html'
  html = GetHTMLSource ( url )
  try:
   if html == "":
    continue
    infoDict = {}
    soup = BeautifulSoup ( html, 'html.parser' )
    stockInfo = soup.find ( 'div' , attrs={'class': 'stock-bets'} )
    if stockInfo == None:
     continue
     keyData = stockInfo.find_all ( 'dt' )
     valueData = stockInfo.find_all ( 'dd' )
     inp = stock + "," + ndate + ","
     for i in range ( len ( keyData ) ):
      key = keyData[ i ].text
      val = valueData[ i ].text
      infoDict[ key ] = val
      inp += infoDict[ '最高' ] + "," + infoDict[ '换手率' ] + "," + infoDict[ '成交量' ] + "," + infoDict[ '成交额' ] + ""
      with open ( fpath , 'a' , encoding='utf-8' ) as f:
       f.write ( inp )
  except:
       traceback.print_exc ()
       continue



def main():
    stock_list_url = 'http://quote.eastmoney.com/stocklist.html'
    stock_info_url = 'https://gupiao.baidu.com/stock/'
    output_file = 'D://a.txt'
    slist = []
    getStockList(slist,stock_list_url)
    getStockInfo(slist,stock_info_url,output_file)
main()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
BuXianShan 2019-05-03 22:51
关注
你好，我调试了你的代码，发现 getStockList 函数的这一行出错了：
lst.append ( re.findall ( r"sh6d{5}" , href )[ 0 ] )
这里一直没有匹配到。所以lst列表一直为空，导致后面没有结果。
希望可以帮到你。

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

python爬图片，代码没报错但是没有结果 python
2022-06-29 05:32

回答 2 已采纳直接运行这个脚本文件的话，图片并不是存在桌面上。而是在这个py文件同目录下，即“C:/Users/AUB/Desktop/Final Year/Python 练习/p54爬虫”
Python爬虫配合VPN爬取出现报错 python 爬虫
2021-12-22 17:33

回答 1 已采纳你这个是VPN代理问题，你可以将VPN设置成部分代理，不要全部代理你的网络。
为什么python报错但是能运行出一部分正确结果呢？ python
2021-07-27 17:34

回答 1 已采纳 import requests from lxml import etree if __name__ == '__main__': url='http://www.netbian.com/
python爬取正确但不出文件_[求助] Python 爬虫爬取豆瓣_请不要害羞，语法没有报错，但是最终没有得到图片，请各位大神帮我看看，到底哪里出现了问题？？急求...
2020-12-02 14:23

weixin_39633452的博客 don't be shy.py #coding=utf-8 import requests #导入 requests ...') else: print(path, '文件夹已经存在了，不再创建') beauty = haixiu() #创建类的实例 beauty.get_pic() #执行类中的方法 (望大神指点，谢谢！！）
python爬虫初学，运行不报错但是没有结果？ python 有问必答
2021-04-01 16:51

回答 4 已采纳代码问题：1.request少写了s。 2. fillUnivList(ulist,html)函数没有return。 3.printUnivList(ulist,num)缺少异常处理。 4
Python 爬虫代码不报错，也不显示爬取内容 python 有问必答
2021-04-22 11:19

回答 4 已采纳代码逻辑问题，main函数里只有计算耗时的部分，没有调用get_html、parse_html等函数。
python爬虫爬小说时，爬了一百多张就会报错，从新启动后爬取速度变慢了 python 有问必答爬虫
2022-08-17 20:13

回答 5 已采纳可能是访问次数频繁，被禁止访问，解决方法：使用代理 python 关于Max retries exceeded with url 的错误_Lucas__liu的博客-C
python大作业思路_pyhton大作业求助！急求python大神，不要代码只要思路！
2020-11-26 08:22

weixin_39668965的博客 2018-11-18 回答from__future__importprint_functionclassreverseindex:def__init__(self,wordfilename):self._filename=wordfilenamedefbuildindex(self):wordfile=open(self._filename,'r')self._worddict={}f...
Python调用py2neo库就这样报错怎么办？！ python 有问必答
2021-10-05 19:02

回答 1 已采纳如果使用默认的pip install py2neo则在进行导包时会出现报错问题，因此需选择合适的版本降低一下py2neo的版本pip install py2neo==4.1.1
python爬虫如何垂直爬取网页内容？ python 开发语言爬虫
2021-11-29 19:12

回答 1 已采纳 img = requests.get(url=img_url) # img_url：图片的路径 with open('{}.jpg'.format(n), 'wb') as f: # n：文件名
爬虫代码没错却爬取失败？ python 有问必答
2021-07-20 07:59

回答 4 已采纳爬虫被封禁常见原因列表如果你一直被网站封杀却找不到原因，那么这里有个检查列表，可以帮你诊断一下问题出在哪里。首先，检查 JavaScript 。如果你从网络服务器收到的页面是空白的，缺少信息，或其
python3 中文乱码与默认编码格式设定方法
2021-01-20 04:33

python默认编码格式是utf-8。...能让import sys print(sys.getdefaultencoding())输出“gbk“的大神请进！！！） python 3和2很大区别就是python本身改为默认用unicode编码。字符串不再区分”abc”和u”abc”,
python爬小说，正文怎么都换不了行，怎么办？ python
2022-04-17 19:49

回答 1 已采纳 1、你的循环没有退出的语句，没有页数，就出错了。 2、正文不换行的问题改一下代码 for x in text: f.write(x) f.write('\r\n') # 改
python爬虫网易云音乐评论再分析_python 网易云音乐评论爬取问题
2020-11-29 00:27

weixin_39858132的博客除了使用phantomjs,selenium之外，怎么爬取多页评论，这两个都太慢了。例如http://music.163.com/#/song?i... 的评论。webapi都是http://music.163.com/weapi/v1...，每页20个评论，怎么获取下一页的评论，param是...
python日历程序编写_急求大神教如何在Python里编写日历
2020-11-23 19:44

weixin_39541869的博客展开全部最简单的就是2113直接调用系统命令cal，比如：5261import osyear = 2014os.system("cal -y %s" % year)2014January February MarchSu Mo Tu We Th Fr Sa Su Mo Tu We Th Fr Sa Su Mo Tu We Th F...
没有解决我的问题, 去提问

悬赏问题

¥50 导入文件到网吧的电脑并且在重启之后不会被恢复
¥15 （希望可以解决问题）ma和mb文件无法正常打开，打开后是空白，但是有正常内存占用，但可以在打开Maya应用程序后打开场景ma和mb格式。
¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝
¥20 腾讯企业邮箱邮件可以恢复么
¥15 有人知道怎么将自己的迁移策略布到edgecloudsim上使用吗？
¥15 错误 LNK2001 无法解析的外部符号
¥50 安装pyaudiokits失败
¥15 计组这些题应该咋做呀
¥60 更换迈创SOL6M4AE卡的时候，驱动要重新装才能使用，怎么解决？
¥15 让node服务器有自动加载文件的功能

爬取股票信息，python没报错但不能爬取出结果！急求大神啊！！？？？

2条回答 默认 最新

悬赏问题

2条回答默认最新