！！急求为什么爬取结果不能写到文档爬取的结果只有一条记录？

想要爬取股票信息，新手不熟悉，希望能有大神给出解决方法！！急

# -*- coding: utf-8 -*-
import requests
from bs4 import BeautifulSoup
import re
import traceback
import bs4  
import sys
import time
reload(sys)
sys.setdefaultencoding('utf-8')


def getHTMLText(url,code='utf-8'):
    try:
        r = requests.get(url)
        r.raise_for_status()
        r.encoding = code
        return r.text
    except:
        return ""

def SetFileName():
 dirname = time.strftime ( '%Y%m%d' , time.localtime ( time.time () ) ) #获取当前日期
 dirname += 'sh'
 return dirname


def getStockList(lst,stockURL):
    # html = getHTMLText(stockURL,'GB2312')
    html = getHTMLText(stockURL, 'utf-8')
    soup = BeautifulSoup(html,'html.parser')
    a = soup.find_all('a')
    for i in a:
        try:
            href = i.attrs['href']
            lst.append(re.findall(r"[s][hz]\d{6}",href)[0])
        except:
            continue


def getStockInfo(lst,stockURL,fpath):
    count = 0
    for stock in lst:
        url = stockURL + stock + ".html"
        html = getHTMLText(url)
        try:
            if html == "":
                continue
            infoDict = {}
            soup = BeautifulSoup(html,'html.parser')
            stockInfo = soup.find('div',attrs={'class':'stock-bets'})
            if isinstance(stockInfo,bs4.element.Tag):  
                name = stockInfo.find_all(attrs={'class':'bets-name'})[0]
                infoDict.update({'股票名称': name.text.split()[0]})
                keyList = stockInfo.find_all('dt')
                valueList = stockInfo.find_all('dd')
                for i in range(len(keyList)):
                    key = keyList[i].text
                    val = valueList[i].text
                    infoDict[key] = val
                    with open(r'D:lps.txt', 'w') as f:
                        # f.write(str(infoDict) + '\n')
                        # print(str(infoDict) + '\n')

                         f.write(key + str(val))
                         print(key +str(val))

                    f.close()
        except:
            count = count + 1

            traceback.print_exc()
            continue



def main():
    stock_list_url = 'http://quote.eastmoney.com/stocklist.html'
    stock_info_url = 'https://gupiao.baidu.com/stock/'
    output_file = 'D://lps.txt'
    slist = []
    getStockList(slist,stock_list_url)
    getStockInfo(slist,stock_info_url,output_file)


main()

结果如图
图片说明

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
鲁远泰 - 易景通 - 15974133853 2019-05-04 15:58
关注
使用scrapy框架爬取网页数据时，分明已经获取到数据了，日志也确认了这点那问题肯定是出在管道上了，可是文件被创建

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

求KTV前后台源代码作为参考！！！？！！？！最近在写这个项目谢谢了
2016-03-06 12:29

回答 1 已采纳 http://download.csdn.net/detail/lc1002/4950694 http://download.csdn.net/download/boo12355/4796546
这个C++程序有什么问题？急求！！！ c++
2015-04-06 08:24

回答 7 已采纳帮你修改了下 http://codepad.org/NAPhIKjq ``` using namespace std; class Date {public: Date(i
三角函数（包括反三角函数）怎么不调用库实现，可以取代math库？急求！ c++ c语言
2019-01-08 15:36

回答 1 已采纳使用cord ic算法，只需要移位和加减法就可以计算三角函数，具体算法可以百度一下。
python爬取pdf教程_#如何利用Python抓取PDF中的某些内容#python爬取pdf教程
2021-03-06 16:03

维权骑士的博客如何利用Python抓取PDF中的某些内容学生每天要学习，工作者要工作，家庭主妇每都要务。不论做什么，都有着相应的操作流同样就会有操作技巧。学生运用技巧学习才不会累，学得还会更快更多；工作者掌握技巧进行工作，...
急求大佬帮助！！制作一个asp.net页面！！ asp.net c# visual studio
2020-05-17 09:21

回答 1 已采纳 ``` using System; using System.Collections.Generic; using System.Linq; using System.Web; usin
Python写的圆柱体体积代码 python
2021-11-29 21:23

回答 1 已采纳 r = float(input()) h = float(input()) pi = 3.1415 area = r * r * pi volume = area * h print(area,vol
急求！！！！！！！！ java 有问必答
2021-06-16 03:19

回答 2 已采纳代码如下： public class 电话支付测试 { public static void main(String[] args) { MobilePhone mobile = new
python爬取正确但不出文件_[求助] Python 爬虫爬取豆瓣_请不要害羞，语法没有报错，但是最终没有得到图片，请各位大神帮我看看，到底哪里出现了问题？？急求...
2020-12-02 14:23

weixin_39633452的博客 BeautifulSoup(r.text, 'lxml').find_all('a', class_='links') #获取网页中的 class 为 links 的所有 a 标签 print('开始创建文件夹') self.mkdir(self.folder_path) #创建文件夹 print('开始切换文件夹') os.chdir...
小白急求！eclipse为什么重写了方法还会报未定义错误 eclipse
2017-07-26 14:55

回答 7 已采纳方法参数类型不一致，传null 也是不行的
用Python写，急求解答 python
2015-11-03 01:09

回答 2 已采纳楼上的写错了 def row_count(n): if n==0: return 1 if n==1: return 2 if n==2: return 3 if n==3: ret
Python爬虫的问题，急求大佬解惑 mysql python
2021-02-21 21:59

回答 14 已采纳楼主请私信我，我可以挨个为你解答每个错误的产生原因以及如何修正。
python一个月能速成吗_Python速成有什么办法，需要一个月做出系统，急求？
2020-12-04 08:36

weixin_39604897的博客可以用Xmind做个思维导图，这样思路清晰一些，不至于做到后期不知道自己在干啥，不知道自己当初怎么想的。假设你想做一个网站，后端选用Python，那么最方便的方式就是选择成熟的Web框架。首先学习Python的基本语法...
急求！！！请问我错在哪里？以及怎么改？谢谢！！！c语言给国家的名称按字典顺序排序 c语言
2019-04-24 22:10

回答 2 已采纳错在哪里都给你注释了，看看吧： ``` #include #include #include #define MAX_LEN 10 #define N 150 void Sor
用python爬取网易云评论_python 网易云音乐评论爬取问题
2020-11-24 07:04

weixin_39518678的博客除了使用phantomjs,selenium之外...webapi都是http://music.163.com/weapi/v1…，每页20个评论，怎么获取下一页的评论，param是加密的，post都不知道post什么数据在网上有一种方式只能获取123456789101112131415161...
急求以自己的角度写一篇院学生会秘书处的工作计划….doc
2021-12-05 05:50

急求以自己的角度写一篇院学生会秘书处的工作计划….doc
matlab 积分结果 int,matlab积分结果中的gamma()函数参数问题，急求解答！！！
2021-04-29 04:41

安慰记店长的博客该楼层疑似违规已被系统折叠隐藏此楼查看此楼syms t b x K0 positivef_cosb =x^(-11/6)*exp(-t*x)*cos(b*x)f_cosb_int=int(f_cosb,x,K0^,inf)运行结果如下：2 2gamma(-5/6, K0~ t~ - K0~ b~ I) %2ans= 1/2 ---------...
急求学生会监察部工作计划！.doc
2021-12-05 05:50

急求学生会监察部工作计划！.doc
python爬取toefl_Python scrapy爬取数据异常求帮分析源码
2021-02-04 05:42

weixin_39845206的博客源代码如下，我是参照网上scrapy教程写的：#coding:utf-8from scrapy.spider import Spider,BaseSpiderfrom scrapy.http import Requestfrom scrapy.contrib.spiders import Rule,CrawlSpiderfrom scrapy.contrib...
qq发压缩文件服务器拒绝,QQ不能接收和发送RAR压缩文件是怎么回事？急求解决方法！...
2021-08-06 16:10

东哥起飞的博客互聯網問題描述:但其他文件可以照常接收对方发送给我,我这收不到任何提示我发送给对方,也是一样QQ已经卸载重装了，而且是装到另一个盘符安全设置里也把级别设置到最低了本机也可以解压文件winrar也重装了卡巴也没查...
c语言如何将结果写到文件中,急求如何将下列C语言程序数据存储到文件中？
2021-05-24 05:26

oniT Tino的博客该楼层疑似违规已被系统折叠隐藏此楼查看此楼求如何改动才能将下列程序的存储输入或输出数据(或两者一起)到指定的文件(或运行时直接创立一个文件)如Arrangement中。#include int n=0;int rest[7][7]; //全局声明,以...
没有解决我的问题, 去提问

悬赏问题

¥15 WPF使用Canvas绘制矢量图问题
¥15 用三极管设计一个单管共射放大电路
¥15 孟德尔随机化r语言运行问题
¥15 pyinstaller编译的时候出现No module named 'imp'
¥15 nirs_kit中打码怎么看(打码文件是csv格式)
¥15 怎么把多于硬盘空间放到根目录下
¥15 Matlab问题解答有两个问题
¥15 LCD12864中文显示
¥15 在使用CH341SER.EXE时不小心把所有驱动文件删除了怎么解决
¥15 gsoap生成onvif框架

！！急求 为什么爬取结果不能写到文档 爬取的结果只有一条记录？

1条回答 默认 最新

悬赏问题

！！急求为什么爬取结果不能写到文档爬取的结果只有一条记录？

1条回答默认最新