python爬虫出错各位大神能不能帮我看一下是什么问题？python2.7

import urllib2
import urllib
import re

class BDTB:
def init(self,baseUrl,see_LZ):
self.baseURL = baseUrl
self.seeLZ = '?see_lz='+str(see_LZ)

def getPage(self,pageNum):
    try:
        url = self.baseURL + self.seeLZ + '&pn=' + str(pageNum)
        request = urllib2.Request(url)
        response  =urllib2.urlopen(request)
        print response.read()
        return response
    except urllib2.URLError , e:
        if hasattr(e,"reason"):
            print u"link fail,reason",e.reason
            return None
def getTitle(self):
    page = self.getPage(1)
    pattern = re.compile('<h3 class="core_title_txt.*?>(.*?)</h3>',re.S)
    result = re.search(pattern,page)
    if result:
        print result.group(1)
        return result.group(1).strip()
    else:
        return None

def getPageNum(self):
    page = self.getPage(1)
    print page.read()
    pattern = re.compile('<li class="l_reply_num.*?</span>.*?<span.*?>(.*?)</span>', re.S)
    result = re.search(pattern, page)
    if result:
        print result.group(1)
        return result.group(1).strip()
    else:
        return None

def getContent(self):
    page = self.getPage(1)
    pattern = re.complie('<div id="post_content_.*?>(.*?)</div>',re.S)
    items = re.findall(pattern,page)
    for item in items:
        print item

baseURL = "http://tieba.baidu.com/p/4866982459"
bdtb = BDTB(baseURL,1)
bdtb.getPage(1)
bdtb.getTitle()
bdtb.getPageNum()
bdtb.getContent()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
冰小点 2016-12-06 09:47
关注
问问题之前先把报错的traceback和错误提示发出来？？

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

Python爬虫解码的问题？ python 有问必答
2021-09-11 15:07

回答 2 已采纳在获得响应后，使用response.encoding=response.apparent_encoding识别网页编码即可，示例： from bs4 import BeautifulSoup from
初学python爬虫，爬取不到网页的阅读数是怎么回事？求大神解答 python
2021-03-07 11:27

回答 3 已采纳数据是js动态渲染的，scrapy需结合splash使用，用selenium速度虽慢点，但是对js加载数据的获取准确性较高。 driver.implicitly_wait(5) #page=dri
python爬虫如何自动获取Network中的某个XHR地址？ python 爬虫网络
2018-08-25 08:43

回答 4 已采纳楼主问的可能有点不清楚，我的理解是：https://zh.flightaware.com/live/airport/+{机场代号} 楼主有几千个机场代号，需要爬取这几千个URL的https://zh
python编写爬虫小程序
2021-01-03 07:25

深夜忽然想下载一点电子书来扩充一下kindle，就想起来python学得太浅，什么“装饰器”啊、“多线程”啊都没有学到。想到廖雪峰大神的python教程很经典、很著名。就想找找有木有pdf版的下载，结果居然没找到！！CSDN...
python爬虫的理解问题 chrome python selenium 爬虫
2018-02-23 03:04

回答 4 已采纳 1. 你的理解是对的 2. 我把我的理解说一下, 比如说一个网页显示了商品的价格, 而且这个价格信息是网页的js代码请求了价格信息对应的url之后显示出来的 - 我用requests库
初学python爬虫，好像是selenium的错，len(），希望大神们提点一下 javascript python selenium 爬虫
2017-11-30 00:23

回答 2 已采纳想返回数组要用复数 find_element_by_tag_name 要改成 find_elements_by_tag_name 其他还有
python爬虫下载PDF失败 python 爬虫
2023-03-27 13:35

回答 3 已采纳感谢两位。我刚刚分析了一下所有下载异常的文件，名字中都有冒号：，replace替换后现在可以下载了。
Python爬虫开发基于Python实现的获取雪球网大神们的组合的调仓记录炒股股票数据采集抓取共两个版本.rar
2022-06-18 12:06

Python爬虫开发基于Python实现的获取雪球网大神们的组合的调仓记录炒股股票数据采集抓取共两个版本.rar
Python爬虫常用的语法怎么解释更好理解？ python
2021-08-19 15:33

回答 3 已采纳奥秘指的是什么奥秘？代码没有什么捷径可言，唯多看多敲。我看你是不是学习顺序搞反了，想学爬虫，你得先了解你要爬的是个什么东西吧，先学html的基本语法，顺便了解下jquery的选择器，再来写爬虫应该会容
python多线程爬虫如何在中断后继续上次的断点下载数据 python sql 数据挖掘
2021-06-03 15:53

回答 3 已采纳 redis记没成功的不就完事了，带同步访问，doge
复制的python爬虫，在自己电脑上运行会报错，这个怎么解决啊？ python 有问必答
2021-05-23 17:47

回答 2 已采纳代码运行没有问题，检查一下requests版本和bs4版本，可以考虑升级一下。测试通过环境python3.7.6,bs4,'4.9.1',requests,'2.23.0'
Python爬虫以及数据可视化分析
2020-12-25 17:43

反卷三明治的博客 Python爬虫以及数据可视化分析之B站动漫排行榜信息爬取分析 ...简单几步，通过Python对B站...PS: 作为Python爬虫初学者，如有不正确的地方，望各路大神不吝赐教[抱拳] 本项目将会对B站番剧排行的数据进行网页信息爬取以及
python爬虫爬取京东评论返回空白的求助贴 python
2021-02-17 18:23

回答 3 已采纳在header参数中添加referer默认值，应该是直接访问触发反爬了
python大神什么水平_腾讯年薪50W的Python爬虫是什么水平？
2020-11-20 19:39

weixin_39868663的博客利用爬虫我们可以获取大量的价值数据，从而获得感性认识中不能得到的信息，比如：1、爬取数据，进行市场调研和商业分析知乎：爬取优质答案，为你筛选出各话题下最优质的内容。淘宝、京东：抓取商品、评论及销量数据...
python爬虫入门教程–优雅的HTTP库requests（二）
2020-12-25 04:11

urllib、urllib2、urllib3、httplib、httplib2 都是和 HTTP 相关的 Python 模块，看名字就觉得很反人类，更糟糕的是这些模块在 Python2 与 Python3 中有很大的差异，如果业务代码要同时兼容 2 和 3，写起来会让人...
没有解决我的问题, 去提问

悬赏问题

¥50 永磁型步进电机PID算法
¥15 sqlite 附加（attach database）加密数据库时，返回26是什么原因呢？
¥88 找成都本地经验丰富懂小程序开发的技术大咖
¥15 如何处理复杂数据表格的除法运算
¥15 如何用stc8h1k08的片子做485数据透传的功能？(关键词-串口)
¥15 有兄弟姐妹会用word插图功能制作类似citespace的图片吗？
¥200 uniapp长期运行卡死问题解决
¥15 latex怎么处理论文引理引用参考文献
¥15 请教：如何用postman调用本地虚拟机区块链接上的合约？
¥15 为什么使用javacv转封装rtsp为rtmp时出现如下问题：[h264 @ 000000004faf7500]no frame？

python爬虫出错 各位大神能不能帮我看一下是什么问题？python2.7

3条回答 默认 最新

悬赏问题

python爬虫出错各位大神能不能帮我看一下是什么问题？python2.7

3条回答默认最新