yinghua_shu 2016-08-15 09:54 采纳率: 28.6%
浏览 1431
已结题

python爬虫,爬不了HTML

-*- coding: cp936 -*-

import bs4 as bs
import re, urllib2
import threading
import time
import datetime
import sys
import MySQLdb
import os
from time import strftime
import traceback
import base64
import uuid
from urlfetch import get

def get_page(link):
try:
response = urllib2.urlopen(link)
return response.read()
except:
return ""

def get_page_soup(link):
try:
html = get_page(link)
doc = "".join(html)
soup = bs.BeautifulSoup(html)
return soup
except:
return ""
print get_page('http://v.youku.com/v_show/id_XMTY4MzE0NjU2MA==.html')
print get_page_soup('http://v.youku.com/v_show/id_XMTY4MzE0NjU2MA==.html')
为什么第一个函数能行,第二个函数却抓不到界面?

  • 写回答

1条回答 默认 最新

  • dabocaiqq 2016-08-15 17:17
    关注

    看下是不是网络问题

    评论

报告相同问题?

悬赏问题

  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 对于相关问题的求解与代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 信号傅里叶变换在matlab上遇到的小问题请求帮助
  • ¥15 保护模式-系统加载-段寄存器
  • ¥15 电脑桌面设定一个区域禁止鼠标操作
  • ¥15 求NPF226060磁芯的详细资料