qq_35247940 2019-03-08 22:40 采纳率: 0%
浏览 7808

为啥在jupyter运行没有结果

from bs4 import BeautifulSoup
import requests
import time

headers={
'Uster-Agent':'Mozilla/5.0(Windows NT 6.1;WOW64) AppleWebKit/537.36(KHTML,like Gecko) Cheom/53.0.2785.143 Safri/537.6'
}

def judgment_sex(class_name):
if class_name ==['member_icol']:
return '女'
else:
return '男'

def get_links(url):
wb_data =requests.get(url,headers=headers)
soup= BeautifulSoup (wb_data.text,'lxml')
links=soup.select('#page_list>ul>li>a')
for link in links:
href =link.get("href")
get_info(href)

def get_info (url):
wb_data=requests.get(url,headers=headers)
soup=BeautifulSoup(wb_data.texr,'lxml')
titles=soup.select('div.pho_info>h4')
addresses=soup.select('span.pro5')
prices=soup.select('#pricePart>div.day_1>span')
imgs=soup.select('#floatRightBox>div.js>box.clearfix>div.member_pic>a>img')
names=soup.select('#floatRightBox>div.js_box.clearfix>div.w240>h6>a')
sex.soup.select('#floatRightBox>div.js_box.clearfix>div.member_pic>div')
for tittle, address, price, img, name, sex in zip(tittle,addresses,prices,imgs,names,sexs):
data={
'tittle':tittle.get_text().strip,
'address':address.get_text().strip(),
'price':price.get_text(),
'img':img.get("src"),
'name':name.get_text(),
'sex':judgment_sex(sex.get("clas"))
}
print(data)

if name == '__main__':
urls=['http://bj.xiaozhu.com/search-duanzufang-p{}-0/'.format(number)for number in range (1,14)]
for single_url in urls:
get_links(single_url)
time.sleep(4)

  • 写回答

1条回答

  • threenewbee 2019-03-08 23:40
    关注

    你的代码没有缩进,没法帮你调试

    你可以用fiddler抓包看下,你得到的数据和浏览器访问得到的有什么不同

    评论

报告相同问题?

悬赏问题

  • ¥100 c语言,请帮蒟蒻写一个题的范例作参考
  • ¥15 名为“Product”的列已属于此 DataTable
  • ¥15 安卓adb backup备份应用数据失败
  • ¥15 eclipse运行项目时遇到的问题
  • ¥15 关于#c##的问题:最近需要用CAT工具Trados进行一些开发
  • ¥15 南大pa1 小游戏没有界面,并且报了如下错误,尝试过换显卡驱动,但是好像不行
  • ¥15 没有证书,nginx怎么反向代理到只能接受https的公网网站
  • ¥50 成都蓉城足球俱乐部小程序抢票
  • ¥15 yolov7训练自己的数据集
  • ¥15 esp8266与51单片机连接问题(标签-单片机|关键词-串口)(相关搜索:51单片机|单片机|测试代码)