爬虫遇到一个小问题请大佬们帮帮忙

图片说明我想爬小猪租房网北京地区房源前三页我的爬虫书上用开发者工具的copyselector 爬取
请问为什么我的代码运行不对什么也不显示我是大一学生不懂什么具体的html css具体规则
基本点完copyselector 就直接粘贴了不知道是否还要加工一下图片说明

 #encoding:utf-8
from bs4 import BeautifulSoup
import requests
import time

headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.108 Safari/537.36'}


def get_links(url):
    wbdata = requests.get(url, headers=headers)
    print(wbdata.status_code)
    soup = BeautifulSoup(wbdata.text, 'lxml')
    links = soup.select('#page_list > ul > li > a')
    for link in links:
        href = link.get("href")
        get_info(href)


def get_info(url):

    wbdata = requests.get(url, headers=headers)
    soup = BeautifulSoup(wbdata.text, 'lxml')
    tittles = soup.select('div.pho_info > h4')
    addresss = soup.select('body > div.wrap.clearfix.con_bg > div.con_l > div.pho_info > p > span')
    prices = soup.select('#pricePart > div.day_l > span')
    for tittle, address, price in zip(tittles, addresss, prices):
        data={'tittle':tittle.get_text().strip(),'address':address.get_text().strip(),'price':price.get_text()}
        print(data)

if __name__ == '__main__':
    urls = ['http://bj.xiaozhu.com/search-duanzufang-p{}-0/'.format(number) for number in range(1, 3)]
    for ursl in urls:
        get_links(ursl)
        time.sleep(2)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
脱裤儿任风吹 2018-01-12 12:08
关注
我看了一下，是你的address css错误，导致zip(tittles, addresss, prices) 出的结果永远都是空的，不会进入打印的那一步

addresss = soup.select('div.con_l > div.pho_info > p > span') 将css的一行改为这个，再试一下吧

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

一个爬虫小程序遇到的问题 javascript python 爬虫
2022-08-26 14:49

回答 2 已采纳改成这样 response = requests.request("POST", url, data=payload) print(response.content.decode('gbk'))
python爬虫一个小问题 python 爬虫
2023-02-17 09:21

回答 5 已采纳你的原代码拷贝过来执行的话，name返回的是None，也就是说你的选择器没有找到你期望的内容，调试代码修改如下：注意看打印输出的内容：所以检查下css选择器的代码是否正确吧有帮助的话，请点采
关于爬虫基础的一个小问题。。逻辑方面 python 爬虫
2022-09-27 15:30

回答 2 已采纳 init少了下划线
[小白进] 大佬们学习为什么简单？小白该如何学习？学历不高如何找工作？副业很好赚？了解后少走弯路
2021-03-28 22:54

1_bit的博客有些人可能看了这个问题觉得我在说废话，“有经验那不快那怎么才快？”。其实你有没有想过经验是可以传授的？在学习某一技术前，首先了解大致全局学习起来是否更加得心应手？编程对于大多数刚接触的同学来说是一片...
新人入坑爬虫遇到简单问题请大佬帮忙 python 爬虫
2018-01-11 14:25

回答 2 已采纳兄弟，你这ip代理一眼就看着有问题的，代理的格式是ip:port，就是端口，你这端口都没有，望采纳
一个python requests 爬虫遇到乱码的问题 python 爬虫
2022-01-24 15:24

回答 2 已采纳 jsonData='{"\u6d4b\u8bd5": 12345, "\u5185\u5bb9": ["\u6211\u4e5f\u4e0d\u77e5\u9053\u6211\u8981\u5199
selenium爬虫报错，请各位大大帮我看下是哪里问题 python 爬虫
2021-12-15 22:43

回答 1 已采纳 get_product()函数里的xpath语法全都有问题啊1、//*后面不能有div了，直接接属性及属性值了2、说实话你第一句//*div[@class="items"]/div[@class="i
从开始到微信/字节/快手/百度Offer ---- 我的大学后端开发学习之路（一）我的大学生活
2023-12-19 20:29

Love 6的博客从开始到微信/字节/快手/百度Offer ---- 我的大学后端开发学习之路全系列总结博客
python 爬虫遇到一个不知道该怎么说的一个问题 python
2021-03-30 16:03

回答 1 已采纳 PROXY = '"'+get_ip()+'"'这样写的是错的应该写成PROXY = get_ip()，因为get_ip（）返回的已经是字符串。
一小个关于爬虫列表问题 list python
2022-06-18 00:44

回答 1 已采纳 list3=[] start=1 for i in list2: end = list1.index(i) list3 += list1[start:end+1] if end
小白写python网络爬虫权威指南出错，求大佬们看一下 python
2020-11-26 21:27

回答 2 已采纳 findAll = find_all # BS3 findChildren = find_all # BS2 应该是网站更新了吧
〖毕业季|进击的技术er〗其他人都在缅怀青春、告诉你如何拿到 offer 、提高自己的技术栈、做未来规划路线，我偏要反其道而行、告诉你们一个不一样的技术er的职场成长。
2022-06-19 23:54

哈哥撩编程的博客我的一年工资买不起一个厕所… 班里最厉害的小姐姐去了交通银行，工资9000块一个月… 短暂的试用期、短暂的工作 & 第一次跳槽因为无法接受如此远距离的工作外派，我选择了离职。在经历一份短暂的职场历练之后，我...
python后端开发或爬虫怎么系统学习？ python 后端爬虫
2023-04-13 13:18

回答 1 已采纳爬虫严格来讲并不算一个大方向，更偏向于js逆向，python的话推荐走后端方向至于系统学习的话，推荐去blibili找一些路线，然后根据路线去找bilibili上播放量比较高的视频进行系统学习
CFT-ctf.show-信息收集闯关
2022-02-14 21:43

max-sec (辣子鸡丁)的博客可能会有意外收获解题思路：右键查看源代码---查看网络数据包中的流量 FLAG：ctfshow{163ab0ee-8656-4a97-a458-49e65b819cf7} web4 提示信息：总有人把后台地址写入robots，帮黑阔大佬们引路。解题思路：访问反...
Java入门请不要放弃，学习路线以及侧重点分析
2020-07-03 09:56

Java架构技术官的博客在开始讲述之前，先给读者们一波小福利吧，小编最近整理出最新的一套java基础学习资料我觉得对每一位小白或是有一点基础的小伙伴都有用，所以整理的好几天今天分享给大家【领取方式：转发＋关注，私信小编微...
没有解决我的问题, 去提问

悬赏问题

¥15 求daily translation（DT）偏差订正方法的代码
¥15 js调用html页面需要隐藏某个按钮
¥15 ads仿真结果在圆图上是怎么读数的
¥20 Cotex M3的调试和程序执行方式是什么样的？
¥20 java项目连接sqlserver时报ssl相关错误
¥15 一道python难题3
¥15 牛顿斯科特系数表表示
¥15 arduino 步进电机
¥20 程序进入HardFault_Handler
¥15 关于#python#的问题：自动化测试

爬虫遇到一个小问题 请大佬们帮帮忙

2条回答

悬赏问题

爬虫遇到一个小问题请大佬们帮帮忙