漫漫在努力 2021-03-07 23:39 采纳率: 100%

已采纳

跟着教学视频用python爬取房天下数据出错

我的代码

import requests as req

res=req.get("https://zj.esf.fang.com/")

from bs4 import BeautifulSoup

soup=BeautifulSoup(res.text,"html.parser")

houses = soup.select(".shop_list dl")

def getHouseInfo(url):

info = {}

soup = BeautifulSoup(req.get(url).text,"html.parser")

res = soup.select(".tab-cont-right .trl-item1")

print(res)

for re in res:

tmp = re.text.strip().split('\n')

info[tmp[1].strip()] = tmp[0].strip()

xiaoqu = soup.select(".rcont .blue")[0].text

info["小区名字"] = xiaoqu

zongjia = soup.select(".tab-cont-right .trl-item")

info["总价"] = zongjia[0].text

print(info)

getHouseInfo("https://zj.esf.fang.com/chushou/3_181595442.htm")

domain="https://zj.esf.fang.com"

#遍历返回的房屋信息

for house in houses:

#加try except异常处理

try:

print(domain+house.select(".clearfix a")[0]['href'])

except Exception as e:

print("---------->",e)

错误如下和教学视频爬出结果如下

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

3条回答默认最新

天际的海浪 2021-03-08 00:28

关注

import requests as req
res=req.get("https://zj.esf.fang.com/")
from bs4 import BeautifulSoup
soup=BeautifulSoup(res.text,"html.parser")
houses = soup.select(".shop_list dl")

def getHouseInfo(url):
    info = {}
    soup = BeautifulSoup(req.get(url).text,"html.parser")
    res = soup.select(".tab-cont-right .trl-item1")
    print(res)
    for re in res:
        tmp = re.text.strip().split('\n')
        info[tmp[-1].strip()] = tmp[0].strip()
    xiaoqu = soup.select(".rcont .blue")[0].text
    info["小区名字"] = xiaoqu
    zongjia = soup.select(".tab-cont-right .trl-item")
    info["总价"] = zongjia[0].text.strip()
    print(info)

getHouseInfo("https://zj.esf.fang.com/chushou/3_181595442.htm?rfss=1-ca39b791988eaa89e8-1d")

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(2条)

报告相同问题？

关注问题

请帮助一下Python爬取房天下的数据的输出 python 向大咖问开源有问必答
2021-04-21 12:02

回答 6 已采纳这个问题难倒是不难，就是挺费时间，只能给一些思路和建议。 1、首先获取id的代码有些问题，获取的id是有重复的，可以这样写： def get_id(city): url = 'https
Python爬取存储出错 python 学习方法改行学IT
2022-10-18 00:23

回答 1 已采纳是encoding，你拼错了，有帮助的话采纳一下哦！
python 爬虫，如何爬取相关数据 python 有问必答爬虫
2021-11-11 11:15

回答 1 已采纳先确定需要爬取的网站，然后分析网站的数据来源，是后端生成数据还是ajax生成数据，确定数据来源方式就根据HTTP请求编写代码，这个涉及一些请求参数的加密、转换等等处理，然后清洗数据和数据入库
手把手教你用Python爬取某网小说数据，并进行可视化分析
2023-05-04 11:17

Python小远的博客借助相关互联网手段来表现文学作品及含有一部分文字作品的网络技术产品，在当前成为一种新兴的文学现象，并快速兴起，各种网络小说也是层出不穷，今天我们使用selenium爬取红袖天香网站小说数据，并做简单数据可视化...
如何使用python爬取canvas中的内容呢？ css javascript python
2022-04-29 10:30

回答 1 已采纳需要在浏览器上临时显示后端实时处理的图像，需要将图像数据转成json字符串传输给js绘图。后端python处理： import cv2 as cvfrom encodings import base
python 爬取表格获取不到数据 python
2020-02-17 22:52

回答 4 已采纳爬取需要在请求头里面添加Host，要不然爬取不到任何信息，另外源码是不规则的html代码，所以需要指定html解析器 ``` # -*- coding：utf-8 -*- import os
怎么样用Python爬取数据 python
2022-10-12 10:57

回答 2 已采纳爬取代码如下，如有帮助请点击一下采纳谢谢： import requests headers = { "authority": "pythonscraping.com", "acc
使用python对疫情数据进行可视化分析
2021-01-10 14:15

weixin_45874832的博客阅读目录 1.获取并处理疫情数据 ...或者通过python的request请求得到，也可以使用同样的方式获取全球的疫情数据，本文只对全国疫情数据进行了可视化展示。当日详情数据:详情数据历史数据:历史数据 1.
python爬取数据遇到的一些问题 python
2021-11-24 07:07

回答 5 已采纳 import requests url = r'https://hugovk.github.io/top-pypi-packages/top-pypi-packages-30-days.min.js
python 爬取数据数据缺失 python
2022-11-25 20:06

回答 2 已采纳它这个做了一点点反扒，你需要把标签里面的5取出来，和你的0.9拼在一起。试试下面这个看行不 Moive_score1 = li.xpath('./i/b/text()') Moive_score2 =
python爬取网页题库如何将选项一一对应 python
2022-10-06 15:37

回答 1 已采纳拿去 import requests from bs4 import BeautifulSoup url_list = [] option_one = [] option_two = [] op =
python中不同类型的数据不能相互运算_python语法入门（数据类型、运算）
2020-12-05 18:45

weixin_39622283的博客 python入门前言：受一位初学...网络数据采集爬取某电视剧的弹幕爬取小说数据分析excel文件数据处理，代替vba图像处理机器学习，深度学习，神经网络等Web 开发Django开发Web服务window窗体应用上位机开发游戏开发...
对于股市主板A股使用python爬取前100条数据 python 有问必答
2021-06-23 15:19

回答 1 已采纳每次翻页的时候，url都有变化规律，如第二页http://quote.cfi.cn/quoteList.aspx?sortcol=stockcodesortwayasc&sortway=asc&pag
Python实现简单的数据采集方法
2023-10-25 09:38

心梓知识的博客数据采集是指利用各种手段和技术收集互联网上的各种数据，这些数据可以是图片、视频、文本等各种形式，采集的目的是为了进行数据挖掘、分析、研究等用途。例如，我们需要从某个网站上获取某些关键词的搜索结果，那么...
全网最全python爬虫精进
2021-04-25 17:33

yk 坤帝的博客因为这些数据是用计算机的语言写的，浏览器还要把这些数据翻译成我们能看得懂的内容；（2）提取数据：我们就可以在拿到的数据中，挑选出对我们有用的数据；（3）存储数据：将挑选出来的有用数据保存在某一文件/...
没有解决我的问题, 去提问

悬赏问题

¥15 如何在scanpy上做差异基因和通路富集？
¥20 关于#硬件工程#的问题，请各位专家解答！
¥15 关于#matlab#的问题：期望的系统闭环传递函数为G(s)=wn^2/s^2+2¢wn+wn^2阻尼系数¢=0.707，使系统具有较小的超调量
¥15 FLUENT如何实现在堆积颗粒的上表面加载高斯热源
¥30 截图中的mathematics程序转换成matlab
¥15 动力学代码报错，维度不匹配
¥15 Power query添加列问题
¥50 Kubernetes&Fission&Eleasticsearch
¥15 報錯：Person is not mapped，如何解決？
¥15 c++头文件不能识别CDialog

码龄粉丝数原力等级 --

跟着教学视频用python爬取房天下数据出错

3条回答默认最新

码龄粉丝数原力等级 --

悬赏问题

跟着教学视频用python爬取房天下数据出错

3条回答 默认 最新

悬赏问题

3条回答默认最新