为何爬取不了淘宝的数据？

 import requests
import re
def getHTMLtext(url):
    try:
        r = requests.get(url, timeout = 30)
        r.raise_for_status()
        r.encoding = r.apparent_encoding
        return r.text
    except:
        return ' '
def parsePage(clist, html):
    try:
        plt = re.findall(r'\'view_price\'\:\'[\d\.]*\' ' ,html)
        tlt = re.findall(r'\'raw_title\'\:\'.*?\' ' ,html)
        for i in range(len(plt)):
            price = eval(plt[i].split(':')[1])
            title = eval(tlt[i].split(':')[1])
            clist.append([price, title])
    except:
        print('')
    print(clist)
def printGoodslist(clist):
    tplt = '{:4}\t{:10}\t{:16}'
    print(tplt.format('序号','价格','商品名称'))
    count = 0
    for c in clist:
        count += 1
        print(tplt.format(count, c[0], c[1]))


def main():
    goods = '书包'
    depth = 2
    start_url = 'https://s.taobao.com/search?q=' + goods
    infolist = []
    for i in range(depth):
        try:
            url = start_url + '&s=' + str(44*i)
            html = getHTMLtext(url)
            parsePage(infolist, html)
        except:
            continue
    printGoodslist(infolist)
main()

打印出来其中的clist列表是空的，是不是正则表达式写错了？

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
.yi.ming. 2020-03-25 16:16
关注
这是之前北京理工大学的一个关于python爬虫入门的国家精品课里面的程序。代码本身没问题，但是现在淘宝网要登陆，所以并不是获取的商品的信息。
print(html[2000:3000])可知“...为确保您账户的安全及正常使用，依《网络安全法》相关要求，6月1日起会员账户需绑定手机。如您还未绑定，请尽快完成，感谢您的理解及支持！...”跳出的是登陆页面。可以用京东的商品练习。

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

python爬取淘宝商品详情页数据
2020-09-20 18:27

在深入探讨如何使用Python爬取淘宝商品详情页数据之前，我们需要明白几个关键点，包括动态加载数据的概念、如何使用Chrome开发者工具进行数据抓取分析、以及如何处理网络请求和响应。动态加载数据是指页面内容并非...
1688、淘宝网站数据爬取（python实现）
2023-08-21 22:46

auto_taobao.py 是使用 selenium 框架直接操纵浏览器进行数据爬取, 在该文件的27行的函数参数需要自己手动填写需要进行搜索的商品名称，填完之后运行即可自动爬取~ ./测试文件/requests_02.py 是使用 requests 框架...
python爬取淘宝手机销售数据
2018-08-15 11:55

爬取淘宝手机月销售数据，以excel表格形式存储，以条形图形式展示不同品牌手机在淘宝的月销售量。可以通过更改关键字手机实现对其他商品的爬取。详细介绍...
Python爬虫案例1：爬取淘宝网页数据
2023-10-27 12:54

本案例将深入探讨如何使用Python编写一个爬虫程序来抓取淘宝网站上的商品信息，例如芒果、草莓和鸭舌帽等商品的数据。首先，Python爬虫的核心是利用Python的requests库来发送HTTP请求，获取网页的HTML源代码。在这...
Python数据爬取淘宝商品信息
2025-02-09 22:33

Python数据爬取淘宝商品信息随着互联网技术的飞速发展，网络上积累了大量的信息资源，其中电子商务平台的商品信息尤为丰富。淘宝作为中国最大的C2C电商平台，每天都会有海量的商品信息更新和发布。如何有效地从...
Python爬取淘宝数据[源码]
2025-11-12 15:30

本文将深入探讨如何利用Python语言配合Selenium库，实现对淘宝网站数据的有效爬取。淘宝作为中国最大的电商平台之一，拥有海量的商品信息和用户数据，这些数据对于市场分析、商业决策具有极高的价值。在进行爬虫...
Python爬取淘宝数据指南[可运行源码]
2025-11-13 08:06

本文详细介绍了如何使用Python爬虫技术获取淘宝的原数据和商品列表接口数据。首先，文章强调了淘宝作为中国最大电商平台之一的数据价值，并提供了环境搭建所需的库（如requests、BeautifulSoup、selenium等）。接着...
Python实现淘宝商品销量数据爬取
2025-07-29 22:52

本文主要介绍了如何利用Python程序爬取淘宝商品的销量信息，重点阐述了相关的技术和方法。文章提到，读者在学习爬虫部分之前，需要具备一定的Python编程基础，熟悉requests、bs4（BeautifulSoup库）、re（正则表达式...
【爬虫】Python实现爬取淘宝商品信息（超详细）
2024-07-25 17:57

RoundLet_Y的博客项目基于Python的第三方库Selenium模拟浏览器运行、PyQuery解析和操作HTML文档，获取淘宝平台中某类商品的详细信息（商品标题、价格、销量、商铺名称、地区、商品详情页链接、商铺链接等），并基于第三方库openpyxl...
python 淘宝数据（数据爬取+可视化）.zip
2021-08-15 16:03

使用python爬取tb网手机销售数据，并将数据存入csv文件中，并通过手机销售排名、手机价格排名以及手机词云分析等内容进行数据分析可视化。本资源适合新手小白和在校学生，可根据具体需求更改，使用前请务必查看说明...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 9月27日

为何爬取不了淘宝的数据？

2条回答 默认 最新

问题事件

2条回答默认最新