求大神解决python爬取淘宝信息的问题

正在学习mooc里的python爬虫课程，在编写课程里的实例遇到了一些问题。
以下代码想要得到淘宝商品搜索页面中宝贝标题和价格的列表，按照视频上老师的代码写的但是没有出结果，希望有大神看到可以帮忙解答一下。
ps：本人是python初学小透明，如果犯了低级错误希望大家不要介意，谢谢
【代码如下】
import requests
import re

def gerHTMLText(url):
try:
r = requests,get(url)
r.raise_for_status()
r.encoding = 'utf-8'
r.headers = 'Mozilla10'
return r.text
except:
print("杩炴帴澶辫触")

def parsePage(ilt, html):
try:
plt = re.findall(r'\"view_price\":\"[\d.]*\"', html)
tlt = re.findall(r'\"raw_title\":\".*?\"', html)
for i in range(len(plt)):
price = eval(plt[i].split(':')[1])
tltle = eval(tlt[i].split(':')[1])
ilt.append([price, title])
except:
print("")

def printGoodsList(ilt):
tplt = "{:4}\t{:8}\t{:16}"
print(tplt.format("搴忓彿", "浠锋牸", "鍟嗗搧鍚嶇О"))
count = 0
for g in ilt:
count = count + 1
print(tplt.format(count, g[0], g[1]))

def main():
goods = '涔﹀寘'
depth = 2
start_url = 'https://s.taobao.com/search?q=' + goods
infoList = []
for i in range(depth):
try:
url = start_url + '&s=' + str(44*i)
html = getHTMLText(url)
parsePage(infoList, html)
except:
continue
printGoodsList(infoList)

main()

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

7条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
_pray 2018-08-12 11:22
关注
一般像淘宝这种都有反爬的措施，新手可以去爬些简单的，比如很经典的妹子图啊等等，给你本书https://download.csdn.net/download/qq_40499719/10599218

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

求助大神。Python爬取某报纸，似乎遇到传递值，爬不出内容。麻烦帮助修改代码，万分感谢。 python 有问必答
2021-04-16 19:17

回答 5 已采纳 import requests import bs4 import os import datetime import time import json def fetchUrl(url):
python爬虫爬取京东评论返回空白的求助贴 python
2021-02-17 18:23

回答 3 已采纳在header参数中添加referer默认值，应该是直接访问触发反爬了
python爬取酷狗音乐返回值不正常 python
2019-08-24 23:56

回答 2 已采纳找到了，在某些网络下，获取此json需要传cookies参数，而某些网络却不用(酷狗这操作好沙雕) 代码改为 ``` requests.get(url=url, headers=headers
大神用python爬取天气信息并且语言播报
2020-11-03 13:38

python程序员小'鹏的博客此案例实现功能：利用网络爬虫，爬取某地的天气，并打印和语音播报。要用到requests库，lxml库，pyttsx3库，没有的，可以先安装一下，都可以通过pip安装： pip install requests pip install lxml pip install ...
python爬取跳页url不变的网页表格数据 python
2019-07-16 16:25

回答 4 已采纳数据量不大的话用selenium 自动化，或者抓包分析接口
PYTHON 爬取金十数据点击加载更多后返回的网页打不开报错 502 python
2019-08-11 16:38

回答 1 已采纳不要用urllib了吧，用requests库，就一个字，爽，操作简单，API简洁，用pip安装一下，用了之后保证你不会再用urllib 502出错，是因为headers需要两个参数 "
Python爬取数据后，如何将这些数据进行图表绘制？ python
2020-06-03 12:17

回答 1 已采纳定义个列表 DataList=[],然后用append函数就可以了
Python爬取生态环境水污染排放标准.mp4
2020-08-28 16:49

一个初学者的爬虫案例。用到了网页内容获取和解析方法。步骤很详细。适合初学者练习或修改。里面有不少可以简化的地方，比如使用函数、获取完整链接等。希望大神可以帮忙完善。
初学python爬虫，爬取不到网页的阅读数是怎么回事？求大神解答 python
2021-03-07 11:27

回答 3 已采纳数据是js动态渲染的，scrapy需结合splash使用，用selenium速度虽慢点，但是对js加载数据的获取准确性较高。 driver.implicitly_wait(5) #page=dri
如何用Python3爬取360翻译？ python
2021-04-29 21:33

回答 1 已采纳可以用scrapy框架来爬，我之前用scrapy框架爬过一次，实在不行，直接使用seleium模拟人工直接爬下来。
Python爬虫爬取网页源代码为空，求问原因&解决方案（向） python 爬虫
2015-08-11 04:55

回答 5 已采纳代码： ``` #!/usr/bin/env python3 #-*- coding=utf-8 -*- import urllib3 if __name__ == '
python爬取亚马逊店铺信息_用python爬取亚马逊物品列表
2020-12-05 11:17

weixin_39654245的博客 1. 仔细分析亚马逊查询...其实是我还没有好的办法区分两个信息，所以各位大神有什么好的方法请指导以下，小弟感激不尽了。附上代码(page_num >= 2这个可以去掉，则可以爬取整个列表，调试时可以加上限制，只爬取2页):
Python爬取网页时的#号是为了区分什么 python
2017-05-20 08:02

回答 1 已采纳 ``` #是html的锚点，所以要排除在url地址之外 ```
python爬取机票信息
2020-03-29 18:12

秋之鈤的博客 python爬取机票信息飞机和高铁列车不同，在同样的航线中有着不同的票价，借此我们希望获取尽量多的机票信息来分析机票的变化规律。首先我们选取京东机票为爬取对象(http://jipiao.jd.com/)，以北京至上海为例，...
python爬取贴吧_python爬取
2020-11-21 02:40

weixin_39814378的博客 python爬取百度贴吧源码，由吾爱大神原创制作，通过python爬虫程序来实现对百度贴吧的回复爬取，可以自动生成excel文件，让你能更加清晰地查看贴吧的回复与帖子信息。本次放出python爬取百度贴吧源码数据资源下载，...
没有解决我的问题, 去提问

悬赏问题

¥15 关于#matlab#的问题：在模糊控制器中选出线路信息，在simulink中根据线路信息生成速度时间目标曲线（初速度为20m/s，15秒后减为0的速度时间图像）我想问线路信息是什么
¥15 banner广告展示设置多少时间不怎么会消耗用户价值
¥16 mybatis的代理对象无法通过@Autowired装填
¥15 可见光定位matlab仿真
¥15 arduino 四自由度机械臂
¥15 wordpress 产品图片 GIF 没法显示
¥15 求三国群英传pl国战时间的修改方法
¥15 matlab代码代写，需写出详细代码，代价私
¥15 ROS系统搭建请教（跨境电商用途）
¥15 AIC3204的示例代码有吗，想用AIC3204测量血氧，找不到相关的代码。