import requests
import re
def getHTMLText(url): #请求
try:
r=requests.get(url,timeout=30)
r.raise_for_status()
r.encoding=r.appareent_encoding
return r.text
except:
return ""
print("")
def parsePage(ilt,html): #获取商品价格和名称
try:
plt=re.findall(r'\"view_price\"\:\"[\d\.]*\"',html)
tlt=re.findall(r'\raw_title\"\:\".*?\"',html)
for i in range(len(plt)):
price =eval(plt[i].split(':')[1])
title =eval(plt[i].split(':')[1])
ilt.append([price,title])
except:
print("")
print("")
def printGoodslist(ilt):
tplt="{:4}\t{:8}\t{:16}"
print(tplt.format({"序号","价格","商品名称"})
count = 0
for g in ilt:
count = count + 1
print(tplt.format(count,g[0],g[1]))
print("")
def main():
goods="书包" #商品名
depth=2 #爬取多少页面
start_url=’https://s.taobao.com/search?q‘ + goods #连接
infolist=[]
for i in range(depth):
try:
url=start_url+'&s='+str(44*i)
html=getHTMLText(url)
parsePage(infolist,html)
except:
continue
printGoodslist(infolist)
main()
python爬虫代码报错,count=0提示语法错误。
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
1条回答 默认 最新
- Nick Peng 2021-04-10 01:02关注
count = 0的上面一行,少了一个右括号,如下:
print(tplt.format({"序号", "价格", "商品名称"})
还有:这一行的单引号也有问题:
start_url =’https: // s.taobao.com / search?q‘ + goods # 连接
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 为什么我运行这个网络会出现以下报错?CRNN神经网络
- ¥20 steam下载游戏占用内存
- ¥15 CST保存项目时失败
- ¥15 树莓派5怎么用camera module 3啊
- ¥20 java在应用程序里获取不到扬声器设备
- ¥15 echarts动画效果的问题,请帮我添加一个动画。不要机器人回答。
- ¥15 Attention is all you need 的代码运行
- ¥15 一个服务器已经有一个系统了如果用usb再装一个系统,原来的系统会被覆盖掉吗
- ¥15 使用esm_msa1_t12_100M_UR50S蛋白质语言模型进行零样本预测时,终端显示出了sequence handled的进度条,但是并不出结果就自动终止回到命令提示行了是怎么回事:
- ¥15 前置放大电路与功率放大电路相连放大倍数出现问题