新手小白& 2021-12-15 19:46 采纳率: 33.3%
浏览 47
已结题

python爬取淘宝商品信息遇到难题。怎么办

import requests
import re

def get_heml_text(url):
try:
kv={"user-agent: 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.198 Safari/537.36'FC%2FuZ9ajQ%3D%3D; mt=ci=-1_0; cookie2=19ea9a18d18256b8f52fdebd099eb842; tb_token=3edea9a6eef73; tk_trace=oTRxOWSBNwn9evfHtXQifmafmYzSU80EW6dedixskcJ%2Bc8J0R27pVpwR009bxUw3pJYMDEOjj9VTZncJdZFFzzCuQZlwGVBOW%2FCRJKJIVtheeX5q%2FaKDT5jdsRLy%2FtFA1krMqbUdMxb6VEc2WIOEGesdZEDO1Rt0GEvS3hI8h7GTBUVPu%2BIFJboYw4NNrv7bRbVBqSBqrQEfO01m29ozFEUt%2F2ao1ZrHWo9p57Vb5VayuVjyN0BTQPieBZhjcOkbm95DfEOYwwDQ1frB39ae1F7TuY474bdH9rMcbmbVL%2Bz1iJVNTPapZbtiC7BBiN1BTZRVz9xfl5yD%2FQT6o%2FnjARRxV2rtTH3vD6hqJlzYZh3h2zxq5vplWojI; _m_h5_tk=43ad03863a5bf153b22ee5c39a678583_1639560939858; _m_h5_tk_enc=571e17d430be51deaed58f1b50c61c38; alitrackid=http://www.taobao.com/; lastalitrackid=http://www.taobao.com/; xlly_s=1; JSESSIONID=35F967F2B978FA61319C1ADC32E4D3CF; uc1=cookie14=Uoe3fokbuHhR6Q%3D%3D; l=eBr51-HrgXir-E2zBOfwnurza77tsIRxIuPzaNbMiOCPOn1p5XsFW6QszuY9CnhVh652R37vCcawBeYBqnY4n5U62j-lasDmn; isg=BIGB_YzIhGkAOOhti8HGAHhYkM2brvWg0kuf7ePWdQjnyqGcK_6gcKrIqT6Mc43Y; tfstk=cMuOBP6uipvM7fFKacKnlQsTBAdhZuJYd1wckB1A3SwV0R_Ai7goyE7yfSOvXBC..'}
r.request.get(url,headers=kv,timeout=30)
r.raise_for_status()
r.encoding= r.apparent_encoding
return r.text
except:
return""

def parsepage(ilt,html):
try:
plt=re.findall(r""view_price":"[\d.]"",html)
tlt=re.findall(r""raw_title":".
?"",html)
for i in range(len(plt)):
price=eval(plt[i].split(":")[1])
title=eval(tlt[i].split(":")[1])
ilt.append([price,title])
except:
print("")

def print_goods_list(ilt):
tplt="{:4}\t{:8}\t{:16}"
print(tplt.format("序号","价格","商品名称"))
count=0
for g in ilt:
count=count+1
print(tplt.format(count,g[0],g[1]))

def main():
goods="外套"
depth=2
start_url="https://s.taobao.com/search?initiative_id=tbindexz_20170306&ie=utf8&spm=a21bo.jianhua.20185
结果出来了这个EOL while scanning
string literal是什么意思呀?

  • 写回答

2条回答 默认 最新

  • 关注

    你字符串没有用“引号结束

    start_url="https://s.taobao.com/search?initiative_id=tbindexz_20170306&ie=utf8&spm=a21bo.jianhua.20185 之后少了 " 引号
    
    

    如有帮助,望采纳!谢谢!

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 12月24日
  • 已采纳回答 12月16日
  • 创建了问题 12月15日

悬赏问题

  • ¥15 做个有关计算的小程序
  • ¥15 MPI读取tif文件无法正常给各进程分配路径
  • ¥15 如何用MATLAB实现以下三个公式(有相互嵌套)
  • ¥30 关于#算法#的问题:运用EViews第九版本进行一系列计量经济学的时间数列数据回归分析预测问题 求各位帮我解答一下
  • ¥15 setInterval 页面闪烁,怎么解决
  • ¥15 如何让企业微信机器人实现消息汇总整合
  • ¥50 关于#ui#的问题:做yolov8的ui界面出现的问题
  • ¥15 如何用Python爬取各高校教师公开的教育和工作经历
  • ¥15 TLE9879QXA40 电机驱动
  • ¥20 对于工程问题的非线性数学模型进行线性化