py小bai
2021-04-09 15:19
采纳率: 87.5%
浏览 38

python爬虫代码报错,count=0提示语法错误。

import requests
import re
def getHTMLText(url): #请求
    try:
        r=requests.get(url,timeout=30)
        r.raise_for_status()
        r.encoding=r.appareent_encoding
        return r.text
    except:
        return ""
    print("")
def parsePage(ilt,html): #获取商品价格和名称
    try:
        plt=re.findall(r'\"view_price\"\:\"[\d\.]*\"',html)
        tlt=re.findall(r'\raw_title\"\:\".*?\"',html)
        for i in range(len(plt)):
            price =eval(plt[i].split(':')[1])
            title =eval(plt[i].split(':')[1])
            ilt.append([price,title])
    except:
        print("")
    print("")
def printGoodslist(ilt):
    tplt="{:4}\t{:8}\t{:16}"
    print(tplt.format({"序号","价格","商品名称"})
    count = 0
    for g in ilt:
        count = count + 1
        print(tplt.format(count,g[0],g[1]))
    print("")
    
def main():
    goods="书包" #商品名
    depth=2      #爬取多少页面
    start_url=’https://s.taobao.com/search?q‘ + goods #连接
    infolist=[]
        for i in range(depth):
            try:
                url=start_url+'&s='+str(44*i)
                html=getHTMLText(url)
                parsePage(infolist,html)
            except:
                continue
        printGoodslist(infolist)
        
main()

  • 写回答
  • 关注问题
  • 收藏
  • 邀请回答

1条回答 默认 最新

  • Nick Peng 2021-04-10 01:02
    已采纳

    count = 0的上面一行,少了一个右括号,如下:

    print(tplt.format({"序号", "价格", "商品名称"})

    还有:这一行的单引号也有问题:

    start_url =’https: // s.taobao.com / search?q‘ + goods  # 连接
    已采纳该答案
    打赏 评论

相关推荐 更多相似问题