Botttt 2022-04-11 10:25 采纳率: 33.3%
浏览 29
已结题

关于网页链接参数的问题

def get_param(self):
        # 将中文关键词转换为符合规则的编码
        keyword = urllib.parse.quote(self.keyword)
        params = []
        # 为爬取的每页链接定制参数
        for i in range(1, self.paginator + 1):
            params.append(
                'tn=resultjson_com&ipn=rj&ct=201326592&is=&\
                fp=result&queryWord={}&cl=2&lm=-1&ie=utf-8&o\
                e=utf-8&adpicid=&st=-1&z=&ic=&hd=1&latest=0&\
                copyright=0&word={}&s=&se=&tab=&width=&height\
                =&face=0&istype=2&qc=&nc=1&fr=&expermode=&for\
                ce=&cg=star&pn={}&rn=30&gsm=78&1557125391211\
                ='.format(keyword, keyword, 30 * i))
        return params   # 返回链接参数

params.append后面的那一串字符代表什么意思啊,或者是需要从哪里学习相关的知识,能否给我提供一个学习的方向,或者是网页连接,谢谢!

  • 写回答

2条回答 默认 最新

  • 三喂树屋 2022-04-11 10:35
    关注

    这个参数是你发出get请求时,api需要的参数,你这个是网页爬虫,你在浏览器上请求一下该页面就能看出来,例如我用bing搜索

    img

    对应的url如图,其中你如果想改搜索内容,只需要改 q=参数这部分,而后面的一大串都不需要管,照抄就行。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 4月22日
  • 已采纳回答 4月14日
  • 创建了问题 4月11日

悬赏问题

  • ¥15 docker实践项目
  • ¥15 数电几道习题,写出作答过程,ai一律不采用
  • ¥15 利用pthon计算薄膜结构的光导纳
  • ¥15 海康hlss视频流怎么播放
  • ¥15 Paddleocr:out of memory error on GPU
  • ¥30 51单片机C语言数码管驱动单片机为AT89C52
  • ¥100 只改动本课件的 cal_portfolio_weight_series(decision_date), 跑完本课件。设计一个信息比率尽量高的策略。
  • ¥20 如何在visual studio 2022中添加ImageMagick库
  • ¥50 如何实现uniapp编译的微信小程序做可回溯视频
  • ¥15 stm32用5个IO口接16个矩阵按键怎么设计PCB原理图啊