爬虫如何在url中加入变量？


import requests
import re
import csv

a = input()

url = "f'https://movie.douban.com/top250?start={a}&filter="
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36 Edg/92.0.902.67"
}
resp = requests.get(url, headers=headers)
page_content = resp.text

obj = re.compile(r'<li>.*?<span class="title">(?P<name>.*?)</span>.*?<br>(?P<year>.*?)&nbsp;/&nbsp;.*?'
                 r'<span class="rating_num" property="v:average">(?P<score>.*?)</span>.*?<span>(?P<number>.*?)</span>', re.S)
result = obj.finditer(page_content)
f = open("data.csv",mode="w",encoding="utf-8",newline="")
csvwriter = csv.writer(f)
for it in result:
    #print(it.group('name'))
    #print(it.group('year').strip()) #删除开头或是结尾的字符（默认为空格或换行符）
    #print(it.group('score'))
    #print(it.group('number'))
    dic = it.groupdict()
    dic['year'] = dic['year'].strip()
    csvwriter.writerow(dic.values())
f.close()
print("Over!")

其中url部分url = "f' 豆瓣电影 Top 250 https://movie.douban.com/top250?start=%7Ba%7D&filter=%22%E4%B8%BA%E4%BB%80%E4%B9%88%E7%BC%96%E8%AF%91%E9%94%99%E8%AF%AF%EF%BC%8C%E4%B8%8D%E8%83%BD%E6%9B%B4%E6%94%B9a%E7%9A%84%E5%80%BC%EF%BC%9F

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
张大帅哥_ 2021-08-14 09:49
关注
f 在字符串外面

a = input() url = f'https://movie.douban.com/top250?start={a}&filter='

或者

a = 'abc' b = 'efg' c = 'jkl' url = '{f}d{s}hi{t}'.format(f=a, s=b, t=c) # 带关键字 url = '{}d{}hi{}'.format(a, b, c) # 按顺序格式化 url = '{0}d{2}hi{1}'.format(a, c, b) # 传入参数的索引

如果有用请点击采纳谢谢！
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 5
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

爬虫如何在url中加入变量？ python 爬虫
2021-08-14 09:34

回答 4 已采纳 f 在字符串外面 a = input() url = f'https://movie.douban.com/top250?start={a}&filter=' 或者 a = 'abc' b = '
Python爬虫# 将url携带的参数写成循环代入，如何将每次不同参数爬取到的结果依次保存到同一张excel python 有问必答爬虫
2022-01-30 21:37

回答 2 已采纳你题目的解答代码如下： import requests from lxml import etree import xlwt urls = ('9787501586387', '9787501586
python爬虫检索超出范围报错 python 爬虫
2022-09-08 16:31

回答 3 已采纳你输出con，输出的con是空列表，说明你节点的定位是有问题的，直接去开发者面板复制定位路径
零基础写python爬虫之爬虫的定义及URL构成
2020-12-23 23:48

从网站某一个页面（通常是首页）开始，读取网页的内容，找到在网页中的其它链接地址，然后通过这些链接地址寻找下一个网页，这样一直循环下去，直到把这个网站所有的网页都抓取完为止。如果把整个互联网当成一个...
python爬虫疑问 python 爬虫
2022-09-28 20:27

回答 1 已采纳因为有的url 比如https://wx3.sinaimg.cn/large/005tGGVqgy1h6hjo33dy1j323i72qb2e.jpg 后面多了一个空格，把空格去掉就行了，解决问题的话
Python爬虫获取经纬度 python
2022-12-24 18:48

回答 1 已采纳从你提供的代码来看，首先爬取的页面是从上海的充电桩的信息，然后用 pyquery 来解析页面，得到了一个包含了所有充电桩信息的 items 列表。在循环中，解析了每个充电桩的名称和位置，并将它们分别放
Python selenium的爬虫无法完整爬取整个页面的内容 python selenium 爬虫
2021-10-24 09:44

回答 1 已采纳爬取内容不完整，应该是文档的更多内容，要往下滑动页面才会出现这个不太清楚，应该不是什么反爬，就是类似于中途给你弹出个广告，要具体分析怎么弄VIP内容肯定是需要你的账号是VIP才能看得到的，与selen
Python 万能代码模版：爬虫代码篇
2021-09-14 15:27

AI悦创|编程1v1的博客但今天的 Python 课程是个例外，因为今天讲的 **Python 技能，不需要你懂计算机原理，也不需要你理解复杂的编程模式。**即使是非开发人员，只要替换链接、文件，就可以轻松完成。并且这些几个实用技巧，简直是 ...
python爬虫爬到331页无法继续 python
2023-03-13 12:46

回答 4 已采纳当前页提取列表数据超出索引，这也不是什么报错，当你列表里面没东西或者索引值超过了列表元素的时候就会出现这个问题，就是你爬到的这页，抓取的这个列表值，里面没东西或者东西太少。所以报错了。建议你换个网站爬
如何hook一个url中的参数 fiddler javascript python
2022-06-12 22:37

回答 1 已采纳嗯推荐你不要用 Object.defineProperty 去抓，因为代码不全，requesturl 你是如何设置的现在没有看到？如果debugger没进去的话不排除是没有触发成功 1：页面发请求
关于#python#的问题：我想知道这段python爬虫代码有什么问题，为什么爬取不到我想要的信息呀代码如下： python 开发语言爬虫
2023-02-16 10:59

回答 3 已采纳。。我试了一下，确实在构造infos时，XPATH没问题，但是infos没有值这里看到protected Attributes 了吗，说明哔哩哔哩还是有反爬机制的。百度一下~https://ask
python的for循环语句赋值给url_For循环在Python中通过URL传递变量
2020-12-03 04:31

weixin_39836751的博客在我已经成功地一次获取了一个页面的数据，但是我还不能想出如何在代码中添加一个循环来一次抓取多个页面(或者多个位置/年份/会议)。在我在这个网站和其他网站上搜索了相当数量的内容，但我似乎找不到正确的答案。在...
Python网络爬虫如何跳过"This request has no response data aviliable"的网页 json python
2022-04-17 18:27

回答 1 已采纳在你出错的地方加个try，except，如果错误了直接return，
python爬取js script中的变量_爬虫scrapy采集js里面的变量内容
2020-12-05 23:19

weixin_39932330的博客 links = response.xpath(‘//a[@class=”video_img”]/@href’).extract() print ‘hello’ print links,response items = [] for url in links: item = BchItem() res = requests.get(‘xxx’ + url) #print res,’...
Python如何正确解决爬虫过程中的Cookie失效问题？
2023-07-26 10:03

写python的鑫哥的博客在python爬虫项目中，Cookie是一种用于在客户端和服务器之间传递信息的技术。在爬取某些网站的时候，可能会需要登录才能正常获取到数据，这个时候就需要用到cookie来解决。通常情况下，需要将cookie添加到请求头中，...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月14日

悬赏问题

¥15 装 pytorch 的时候出了好多问题，遇到这种情况怎么处理？
¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
¥15 手机接入宽带网线，如何释放宽带全部速度
¥30 关于#r语言#的问题：如何对R语言中mfgarch包中构建的garch-midas模型进行样本内长期波动率预测和样本外长期波动率预测
¥15 ETLCloud 处理json多层级问题
¥15 matlab中使用gurobi时报错
¥15 这个主板怎么能扩出一两个sata口
¥15 不是，这到底错哪儿了😭
¥15 2020长安杯与连接网探
¥15 关于#matlab#的问题：在模糊控制器中选出线路信息，在simulink中根据线路信息生成速度时间目标曲线（初速度为20m/s，15秒后减为0的速度时间图像）我想问线路信息是什么

爬虫如何在url中加入变量？

4条回答 默认 最新

问题事件

悬赏问题

4条回答默认最新