爬虫如何在url中加入变量？


import requests
import re
import csv

a = input()

url = "f'https://movie.douban.com/top250?start={a}&filter="
headers = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.131 Safari/537.36 Edg/92.0.902.67"
}
resp = requests.get(url, headers=headers)
page_content = resp.text

obj = re.compile(r'<li>.*?<span class="title">(?P<name>.*?)</span>.*?<br>(?P<year>.*?)&nbsp;/&nbsp;.*?'
                 r'<span class="rating_num" property="v:average">(?P<score>.*?)</span>.*?<span>(?P<number>.*?)</span>', re.S)
result = obj.finditer(page_content)
f = open("data.csv",mode="w",encoding="utf-8",newline="")
csvwriter = csv.writer(f)
for it in result:
    #print(it.group('name'))
    #print(it.group('year').strip()) #删除开头或是结尾的字符（默认为空格或换行符）
    #print(it.group('score'))
    #print(it.group('number'))
    dic = it.groupdict()
    dic['year'] = dic['year'].strip()
    csvwriter.writerow(dic.values())
f.close()
print("Over!")

其中url部分url = "f' 豆瓣电影 Top 250 https://movie.douban.com/top250?start=%7Ba%7D&filter=%22%E4%B8%BA%E4%BB%80%E4%B9%88%E7%BC%96%E8%AF%91%E9%94%99%E8%AF%AF%EF%BC%8C%E4%B8%8D%E8%83%BD%E6%9B%B4%E6%94%B9a%E7%9A%84%E5%80%BC%EF%BC%9F

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
张大帅哥_ 2021-08-14 09:49
关注
f 在字符串外面

a = input() url = f'https://movie.douban.com/top250?start={a}&filter='

或者

a = 'abc' b = 'efg' c = 'jkl' url = '{f}d{s}hi{t}'.format(f=a, s=b, t=c) # 带关键字 url = '{}d{}hi{}'.format(a, b, c) # 按顺序格式化 url = '{0}d{2}hi{1}'.format(a, c, b) # 传入参数的索引

如果有用请点击采纳谢谢！
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 5
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

Python爬虫示例模板
2023-06-29 02:28

你需要将 url 变量替换为你要爬取的网页的 URL。最后，使用 if __name__ == '__main__': 来判断该文件是否作为独立脚本运行，以启动爬虫。请注意，爬取网页数据时需要遵守网站的相关规定和法律法规，尊重网站的...
python爬虫-09-线程之间共享全局变量.ev4.rar
2024-04-06 15:46

在这个"python爬虫-09-线程之间共享全局变量"的主题中，我们将深入探讨Python如何在多线程环境下管理全局变量，以及在爬虫应用中如何利用这一特性来优化性能。首先，让我们理解什么是全局变量。全局变量是在函数或...
爬虫可以做什么？Python爬虫入门必看保姆级教程！（学习资源+学习路线）
2024-08-26 13:41

豆本-豆豆奶的博客 Python爬虫，也称为Python网络爬虫或网页蜘蛛，是一种使用Python编程语言编写的程序，用于自动地抓取互联网上的信息。这种程序按照预设的规则，模拟浏览器请求站点的行为，从网站上抓取数据并进行分析提取。Python...
python爬虫详细教程.pdf
2024-11-23 17:24

在Python爬虫入门中，首先介绍了Urllib库的基本使用。Urllib是Python的一个标准库，专门用于处理URL的请求和响应，是实现网络请求最基础的模块之一。教程中提到，使用Urllib可以分分钟扒下网页内容，从而开始分析和...
python爬虫详解
2021-07-11 21:56

穆瑾轩的博客 python爬虫简介 1、基本概念 1.1、什么是爬虫网络爬虫，是一种按照一定规则，自动抓取互联网信息的程序或者脚本。另外一些不常使用的名字还有蚂蚁、自动索引、模拟程序或者蠕虫。随着网络的迅速发展，万维网...
patyon爬虫技术PDF课件_爬虫_python_
2021-09-30 00:58

4. **04python内置容器.pdf** - 讲解Python中的内置数据结构，如列表、元组、字典和集合，它们的特点、操作方法以及在爬虫中的应用，比如列表用于存储爬取的数据，字典用于解析HTML时建立键值对。 5. **05并行开发....
Python 万能代码模版：爬虫代码篇
2021-09-14 15:27

AI悦创Python一对一辅导的博客但今天的 Python 课程是个例外，因为今天讲的 **Python 技能，不需要你懂计算机原理，也不需要你理解复杂的编程模式。**即使是非开发人员，只要替换链接、文件，就可以轻松完成。并且这些几个实用技巧，简直是 ...
python爬取js script中的变量_爬虫scrapy采集js里面的变量内容
2020-12-05 23:19

weixin_39932330的博客 links = response.xpath(‘//a[@class=”video_img”]/@href’).extract() print ‘hello’ print links,response items = [] for url in links: item = BchItem() res = requests.get(‘xxx’ + url) #print res,’...
Python爬虫Spider基础保姆级教程
2023-11-17 16:27

安装过程应确保勾选"Add Python 3.x to PATH"选项，以自动配置环境变量，使得Python命令可以在终端中直接使用。 2. **环境变量配置**：如果安装时未勾选上述选项，需手动配置环境变量。这包括在系统的Path变量中...
Python爬虫项目之爬取校花图片.zip
2024-05-30 05:58

在本项目中，我们将深入探讨如何使用Python进行网络爬虫，特别是针对图片的抓取。Python作为一门功能强大的编程语言，因其简洁易读的语法和丰富的第三方库，成为了爬虫开发者的首选工具。在这个名为“Python爬虫项目...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月22日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月14日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月14日

爬虫如何在url中加入变量？

4条回答 默认 最新

问题事件

4条回答默认最新