救救孩子吧，用requests+re爬取彩虹岛主页信息

我刚学几天python，我也不会啊，
求源代码
例文

import requests
import re
url = 'http://tmall.chd.sdo.com/'
res= requests.get(url)
lt=re.findall('

(.*?)

',res.text,re.S)
print(lt)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

2条回答

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
7*24 工作者 2019-12-19 09:08
关注
爬取网页内容和简单，主要是看你想要里面的什么内容，然后通过xpath、bs4或者re去匹配即可

#-*- coding:utf-8 -*- import requests headers = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.87 Safari/537.36"} url = 'http://tmall.chd.sdo.com/' res= requests.get(url,headers=headers) print(res.content.decode('utf-8'))
解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

救救孩子吧，用requests+re爬取彩虹岛主页信息
2019-12-18 09:16

回答 2 已采纳帮你把主页里面游戏名字爬出来了 ``` import requests import re url = 'http://tmall.chd.sdo.com/' res= requests
如何用Python3爬取百度百科(最好lxml+requests，当然别的也行）？ python
2021-04-28 20:55

回答 1 已采纳基本问题，爬数的时候，模拟一下头文件浏览器打开 headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWe
Python requests.post方法爬取携程酒店获取不到数据 python
2021-07-28 11:42

回答 3 已采纳我猜请求头里面一定有数据是动态变化的，并且要做验证，你得知道它是如何加密的那些数据~
基于requests+mysql爬取猫眼热门电影数据做可视化分析
2024-01-13 15:02

本期内容：基于requests+mysql爬取猫眼热门电影数据做可视化分析实验需求 - anaconda丨pycharm - python3.11.4 - requests - mysql 实验描述学习网络爬虫相关技术，熟悉爬虫基本库requests的使用；学习数据库...
Python爬虫 requests.post爬取json内容失败 ajax html5 json python
2020-12-25 10:40

回答 3 已采纳 res = requests.post(url,headers=headers,json=payload)
scrapy框架+formdata+ajax爬取及翻页问题 python 数据挖掘测试用例
2020-03-25 14:18

回答 1 已采纳 def parse(self, response): result = eval(response.body.decode('utf-8')) 兄弟，你打印一下resu
python使用requests get爬取网页失败 python 有问必答
2021-04-17 17:26

回答 4 已采纳 https://www.baidu.com/s 改成 http://www.baidu.com/s
Python Requests_html爬取51jobs网python岗位信息.py
2020-04-19 10:43

Python，通过Reauests_html库，爬取51jobs网站python岗位招聘信息，实例代码。
如何使用python爬取canvas中的内容呢？ css javascript python
2022-04-29 10:30

回答 1 已采纳需要在浏览器上临时显示后端实时处理的图像，需要将图像数据转成json字符串传输给js绘图。后端python处理： import cv2 as cvfrom encodings import base
Python利用requests爬取网页遇到的payload问题 python 有问必答爬虫
2021-08-13 14:31

回答 5 已采纳网站多少
使用python requests爬取百度图片的时候报错，不知道是哪里的问题 python 有问必答
2021-09-14 08:08

回答 2 已采纳主要是因为tn参数（你的代码写成n了，少了t）没传，接口返回404的html了，而不是返回查询结果内容。更正参数名称为tn就可以了。做采集的时候参数名一定不能写错，还有一些请求头也需要加上，如user
[Python] requests + lxml爬取网页图片
2022-03-10 16:59

@ chen的博客 python使用requests库和lxml库爬取网页图片
python爬取二手房信息的问题 python
2023-03-26 10:47

回答 3 已采纳根据您提供的代码和报错信息，问题出现在 title=li.xpath('./div/div[2]/div[1]/div/a/text()')[0] 这一行，数组越界了。这可能是由于某些 li 标签没有
requests+BeautifulSoup4+MongoDB 爬取51job招聘信息
2020-08-26 18:34

【Python爬虫】通过requests+BeautifulSoup4+MongoDB 爬取51job招聘信息（最新）
Requests+re爬虫框架爬取教务系统课程信息
2020-12-21 17:46

爬取教务系统课程数据 requests+re爬虫和解析框架，注意是这个教务系统类型效果图如下#### 直接上源码，注意自己看懂修改意义更大，同时用户名和密码我遮盖掉了下面展示源码（全原创）其中正则表达式部分有小错误...
没有解决我的问题, 去提问

悬赏问题

¥15 虚拟机打包apk出现错误
¥30 最小化遗憾贪心算法上界
¥15 用visual studi code完成html页面
¥15 聚类分析或者python进行数据分析
¥15 逻辑谓词和消解原理的运用
¥15 三菱伺服电机按启动按钮有使能但不动作
¥15 js，页面2返回页面1时定位进入的设备
¥50 导入文件到网吧的电脑并且在重启之后不会被恢复
¥15 （希望可以解决问题）ma和mb文件无法正常打开，打开后是空白，但是有正常内存占用，但可以在打开Maya应用程序后打开场景ma和mb格式。
¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝