Thanks_21 2019-12-19 08:37 采纳率: 66.7%
浏览 184

救救孩子吧,用requests+re爬取彩虹岛主页信息

我刚学几天python,我也不会啊,
求源代码
例文图片说明图片说明

import requests
import re
url = 'http://tmall.chd.sdo.com/'
res= requests.get(url)
lt=re.findall('

(.*?)

',res.text,re.S)
print(lt)
  • 写回答

2条回答

  • 7*24 工作者 2019-12-19 09:08
    关注

    爬取网页内容和简单,主要是看你想要里面的什么内容,然后通过xpath、bs4或者re去匹配即可

    #-*- coding:utf-8 -*-
    
    import requests
    headers = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.87 Safari/537.36"}
    url = 'http://tmall.chd.sdo.com/'
    res= requests.get(url,headers=headers)
    print(res.content.decode('utf-8'))
    
    评论

报告相同问题?

悬赏问题

  • ¥15 虚拟机打包apk出现错误
  • ¥30 最小化遗憾贪心算法上界
  • ¥15 用visual studi code完成html页面
  • ¥15 聚类分析或者python进行数据分析
  • ¥15 逻辑谓词和消解原理的运用
  • ¥15 三菱伺服电机按启动按钮有使能但不动作
  • ¥15 js,页面2返回页面1时定位进入的设备
  • ¥50 导入文件到网吧的电脑并且在重启之后不会被恢复
  • ¥15 (希望可以解决问题)ma和mb文件无法正常打开,打开后是空白,但是有正常内存占用,但可以在打开Maya应用程序后打开场景ma和mb格式。
  • ¥20 ML307A在使用AT命令连接EMQX平台的MQTT时被拒绝