soup方法怎样获取html中的指定节点？

今天在爬清华大学镜像站，用了soup.find_all方法后发现只能选一个节点，比如有好几个meta，charset，name，但想在meta中打印‘content’分支。求各位指点！（附网页源码：view-source: 404 | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror 您访问的资源未能找到 | 404 | 清华大学开源软件镜像站，致力于为国内和校内用户提供高质量的开源软件镜像、Linux 镜像源服务，帮助用户更方便地获取开源软件。本镜像站由清华大学 TUNA 协会负责运行维护。 https://mirrors.tuna.tsinghua.edu.cn/%EF%BC%89

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

CSDN专家-showbo 2021-08-23 13:55

关注

测试了可以正常获取没问题呢。。有帮助麻烦点个采纳【本回答右上角】，谢谢~~

import requests
from bs4 import BeautifulSoup
URL = 'https://mirrors.tuna.tsinghua.edu.cn'
head = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/92.0.4515.159 Safari/537.36 Edg/92.0.902.78'
}
html = requests.get(url=URL, headers=head)
html.encoding = 'utf-8'
page = BeautifulSoup(html.text, 'html.parser')
metas = page.find_all('meta')
for meta in metas:
    print('name:%s\tproperty:%s\tcontent:%s'%(meta.attrs.get('name'),meta.attrs.get('property'),meta.attrs.get('content')))

本回答被题主选为最佳回答 , 对您是否有帮助呢?

查看更多回答(1条)

报告相同问题？

关注问题

soup方法怎样获取html中的指定节点？ python
2021-08-23 12:31

回答 2 已采纳测试了可以正常获取没问题呢。。有帮助麻烦点个采纳【本回答右上角】，谢谢~~ import requests from bs4 import BeautifulSoup URL = 'https://m
python爬虫的节点选择器无效 python
2021-07-25 16:34

回答 3 已采纳改下定位操作就行了。 ```python import re import requests from bs4 import BeautifulSoup for page in range(0,1
Python爬虫配合VPN爬取出现报错 python 爬虫
2021-12-22 17:33

回答 1 已采纳你这个是VPN代理问题，你可以将VPN设置成部分代理，不要全部代理你的网络。
python打开网址获取html_Python读取网页并获取某节点
2020-12-05 02:39

weixin_39932762的博客环境：python3.5.1Beautiful SoupBeautiful Soup是python的一个库，主要用于从网页抓取数据。Beautiful Soup自动将输入文档转换为Unicode编码，输出文档转换为utf-8编码。你不需要考虑编码方式，除非文档没有指定一...
Python的BeautifulSoup的select解释 python
2021-06-30 14:11

回答 2 已采纳这里的意思应该是选择某一个无序列表“li”下的所有a元素节点 data = soup.select('html>body>div.class.wrap clearfix>div.id
python爬虫没有结果返回 python 爬虫
2023-03-10 15:16

回答 4 已采纳 import requests from lxml import etree import pandas as pd url = 'https://www.jjwxc.net/topten.php
python爬取的数据怎么保存成json格式？能提供完整代码吗》我太笨了，一直搞不好 python
2020-11-26 15:45

回答 1 已采纳 def main(): dict1 = {} # 调用自定义函数，获取所有城市列表 city_list=get_all_cities() for city in ci
Python Beautiful Soup教程-节点选择器之关联选择的方法
2021-11-18 21:32

一行书辞的博客 Beautiful Soup教程-节点选择器之选择元素的方法 Beautiful Soup教程-节点选择器之提取信息的方法 Beautiful Soup教程-节点选择器之嵌套选择的方法文章目录系列文章目录前言节点选择器——关联选择的方法1. 关联...
Python网络爬虫如何跳过"This request has no response data aviliable"的网页 json python
2022-04-17 18:27

回答 1 已采纳在你出错的地方加个try，except，如果错误了直接return，
新手python爬虫出来是404，User-Agent写上了 python 有问必答
2021-04-11 23:30

回答 3 已采纳你的这个baseurl 我用浏览器去访问都是404 更别说是爬虫了
关于#BeautifulSoup#的.text的问题，请问如何解决？ python 爬虫
2022-08-11 16:59

回答 1 已采纳 soup.select("#main>#main_left>.book-mulu a")返回的是一个列表, 要加[0]访问列表的第一元素的.text另外.book-mulu 不是#main
Python爬虫编程思想（53）：使用Beautiful Soup选择父节点
2021-10-12 13:40

蒙娜丽宁的博客如果要选取某个节点的直接父节点，需要使用parent属性，如果要选取某个节点的所有父节点，需要使用parents属性。parent属性返回当前节点的父节点的Tag对象，而parents属性会返回一个可迭代对象，通过for循环可以对该...
能否把自定义的字典键值对写入图片exif详细信息中 python
2021-02-08 16:47

回答 6 已采纳这个是不行的只能改默认字段或者加到备注里
python获取html标签内容_python+BeautifulSoup获取html中标签的文本
2020-12-29 07:15

王信文的博客前言：由于正则的难以使用，所以我引用了python中的Beautiful Soup解析库可以解析html以及xml那么接下来我就通过一个小例子来让大家感受它的强大之处首先导入Beautiful Soup库from bs4 import BeautifulSoupsoup= ...
Python爬虫编程思想（54）：使用Beautiful Soup选择兄弟节点
2021-10-16 12:35

蒙娜丽宁的博客除了子节点和父节点外，还有同级节点，也称为兄弟节点。可以通过next_sibling属性获得当前节点的下一个兄弟节点，通过previous_sibling属性获得当前节点的上一个兄弟节点。通过next_siblings属性获得当前节点后面...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月31日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月23日

悬赏问题

¥100 set_link_state
¥15 虚幻5 UE美术毛发渲染
¥15 CVRP 图论物流运输优化
¥15 Tableau online 嵌入ppt失败
¥100 支付宝网页转账系统不识别账号
¥15 基于单片机的靶位控制系统
¥15 真我手机蓝牙传输进度消息被关闭了，怎么打开？(关键词-消息通知)
¥15 装 pytorch 的时候出了好多问题，遇到这种情况怎么处理？
¥20 IOS游览器某宝手机网页版自动立即购买JavaScript脚本
¥15 手机接入宽带网线，如何释放宽带全部速度

soup方法怎样获取html中的指定节点？

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新