哪里错了，为什么抓不出url?


from selenium import webdriver
from lxml import etree
from bs4 import BeautifulSoup
import time
import pandas as pd

urls = ["https://solana.com/ecosystem"]

wd = webdriver.Chrome()
wd.get(urls[0])

time.sleep(30)

resp =wd.page_source
html = BeautifulSoup(resp,"lxml")
temp = html.find_all("div", class_="link-unstyled d-inline-block")
urls=[]
for i in temp:
    url = i['href']
    print(url)
    urls.append(url)
print(urls)

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

2条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
江天暮雪丨 2021-08-16 17:45
关注
首先你这个网站似乎是需要开国外代理才能访问到的，然后我查了一下，class_="link-unstyled d-inline-block" 有这个样式的是a标签而不是div。
因此，应该是

temp = html.find_all("a", class_="link-unstyled d-inline-block")
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(1条)

报告相同问题？

关注问题

哪里错了，为什么抓不出url? python
2021-08-16 17:14

回答 2 已采纳首先你这个网站似乎是需要开国外代理才能访问到的，然后我查了一下，class_="link-unstyled d-inline-block" 有这个样式的是a标签而不是div。因此，应该是 temp
python发送post请求，参数填完了加载不出网页是为什么 python 爬虫
2022-01-29 11:49

回答 4 已采纳你把那个请求头全部加上试试就可以了。 import requests import demjson url = 'https://www.xyhn.gov.cn/creditdatas/cms/ge
写完python爬虫后运行不出结果 python 有问必答爬虫
2022-02-15 05:15

回答 3 已采纳数据是动态从接口获取的，在网页中没有办法直接获取，除非用 selenium模块结合浏览器爬取动态数据 # -*- coding:utf-8 -*- import pandas as pd impor
python运行不出结果_python执行完生成不出报告？
2020-11-20 18:08

weixin_39874589的博客 driver = Driver(self) self.driver = driver.choose_browser() self.driver.get(Config().get('URL')) time.sleep(5) deftest_01(self): login_go(self.driver).login('cheb','cheng') time.sleep(3) try: self....
为什么python代码正确，但是打印不出来值呢 python
2021-07-30 20:21

回答 1 已采纳你自己看网站，它网站最高温就是-
python爬虫代码运行不报错，但是保存到CSV的数据为空，是哪里出了问题 python
2022-08-09 16:38

回答 8 已采纳 respone.text获取的json数据格式有问题,用 json.loads(respone.text)解析出错另外写csv文件的代码要放到for循环外面,所有数据获取之后再一起写入 cit
怎么用python手动输入验证码登录呢？以及data里面传什么参数？ python
2021-08-02 16:29

回答 2 已采纳 if first_response == 200:不是响应==200，是响应状态吗==200所以是if first_response.status_code == 200:
python为什么不出微服务框架_面试官几个 Dubbo 微服务框架问题，把我整懵了?
2020-12-01 18:38

weixin_39709194的博客 provider收到请求后对数据进行反序列化，然后通过代理调用具体的接口实现为什么要通过代理对象通信？主要是为了实现接口的透明代理，封装调用细节，让用户可以像调用本地方法一样调用远程方法，同时还可以通过代理...
django写的前端页面显示不出数据库的信息？ django mysql pycharm 有问必答
2021-05-18 17:18

回答 2 已采纳你在视图里面print(goods ）看看数据
为什么爬虫无法爬取信息 python 有问必答爬虫
2022-03-25 00:17

回答 2 已采纳你的代码有问题把，你苹果13 也不应该出的来结果啊。good 后面怎么.driver ？ msg 不带text 能看到明文？
python爬虫移动端评论，浏览器能打开url，但request.get返回内容404，已加header。 python 爬虫
2018-10-12 07:11

回答 1 已采纳 405错误是请求方法不被允许，404错误是客户端在浏览网页时，服务器无法正常提供信息，或是服务器无法回应，所以正确是https； 1.直接在浏览器链接打开的xml是不是你需要爬的内容？？ 2.
为什么python不报错不出结果_python将进程池放在装饰器里为什么不生效也没报错...
2020-11-25 12:04

weixin_39837867的博客我想把进程池封装在装饰器里，但是它既没生效也没报错# coding:utf-8import multiprocessingimport tornadofrom tornado.httpclient import AsyncHTTPClientprocess_num = 20 # 进程数url = ...
python 爬取表格获取不到数据 python
2020-02-17 22:52

回答 4 已采纳爬取需要在请求头里面添加Host，要不然爬取不到任何信息，另外源码是不规则的html代码，所以需要指定html解析器 ``` # -*- coding：utf-8 -*- import os
求教：为什么爬虫的程序没报错，却在文档里输不出东西？
2020-08-03 02:09

Black tuxedo的博客求教：为什么爬虫的程序没报错，却在文档里输不出东西？ import requests from bs4 import BeautifulSoup import traceback import re def get_HTML_text(url): “获取网页的源码” try: kv ={‘user_agent’ : ...
python打不出中文_Python输入中文的问题
2020-12-08 11:21

weixin_39571749的博客我写了一个爬乌云漏洞库的爬虫，其URL形式为http://www.wooyun.org/corps/公司名称/page/1，程序最后raw_input处输入公司名称即可跑出该公司的漏洞。现在的问题是中文编码的问题没解决好，如果公司的名称是英文如...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 8月31日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 8月23日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 8月16日

悬赏问题

¥15 公交车和无人机协同运输
¥15 stm32代码移植没反应
¥15 matlab基于pde算法图像修复，为什么只能对示例图像有效
¥100 连续两帧图像高速减法
¥15 组策略中的计算机配置策略无法下发
¥15 如何绘制动力学系统的相图
¥15 对接wps接口实现获取元数据
¥20 给自己本科IT专业毕业的妹m找个实习工作
¥15 用友U8：向一个无法连接的网络尝试了一个套接字操作，如何解决？
¥30 我的代码按理说完成了模型的搭建、训练、验证测试等工作(标签-网络|关键词-变化检测)

哪里错了，为什么抓不出url?

2条回答 默认 最新

问题事件

悬赏问题

2条回答默认最新