from selenium import webdriver
from lxml import etree
from bs4 import BeautifulSoup
import time
import pandas as pd
urls = ["https://solana.com/ecosystem"]
wd = webdriver.Chrome()
wd.get(urls[0])
time.sleep(30)
resp =wd.page_source
html = BeautifulSoup(resp,"lxml")
temp = html.find_all("div", class_="link-unstyled d-inline-block")
urls=[]
for i in temp:
url = i['href']
print(url)
urls.append(url)
print(urls)

哪里错了,为什么抓不出url?
- 写回答
- 好问题 0 提建议
- 关注问题
- 邀请回答
-
2条回答 默认 最新
- 江天暮雪丨 2021-08-16 17:45关注
首先你这个网站似乎是需要开国外代理才能访问到的,然后我查了一下,class_="link-unstyled d-inline-block" 有这个样式的是a标签而不是div。
因此,应该是temp = html.find_all("a", class_="link-unstyled d-inline-block")
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报