weixin_44653958 2021-09-24 10:26 采纳率: 66.7%
浏览 44
已结题

python selenium 获取链接href失败

        try:
            fri_arr = driver.find_elements_by_xpath(
                '//*[@class="cmmts j-flag"]//*[@class="itm"]')
        except:
           print(sys._getframe().f_lineno, sys.exc_info())
        for fri in fri_arr:
            url = fri.find_element_by_xpath('//*[@class="head"]/a').get_attribute("href")

fri_arr获取正常,获取的url始终是第一个fri的,不论fri怎么改变url都不变

  • 写回答

1条回答 默认 最新

  • 江天暮雪丨 2021-09-24 11:54
    关注

    不太清楚你的页面结构,我举个例子:
    现在我尝试抓取每个 li 中的 a 标签的 href 值

    <ul id="ul">
      <li class="li">
        <a href="123"></a>
      </li>
      <li class="li">
        <a href="456"></a>
      </li>
    </ul>
    

    应该是这样的

    lis = driver.find_elements_by_xpath('//*[@class="li"]')
    for li in lis:
        href = li.find_element_by_xpath('./a').get_attribute('href')
        print(href)
    

    其中第二个 Xpath 表达式的 "." 代表选取当前 li 元素下的 a 标签。在你的代码中没有用到 ”.“ 去选取当前元素下的 a 标签,因此每次获取到的都是第一个 a 标签的href

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 10月2日
  • 已采纳回答 9月24日
  • 创建了问题 9月24日

悬赏问题

  • ¥15 单片机配网,继电器开关,广播
  • ¥60 Qcustomplot绘制实时动态曲线
  • ¥20 运用matlab画x-y图
  • ¥15 用idea运行项目,运行tomcat报错:断言失败
  • ¥15 Sqlserver查询链接服务器数据问题
  • ¥15 Bibtex4Word 引用中文文献
  • ¥20 用opencv c/c++ 转换成灰度图,然后做一下直方图均衡,输出mp4文件
  • ¥20 matlab中的双层数值积分
  • ¥50 服务器打印水晶报表问题
  • ¥30 gradle环境下javafx项目如何使用druid连接池