小范快跑 2021-09-17 21:21 采纳率: 100%
浏览 57
已结题

Python爬虫 这里的第一个<i>标签为什么用Find_all查找不到,自动跳过了啊


html='''
 <dd>
                        <i class="board-index board-index-1">1</i>     #为什么这里的i标签回被find_all直接跳过?
    <a href="/films/1200486" title="我不是药神" class="image-link" data-act="boarditem-click" data-val="{movieId:1200486}">
      <img src="//s3plus.meituan.net/v1/mss_e2821d7f0cfe4ac1bf9202ecf9590e67/cdn-prod/file:5788b470/image/loading_2.e3d934bf.png" alt="" class="poster-default" />
      <img data-src="https://p0.meituan.net/movie/414176cfa3fea8bed9b579e9f42766b9686649.jpg@160w_220h_1e_1c" alt="我不是药神" class="board-img" />
    </a>
    <div class="board-item-main">
      <div class="board-item-content">
              <div class="movie-item-info">
        <p class="name"><a href="/films/1200486" title="我不是药神" data-act="boarditem-click" data-val="{movieId:1200486}">我不是药神</a></p>
        <p class="star">
                主演:徐峥,周一围,王传君
        </p>
<p class="releasetime">上映时间:2018-07-05</p>    </div>
    <div class="movie-item-number score-num">
<p class="score"><i class="integer">9.</i><i class="fraction">6</i></p>
    </div>

      </div>
    </div>

                </dd>
'''


soup=BeautifulSoup(html,"html.parser")
for tag in soup.find('dd').children:
    if isinstance(tag,bs4.element.Tag):
        rank=tag.find_all('i')

print(rank)

结果:[<i class="integer">9.</i>, <i class="fraction">6</i>]

  • 写回答

2条回答 默认 最新

  • CSDN专家-showbo 2021-09-17 21:55
    关注

    第一个i是dd的子元素,遍历的时候tag就包含i。i再找i,html结构中并没有i嵌入i的结构,所以无法找到。直接获取dd节点find_all下面的i节点就行
    有帮助麻烦点个采纳【本回答右上角】,谢谢~~

    img

    
    soup=BeautifulSoup(html,"html.parser")
    rank=soup.find('dd').find_all('i')
    
    print(rank)
    
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 系统已结题 9月25日
  • 已采纳回答 9月17日
  • 创建了问题 9月17日

悬赏问题

  • ¥50 寻找一位有逆向游戏盾sdk 应用程序经验的技术
  • ¥15 请问有用MZmine处理 “Waters SYNAPT G2-Si QTOF质谱仪在MSE模式下采集的非靶向数据” 的分析教程吗
  • ¥50 opencv4nodejs 如何安装
  • ¥15 adb push异常 adb: error: 1409-byte write failed: Invalid argument
  • ¥15 nginx反向代理获取ip,java获取真实ip
  • ¥15 eda:门禁系统设计
  • ¥50 如何使用js去调用vscode-js-debugger的方法去调试网页
  • ¥15 376.1电表主站通信协议下发指令全被否认问题
  • ¥15 物体双站RCS和其组成阵列后的双站RCS关系验证
  • ¥15 复杂网络,变滞后传递熵,FDA