汐ya~ 2022-03-20 16:01 采纳率: 87.8%
浏览 66
已结题

Python,爬虫 HTML代码不理解

请问这几行怎么理解呀,那个a标签怎么只有数字里面,爬虫的时候改怎么去搜索这个位置呀
网页上点击这个2会跳转下一页

img

  • 写回答

2条回答 默认 最新

  • 愿此后再无WA Python领域新星创作者 2022-03-20 16:15
    关注

    鼠标右击复制xpath路径即可。 那下一页的按钮应该是li节点

    //*[@id="content-box"]/ul/li[4]
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
  • stripe-python 2022-03-20 19:00
    关注

    使用beautifulsoup4

    from bs4 import BeautifulSoup as bs
    
    soup = bs(text, 'html.parser')   # text是网站的源代码
    li = soup.find('li', class_='把标签里的class复制下来')
    a = li.find('a')  # 这个就是a标签 
    
    评论
查看更多回答(1条)

报告相同问题?

问题事件

  • 已结题 (查看结题原因) 3月20日
  • 已采纳回答 3月20日
  • 修改了问题 3月20日
  • 修改了问题 3月20日
  • 展开全部

悬赏问题

  • ¥15 关于#硬件工程#的问题:我这边有个锁相环电路没有效果
  • ¥15 20款 27寸imac苹果一体机装win10后,蓝牙耳机和音响放歌曲卡顿断断续续.
  • ¥15 求解icon library .icl图标库文件
  • ¥15 VB.NET 父窗体调取子窗体报错
  • ¥15 python海龟作图如何改代码使其最后画出来的是一个镜像翻转的图形
  • ¥15 我不明白为什么c#微软的官方api浏览器为什么不支持函数说明的检索,有支持检索函数说明的工具吗?
  • ¥15 在我想检测ros是否成功安装时输入roscore出现以下
  • ¥30 老板让我做一个公司的投屏,实时显示日期,时间,安全生产的持续天数,完全没头绪啊
  • ¥15 Google Chrome 所有页面崩溃,三种解决方案都没有解决,我崩溃了
  • ¥20 使用uni-app发起网络请求,获取重定向302返回的cookie