童以默 2021-08-26 22:30 采纳率: 0%
浏览 38

python爬虫有关进行html页面分析的问题

最近在学习网络爬虫,想要爬取某个社区网站文章,可是在研究了很多的html网页的时候,发现貌似他们的网页结构都类似。就像下图中数字1,2,3所在区域,我用不同的颜色表示不同的区域。如下图:

img

我的问题是不知道这几个区域所表示的含义,比如说黄色部分,数字1表示的,这个区域用一个

容器包裹,好像所有的网页内容都在这里面,而且里面的结构我看很多的网站都相似,包括header,main,footer,这三个部分。
谁能够给我解释下为什么是这样的结构以及他们的含义,内部通常有什么?
还有剩下两个区域都是代表什么呢?

赐教。

  • 写回答

1条回答 默认 最新

  • 关注

    数字1和3区域都是div容器
    div容器中可以放任何内容,一般上边的是页面顶部的横幅图片和导航栏。下边的是页面主体正文内容。
    数字2区域是<script></script>标签,用于引入js代码、比如jquery库

    评论

报告相同问题?

问题事件

  • 创建了问题 8月26日

悬赏问题

  • ¥15 python怎么在已有视频文件后添加新帧
  • ¥20 虚幻UE引擎如何让多个同一个蓝图的NPC执行一样的动画,
  • ¥15 fluent里模拟降膜反应的UDF编写
  • ¥15 MYSQL 多表拼接link
  • ¥15 关于某款2.13寸墨水屏的问题
  • ¥15 obsidian的中文层级自动编号
  • ¥15 同一个网口一个电脑连接有网,另一个电脑连接没网
  • ¥15 神经网络模型一直不能上GPU
  • ¥15 pyqt怎么把滑块和输入框相互绑定,求解决!
  • ¥20 wpf datagrid单元闪烁效果失灵