「已注销」 2019-08-20 21:04 采纳率: 0%
浏览 270

一个简单网页爬虫遇到的问题

网页源码片段:

<a href="/provider/63693738/" class="provider-item"><div class="col-media"><div class="cm-left avatar"><div class="avatar"><img src="https://img1.doubanio.com/view/ark_agent_avatar/small/public/d3fbffd658ac50b.jpg"></div></div><div class="cm-body"><div class="name">豆瓣阅读出版计划</div><div class="works-num">14 部作品在售</div></div></div></a>

错误片段:我只是将需要的字段改成 (/.*?) 其它什么都没改

abcd="<a href=\"(.*?)\" class=\"provider-item\"><div class=\"col-media\"><div class=\"cm-left avatar\"><div class=\"avatar\"><img src=\"(.*?)\"></div></div><div class=\"cm-body\"><div class=\"name\">(.*?)</div><div class=\"works-num\">(.*?) 部作品在售</div></div></div></a>"

然而将<img src=\"(.*?)\">改成<img src=\"(.*?)\"/>后问题就解决了,我想问一下大佬这一个斜杠的作用是什么?

  • 写回答

1条回答 默认 最新

  • 吃鸡王者 2019-08-21 09:44
    关注

    表示img这个tage结束 ,是简写

    评论

报告相同问题?

悬赏问题

  • ¥20 有人能用聚类分析帮我分析一下文本内容嘛
  • ¥15 请问Lammps做复合材料拉伸模拟,应力应变曲线问题
  • ¥30 python代码,帮调试
  • ¥15 #MATLAB仿真#车辆换道路径规划
  • ¥15 java 操作 elasticsearch 8.1 实现 索引的重建
  • ¥15 数据可视化Python
  • ¥15 要给毕业设计添加扫码登录的功能!!有偿
  • ¥15 kafka 分区副本增加会导致消息丢失或者不可用吗?
  • ¥15 微信公众号自制会员卡没有收款渠道啊
  • ¥100 Jenkins自动化部署—悬赏100元