「已注销」 2019-08-20 21:04 采纳率: 0%
浏览 270

一个简单网页爬虫遇到的问题

网页源码片段:

<a href="/provider/63693738/" class="provider-item"><div class="col-media"><div class="cm-left avatar"><div class="avatar"><img src="https://img1.doubanio.com/view/ark_agent_avatar/small/public/d3fbffd658ac50b.jpg"></div></div><div class="cm-body"><div class="name">豆瓣阅读出版计划</div><div class="works-num">14 部作品在售</div></div></div></a>

错误片段:我只是将需要的字段改成 (/.*?) 其它什么都没改

abcd="<a href=\"(.*?)\" class=\"provider-item\"><div class=\"col-media\"><div class=\"cm-left avatar\"><div class=\"avatar\"><img src=\"(.*?)\"></div></div><div class=\"cm-body\"><div class=\"name\">(.*?)</div><div class=\"works-num\">(.*?) 部作品在售</div></div></div></a>"

然而将<img src=\"(.*?)\">改成<img src=\"(.*?)\"/>后问题就解决了,我想问一下大佬这一个斜杠的作用是什么?

  • 写回答

1条回答 默认 最新

  • 吃鸡王者 2019-08-21 09:44
    关注

    表示img这个tage结束 ,是简写

    评论

报告相同问题?

悬赏问题

  • ¥100 Jenkins自动化部署—悬赏100元
  • ¥15 关于#python#的问题:求帮写python代码
  • ¥20 MATLAB画图图形出现上下震荡的线条
  • ¥15 关于#windows#的问题:怎么用WIN 11系统的电脑 克隆WIN NT3.51-4.0系统的硬盘
  • ¥15 perl MISA分析p3_in脚本出错
  • ¥15 k8s部署jupyterlab,jupyterlab保存不了文件
  • ¥15 ubuntu虚拟机打包apk错误
  • ¥199 rust编程架构设计的方案 有偿
  • ¥15 回答4f系统的像差计算
  • ¥15 java如何提取出pdf里的文字?