p1838272724 2019-12-27 22:16 采纳率: 0%
浏览 223

初学python,爬取京东商品数据时无法获取内容

  1. import requests from lxml import html

def spider_JD(sn):
url = 'https://search.jd.com/Search?keyword={0}'.format(sn)
html_doc=requests.get(url).text
selector=html.fromstring(html_doc)
ul_list2=selector.xpath('//div[@id="J_goodsList"]/ul/li')
print(len(ul_list2))

if name=='__main__':
spider_JD('9787115428028')
图片说明
如图所示 可以看到很多li
但上述代码运行显示为0

  • 写回答

1条回答 默认 最新

  • dudu7615 2024-03-10 00:46
    关注

    这个建议你设置一个请求头 ua 然后访问,不然服务器会给你拦截掉

    关于提问也提个建议,你可以把代码放到代码框里,这样看起来更直观

    评论

报告相同问题?

悬赏问题

  • ¥100 求数学坐标画圆以及直线的算法
  • ¥100 c语言,请帮蒟蒻写一个题的范例作参考
  • ¥15 名为“Product”的列已属于此 DataTable
  • ¥15 安卓adb backup备份应用数据失败
  • ¥15 eclipse运行项目时遇到的问题
  • ¥15 关于#c##的问题:最近需要用CAT工具Trados进行一些开发
  • ¥15 南大pa1 小游戏没有界面,并且报了如下错误,尝试过换显卡驱动,但是好像不行
  • ¥15 自己瞎改改,结果现在又运行不了了
  • ¥15 链式存储应该如何解决
  • ¥15 没有证书,nginx怎么反向代理到只能接受https的公网网站