shutupzk 2014-09-28 07:01 采纳率: 0%
浏览 1586

为什么我用scrapy抓页面时,<strong>标签里面的字没有?代码如下

from scrapy.contrib.spiders import CrawlSpider
from scrapy.contrib.linkextractors.sgml import SgmlLinkExtractor
from scrapy.selector import Selector
from scrapy.selector import HtmlXPathSelector
from kkk1.items import Kkk1Item
from scrapy.http import Request
from scrapy.http import HtmlResponse
import re
import math
class DmozSpider(CrawlSpider):
name = "kkk1"
allowed_domains = ['item.jd.com']
start_urls = [
"http://item.jd.com/1130480.html"]
def parse(self, response):
item = Kkk1Item()
sel = Selector(response)
item['gid']=sel.select("//div[@class='w']/div[@class='right']/div[@id='product-detail']/div[@id='product-detail-1']/ul/li[2]/text()").extract()
item['name'] = sel.select("id('name')/h1/text()").extract()
item['brand'] = response.xpath("//div[@class='w']/div[@class='right']/div[@id='product-detail']/div[@id='product-detail-1']/ul/li[3]/a/text()").extract()
item['price']=sel.select("//*[@id='jd-price']").extract()
#item['price']=sel.select("//*[@id='jd-price']/text()").extract()
return item

控制台打出来的:
{
'brand': [u'\u5c0f\u7c73\uff08MI\uff09'],
'gid': [u'\u5546\u54c1\u7f16\u53f7\uff1a1130480'],
'name': [u'\u5c0f\u7c73 \u7ea2\u7c731s \u79fb\u52a83G\u624b\u673a\uff08\u91d1\u5c5e\u7070\uff09 TD-SCDMA/GSM \u53cc\u5361\u53cc\u5f85 \u79fb\u52a8\u5408\u7ea6\u7248\uff08\u4e0d\u542b\u5408\u7ea6\u8ba1\u5212\uff09']
'price': [u'《strong class="p-price" id="jd-price"></strong》'],
'salereminder': []}

u《strong class="p-price" id="jd-price"></strong》'里面的价格怎么没有?求大神,感激不尽,新手,已经困扰我好几天了,就是没办法啊,

  • 写回答

1条回答 默认 最新

  • CSDN-Ada助手 CSDN-AI 官方账号 2022-09-09 18:30
    关注
    不知道你这个问题是否已经解决, 如果还没有解决的话:

    如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 以帮助更多的人 ^-^
    评论

报告相同问题?

悬赏问题

  • ¥15 素材场景中光线烘焙后灯光失效
  • ¥15 请教一下各位,为什么我这个没有实现模拟点击
  • ¥15 执行 virtuoso 命令后,界面没有,cadence 启动不起来
  • ¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
  • ¥20 有关区间dp的问题求解
  • ¥15 多电路系统共用电源的串扰问题
  • ¥15 slam rangenet++配置
  • ¥15 有没有研究水声通信方面的帮我改俩matlab代码
  • ¥15 ubuntu子系统密码忘记
  • ¥15 保护模式-系统加载-段寄存器