为什么我用scrapy抓页面时，<strong>标签里面的字没有？代码如下

from scrapy.contrib.spiders import CrawlSpider
from scrapy.contrib.linkextractors.sgml import SgmlLinkExtractor
from scrapy.selector import Selector
from scrapy.selector import HtmlXPathSelector
from kkk1.items import Kkk1Item
from scrapy.http import Request
from scrapy.http import HtmlResponse
import re
import math
class DmozSpider(CrawlSpider):
name = "kkk1"
allowed_domains = ['item.jd.com']
start_urls = [
"http://item.jd.com/1130480.html"]
def parse(self, response):
item = Kkk1Item()
sel = Selector(response)
item['gid']=sel.select("//div[@class='w']/div[@class='right']/div[@id='product-detail']/div[@id='product-detail-1']/ul/li[2]/text()").extract()
item['name'] = sel.select("id('name')/h1/text()").extract()
item['brand'] = response.xpath("//div[@class='w']/div[@class='right']/div[@id='product-detail']/div[@id='product-detail-1']/ul/li[3]/a/text()").extract()
item['price']=sel.select("//*[@id='jd-price']").extract()
#item['price']=sel.select("//*[@id='jd-price']/text()").extract()
return item

控制台打出来的：
{
'brand': [u'\u5c0f\u7c73\uff08MI\uff09'],
'gid': [u'\u5546\u54c1\u7f16\u53f7\uff1a1130480'],
'name': [u'\u5c0f\u7c73 \u7ea2\u7c731s \u79fb\u52a83G\u624b\u673a\uff08\u91d1\u5c5e\u7070\uff09 TD-SCDMA/GSM \u53cc\u5361\u53cc\u5f85 \u79fb\u52a8\u5408\u7ea6\u7248\uff08\u4e0d\u542b\u5408\u7ea6\u8ba1\u5212\uff09']
'price': [u'《strong class="p-price" id="jd-price"></strong》'],
'salereminder': []}

u《strong class="p-price" id="jd-price"></strong》'里面的价格怎么没有？求大神，感激不尽，新手，已经困扰我好几天了，就是没办法啊，

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
CSDN-Ada助手 CSDN-AI 官方账号 2022-09-09 18:30
关注
不知道你这个问题是否已经解决, 如果还没有解决的话:
你可以参考下这篇文章：非常简单的scrapy代码但就是不清楚到底哪里出问题了，高手帮忙看看吧！

如果你已经解决了该问题, 非常希望你能够分享一下解决方案, 以帮助更多的人 ^-^
解决
无用 1
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

为什么我的scrapy爬不到数据了 python
2020-09-05 13:48

回答 1 已采纳 small_link = 'http:'+li.xpath('./@href').extract_first() 这里错了 response.urljoin(li.xpath('./@href')
不是说scrapy可以自动处理cookie吗？为什么我用scrapy发送request请求为什么不会自动发送cookie信息？ django flask python tornado virtualenv
2019-06-09 21:28

回答 2 已采纳 ![图片说明](https://img-ask.csdn.net/upload/201906/11/1560224325_844052.png)
用python获取里面的a标签的链接地址 javascript python
2017-11-15 03:55

回答 2 已采纳这是爬取本页a标签url的方法，参考一下，要下载lxml。不下载的话，Beatifusoup()方法里不写,'lxml'也行。 import requests from bs4 import Be
python用scrapy爬虫豆瓣_Python->用Scrapy爬取豆瓣电影
2021-01-14 06:17

weixin_39856803的博客学习网址:http://www.ituring.com.cn/article/114408http://python.jobbole.com/86584/https://segmentfault.com/a/1190000003870052runSpider->...
Scrapy的下载中间件返回响应对象时，为什么不会执行 del 操作？ python selenium 有问必答
2021-04-22 17:43

回答 4 已采纳已经解决，创建中间件时请使用 `spider_closed`方法并连接到信号： --skip-- @classmethod def from_crawler(cls, crawler):
请问为什么，我无法创建scrapy爬虫项目 python 爬虫
2022-02-07 19:41

回答 1 已采纳库安装失败了
已经在cmd安装了scrapy，为什么import scrapy还是报错? python
2022-11-09 16:33

回答 2 已采纳在pycharm终端在安装一次就好了：
【爬虫】4.2 Scrapy 中查找 html 元素
2023-06-11 19:02

即使再小的船也能远航的博客 1. Scrapy 的 Xpath 简介（1）使用xpath查找HTML中的元素 2. Xpath 查找 html 元素（2）"//"与"/"的使用（3）使用"."进行Xpath连续调用（4）extract与extract_first函数使用（5）获取元素属性值（6）获取节点...
scrapy 找不到txt文件是为什么？ python
2021-12-14 09:34

回答 1 已采纳 with open(r'ccgpwin_2021\publishTime','r') as f: preservationTime = f.readline() 有帮助请采纳
scrapy爬虫翻页操作，python+scrapy python 其他有问必答
2021-04-02 17:02

回答 3 已采纳 # 导入所需库 import requests class Jdcomment_spider(object): # 请求头 headers = { 'User-A
python爬虫scrapy python 有问必答
2021-07-22 10:03

回答 2 已采纳看下数据是否是动态加载的，多抓几次包，分析下；可能需要通过添加page参数，进行爬取！
python用scrapy爬网站_Python下使用Scrapy爬取网页内容的实例
2020-12-16 14:31

weixin_39901332的博客上周用了一周的时间学习了Python和Scrapy，实现了从0到1完整的网页爬虫实现。研究的时候很痛苦，但是很享受，做技术的嘛。首先，安装Python，坑太多了，一个个爬。由于我是windows环境，没钱买mac, 在安装的时候遇到...
scrapy 怎么爬取网页中标签栏下的所有标签? python 爬虫
2022-10-19 14:43

回答 1 已采纳
python之scrapy的使用和获取标签内部全部文本的四种方式
2018-08-04 18:00

Y_321_123的博客在使用爬虫爬取数据的时候，经常需要获取标签内的文本，下面向大家介绍四种获取文本的方式（以小说吧中的一篇帖子为例，链接为：https://tieba.baidu.com/p/5806279867）：第一步：打开终端，在指定文件夹下创建一...
scrapy 中不同页面的拼接_Python下使用Scrapy爬取网页内容的实例
2021-02-04 20:04

太哥大的博客上周用了一周的时间学习了Python和Scrapy，实现了从0到1完整的网页爬虫实现。研究的时候很痛苦，但是很享受，做技术的嘛。首先，安装Python，坑太多了，一个个爬。由于我是windows环境，没钱买mac, 在安装的时候遇到...
没有解决我的问题, 去提问

悬赏问题

¥15 素材场景中光线烘焙后灯光失效
¥15 请教一下各位，为什么我这个没有实现模拟点击
¥15 执行 virtuoso 命令后，界面没有，cadence 启动不起来
¥50 comfyui下连接animatediff节点生成视频质量非常差的原因
¥20 有关区间dp的问题求解
¥15 多电路系统共用电源的串扰问题
¥15 slam rangenet++配置
¥15 有没有研究水声通信方面的帮我改俩matlab代码
¥15 ubuntu子系统密码忘记
¥15 保护模式-系统加载-段寄存器

为什么我用scrapy抓页面时，<strong>标签里面的字没有？代码如下

1条回答 默认 最新

悬赏问题

1条回答默认最新