weixin_40187983
weixin_40187983
采纳率73.6%
2018-12-02 06:21 阅读 2.0k

python3.7爬虫 使用 selector.xpath('')爬取-线上等

5

我想用正则取以下的

            LANEIGE (兰芝) Deep Pore Cleansing Foam

            字串即可,请用我用python   selector.xpath('') 的语法要怎么写呢

            '''''''''''''''''''''''''''''''''''''''''''''''
            <div class="col-md-10" >
        <div style="margin:10px 0px; float:left;width:100%;">

            <div style="float:left;margin-left:10px;margin-top:20px;">
                <p> 
                    <span class="fullName">LANEIGE (兰芝) Deep Pore Cleansing Foam</span>

                    <span class="certificate">

                    </span>
                </p>

                <p class="member">

                    <span class="createDttm">
                        更新于:&nbsp;2018-12-02

                        ,&nbsp;资料来源: 其他(非官方)网站

                    </span>
                </p>
            </div>


        </div>
        ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
        www.cosgua.com/cosmetic/1000(原网址)
  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 复制链接分享

2条回答 默认 最新

  • 已采纳
    weixin_39416561 lyhsdy 2018-12-03 03:24

    from scrapy.selector import Selector

    
     html='''
                <div class="col-md-10" >
            <div style="margin:10px 0px; float:left;width:100%;">
    
                <div style="float:left;margin-left:10px;margin-top:20px;">
                    <p> 
                        <span class="fullName">LANEIGE (兰芝) Deep Pore Cleansing Foam</span>
    
                        <span class="certificate">
    
                        </span>
                    </p>
    
                    <p class="member">
    
                        <span class="createDttm">
                            更新于:&nbsp;2018-12-02
    
                            ,&nbsp;资料来源: 其他(非官方)网站
    
                        </span>
                    </p>
                </div>
    
    
            </div>
    '''
    selector = Selector(text=html)
    txt=selector.xpath('//div/p/span[@class="fullName"]/text()').extract_first()
    print(txt)
    
    点赞 评论 复制链接分享
  • devmiao devmiao 2018-12-02 14:15

相关推荐