weixin_40187983 2018-12-02 06:21 采纳率: 100%
浏览 2144
已采纳

python3.7爬虫 使用 selector.xpath('')爬取-线上等

我想用正则取以下的

            LANEIGE (兰芝) Deep Pore Cleansing Foam

            字串即可,请用我用python   selector.xpath('') 的语法要怎么写呢

            '''''''''''''''''''''''''''''''''''''''''''''''
            <div class="col-md-10" >
        <div style="margin:10px 0px; float:left;width:100%;">

            <div style="float:left;margin-left:10px;margin-top:20px;">
                <p> 
                    <span class="fullName">LANEIGE (兰芝) Deep Pore Cleansing Foam</span>

                    <span class="certificate">

                    </span>
                </p>

                <p class="member">

                    <span class="createDttm">
                        更新于:&nbsp;2018-12-02

                        ,&nbsp;资料来源: 其他(非官方)网站

                    </span>
                </p>
            </div>


        </div>
        ,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,,
        www.cosgua.com/cosmetic/1000(原网址)
  • 写回答

2条回答 默认 最新

  • lyhsdy 2018-12-03 03:24
    关注

    from scrapy.selector import Selector

    
     html='''
                <div class="col-md-10" >
            <div style="margin:10px 0px; float:left;width:100%;">
    
                <div style="float:left;margin-left:10px;margin-top:20px;">
                    <p> 
                        <span class="fullName">LANEIGE (兰芝) Deep Pore Cleansing Foam</span>
    
                        <span class="certificate">
    
                        </span>
                    </p>
    
                    <p class="member">
    
                        <span class="createDttm">
                            更新于:&nbsp;2018-12-02
    
                            ,&nbsp;资料来源: 其他(非官方)网站
    
                        </span>
                    </p>
                </div>
    
    
            </div>
    '''
    selector = Selector(text=html)
    txt=selector.xpath('//div/p/span[@class="fullName"]/text()').extract_first()
    print(txt)
    
    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(1条)

报告相同问题?

悬赏问题

  • ¥30 Matlab打开默认名称带有/的光谱数据
  • ¥50 easyExcel模板 动态单元格合并列
  • ¥15 res.rows如何取值使用
  • ¥15 在odoo17开发环境中,怎么实现库存管理系统,或独立模块设计与AGV小车对接?开发方面应如何设计和开发?请详细解释MES或WMS在与AGV小车对接时需完成的设计和开发
  • ¥15 CSP算法实现EEG特征提取,哪一步错了?
  • ¥15 游戏盾如何溯源服务器真实ip?需要30个字。后面的字是凑数的
  • ¥15 vue3前端取消收藏的不会引用collectId
  • ¥15 delphi7 HMAC_SHA256方式加密
  • ¥15 关于#qt#的问题:我想实现qcustomplot完成坐标轴
  • ¥15 下列c语言代码为何输出了多余的空格