六碗铁biu_ 2018-11-26 06:03 采纳率: 0%
浏览 552

使用正则表达式以及findall查询结果有问题

我想解析百度贴吧某个贴子各楼层内容
html元素是这样:

之前为了减肥,每天不吃饭,不吃肉,只吃水果,燕麦,玉米,紫薯什么的,两个月,不运动也瘦了20多斤。但是这个过程万分痛苦,身为一个吃货,抑制食欲真的是一种煎熬,下定决心减肥,纯粹是因为过年回来125斤,受刺激了,一鼓作气减了20多斤。成功体重不过百之后,我才开始意识到这种方法有多伤身体,体质明显没有以前好了,而且压抑了两个月的食欲,好像也呼之欲出,我必须赶快调整,要不然一旦反弹,我两个月的辛苦就白费了。所以我决定开始学做饭,活了17年,第一次有想学做饭的冲动,马上开始行动,因为一个人住,不方便开火,所以在网上买了一个宿舍用的那种电炒锅,马上去研究菜谱,居然让我意外发现自己在厨艺上的天赋因为是减肥的调整期,所以我现在每天都是过午不食,周末放假回家正常吃,全天总热量不超过1200kcal,一个星期能瘦1-2斤,现在已经过午不食第三个星期了,这个速度非常合适,感觉也不错,晚上完全不会觉得饿,而且对零食完全没有食欲了。本来是为了减肥学做饭,结果现在居然爱上烹饪了。以后每天更新我过午不食的食谱,周末除外>

我的用法:

patternContent = re.compile('

(.*?)
(.*?)', re.S)
或者
patternContent = re.compile('
  • 写回答

2条回答 默认 最新

  • 六碗铁biu_ 2018-11-26 06:15
    关注

    好像因为文字里有html代码 乱套了 我在这重新说明一下哈
    贴吧html元素:

    图片说明

    我的用法

    图片说明

    上面这种打印不出来数据

    然后改成一个以上分组,这样:

    图片说明

    就能打印出每楼层数据了

    求助:
    使用findall时 正则表达式必须有一个以上分组么?

    评论

报告相同问题?

悬赏问题

  • ¥50 永磁型步进电机PID算法
  • ¥15 sqlite 附加(attach database)加密数据库时,返回26是什么原因呢?
  • ¥88 找成都本地经验丰富懂小程序开发的技术大咖
  • ¥15 如何处理复杂数据表格的除法运算
  • ¥15 如何用stc8h1k08的片子做485数据透传的功能?(关键词-串口)
  • ¥15 有兄弟姐妹会用word插图功能制作类似citespace的图片吗?
  • ¥200 uniapp长期运行卡死问题解决
  • ¥15 latex怎么处理论文引理引用参考文献
  • ¥15 请教:如何用postman调用本地虚拟机区块链接上的合约?
  • ¥15 为什么使用javacv转封装rtsp为rtmp时出现如下问题:[h264 @ 000000004faf7500]no frame?