XxxXxxXxx233 2019-05-05 17:14 采纳率: 88.9%
浏览 926
已采纳

请问如何用正则表达式选出一大段文字中的特定内容?

小弟最近在写一个爬取电商网站的用户评论的作业,发现天猫的用户评论都在一个特定的网页下,但是这个网页的body就是一大段文字,直接用element.text()输出的话也输出不了中文(好像是UTF-8的格式。。。),请问怎么把网页中的所有评论输出?图片说明图片说明就是输出图片中的中文,每个评论一行,请问怎么做?
谢谢各位大神了!

  • 写回答

1条回答 默认 最新

  • 关注

    这不是json吗?为什么会想到用正则,方向都错了。在java里如果正则写得有问题会卡死,我感觉是个非常不得已而为之的方法。

    正则得话就是

    ,"content":".*?"
    

    逗号双引号冒号都不是关键字,唯一要注意的就是.*后的问号表示非贪婪,否则会出问题

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 python的qt5界面
  • ¥15 无线电能传输系统MATLAB仿真问题
  • ¥50 如何用脚本实现输入法的热键设置
  • ¥20 我想使用一些网络协议或者部分协议也行,主要想实现类似于traceroute的一定步长内的路由拓扑功能
  • ¥30 深度学习,前后端连接
  • ¥15 孟德尔随机化结果不一致
  • ¥15 apm2.8飞控罗盘bad health,加速度计校准失败
  • ¥15 求解O-S方程的特征值问题给出边界层布拉休斯平行流的中性曲线
  • ¥15 谁有desed数据集呀
  • ¥20 手写数字识别运行c仿真时,程序报错错误代码sim211-100