小弟最近在写一个爬取电商网站的用户评论的作业,发现天猫的用户评论都在一个特定的网页下,但是这个网页的body就是一大段文字,直接用element.text()输出的话也输出不了中文(好像是UTF-8的格式。。。),请问怎么把网页中的所有评论输出?就是输出图片中的中文,每个评论一行,请问怎么做?
谢谢各位大神了!
请问如何用正则表达式选出一大段文字中的特定内容?
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
1条回答 默认 最新
- ━━( ̄ー ̄*|||━━ 2019-05-05 18:33关注
这不是json吗?为什么会想到用正则,方向都错了。在java里如果正则写得有问题会卡死,我感觉是个非常不得已而为之的方法。
正则得话就是
,"content":".*?"
逗号双引号冒号都不是关键字,唯一要注意的就是.*后的问号表示非贪婪,否则会出问题
本回答被题主选为最佳回答 , 对您是否有帮助呢?解决 无用评论 打赏 举报
悬赏问题
- ¥15 前端echarts坐标轴问题
- ¥15 CMFCPropertyPage
- ¥15 ad5933的I2C
- ¥15 请问RTX4060的笔记本电脑可以训练yolov5模型吗?
- ¥15 数学建模求思路及代码
- ¥50 silvaco GaN HEMT有栅极场板的击穿电压仿真问题
- ¥15 谁会P4语言啊,我想请教一下
- ¥15 这个怎么改成直流激励源给加热电阻提供5a电流呀
- ¥50 求解vmware的网络模式问题 别拿AI回答
- ¥24 EFS加密后,在同一台电脑解密出错,证书界面找不到对应指纹的证书,未备份证书,求在原电脑解密的方法,可行即采纳