2 u013790614 u013790614 于 2015.06.17 23:27 提问

如何提取txt中的url信息?

T<=>103[=]P<=>iexplore.exe[=]I<=>2808[=]U<=>http://t.iloveyouxi.com/game/krtc5822.php[=]A<=>1045e[=]B<=>1048a[=]V<=>8.00.6001.18702
各位大神,这种格式的txt文档如何提取url,并得到网页文本数据呢?

2个回答

ycg514230
ycg514230   Rxr 2015.06.18 08:53

看你这个格式,可以搜索http开头,这比较容易。
然后就看如何结束了,看你这个格式,只能以<来作为结束符,或者你再分析一下有没有更好的方案。
截取http到<之间的为url

希望能帮到你。

lx624909677
lx624909677   Ds   Rxr 2015.06.18 09:18

先将txt内容读到内存中,然后遍历字符串查找url表示的开头和结束部分,也就是做一个截取字符串的工作

Csdn user default icon
上传中...
上传图片
插入图片