java爬虫如何获取非html页面内容

这几天在写一个爬虫程序爬课表,但是课表不是一个html页面,没有html标签,相当于一个文本文档,所以每次获取这个页面内容返回的结果都是空,求教应该怎么获取这个页面的内容?

1个回答

webclient请求页面,不管是不是html,都可以把返回结果取下来。如果得不到,看看是不是缺少cookie、参数,导致没有正确返回结果

u012791231
sfgsgf456 如使用webclient执行一个post请求,不通过表单提交的形式
接近 2 年之前 回复
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!