用httpclient或者htmlunit解析这个网页是无法获取到内容,
http://www.hfr.cc/forum.php?mod=viewthread&tid=88379&extra=page%3D1
这个帖子是英文的,如果是中文的就能获取到主贴的内容,
有谁知道这是为什么,有什么方法可以解决的吗?
用httpclient或者htmlunit解析这个网页是无法获取到内容
- 写回答
- 好问题 0 提建议
- 追加酬金
- 关注问题
- 邀请回答
-
1条回答
- ChatGPTᴼᴾᴱᴺᴬᴵ 2023-02-28 13:30关注
该回答引用ChatGPT
可能是因为该网站的内容是动态生成的,而不是静态的。许多网站使用 JavaScript 和 AJAX 技术动态生成页面内容,这使得使用 HttpClient 或 HtmlUnit 等工具很难从页面中提取内容。这些工具只能获取页面的初始 HTML 代码,而无法获取动态生成的内容。
解决此问题的方法之一是使用一个支持 JavaScript 的爬虫框架,例如 Selenium 或 PhantomJS。这些框架可以模拟浏览器行为,使您能够获取页面的完整内容,包括动态生成的内容。
另一个解决方法是直接使用该网站的 API 接口,如果该网站提供 API 接口,那么您可以通过 API 接口获取所需的数据。这是一种更加可靠和有效的方法,因为 API 接口通常是为了提供可靠和可重复的数据访问而设计的。
解决 无用评论 打赏 举报
悬赏问题
- ¥15 动力学代码报错,维度不匹配
- ¥15 Power query添加列问题
- ¥50 Kubernetes&Fission&Eleasticsearch
- ¥15 有没有帮写代码做实验仿真的
- ¥15 報錯:Person is not mapped,如何解決?
- ¥30 vmware exsi重置后登不上
- ¥15 c++头文件不能识别CDialog
- ¥15 Excel发现不可读取的内容
- ¥15 关于#stm32#的问题:CANOpen的PDO同步传输问题
- ¥20 yolov5自定义Prune报错,如何解决?