关于爬虫技术,请各位大神提供一下思想。我用的是ASP.NET C#

由于我从来没有做过爬虫,面对目前很多防御做得不错的网站束手无策。

1.网站不允许IFRAME。IFRAME打不开网站。
2.通过GET方法获得网站的传输内容是部分的,获取不了COOKIES。并且输入获取的内容无法显示。

此类网站应该是做了反IFRAME和JS加载初始化。

现在还处于无法成功完全读取和无法登录状态,登录后还需要读取数据并做操作。。

请大神们指导一下爬虫。。

2个回答

如果你水平一般,可以考虑使用基于浏览器的方案,比如webbrowser、cefsharp、selenium

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
立即提问