fyiofo 2017-09-11 08:10 采纳率: 66.7%
浏览 1182
已采纳

R语言爬虫页面向页面输入字段跳转的问题

统计学导师让写一个程序:
要用R语言编写!!!
原版问题:
图片说明
大致解释下:
在google学术搜索( https://scholar.google.com) 上,输入一个名字搜索后出现下边这样的网页:
图片说明
点开User profiles下边的名字会出现这个作者的文献信息(如图):
图片说明

问题是:如何根据刚才搜索这一文献页用到的网址写一个程序,输入作者的名字(就是搜索时输入的名字),输出一个txt文本,文本中有这个作者所有的文献信息,和这个作者的用户编号(用户编号在文献页面的网址中可以找到,网址中有User=“”,这个就是用户编号)

现在后半段网页上的信息抓取已经会弄了,前半段的 在程序里输入名字(是在程序里输入名字!),然后得到文献页的http地址这一部分不会弄,希望大神帮忙写一下这一部分的代码或给出具体的思路(要用什么函数等等)

谢谢各位大神!!!

  • 写回答

1条回答 默认 最新

  • 饭饭认认米 2017-09-12 04:04
    关注

    图片说明
    拼接一下这个url,用枚红色标记的部分就是你程序要输入的名字;
    然后获取到,人物对应的user,拼接出你要的页面的url,
    图片说明
    剩下的就是你已经做好的抓取部分了

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

悬赏问题

  • ¥15 安卓adb backup备份应用数据失败
  • ¥15 eclipse运行项目时遇到的问题
  • ¥15 关于#c##的问题:最近需要用CAT工具Trados进行一些开发
  • ¥15 南大pa1 小游戏没有界面,并且报了如下错误,尝试过换显卡驱动,但是好像不行
  • ¥15 没有证书,nginx怎么反向代理到只能接受https的公网网站
  • ¥50 成都蓉城足球俱乐部小程序抢票
  • ¥15 yolov7训练自己的数据集
  • ¥15 esp8266与51单片机连接问题(标签-单片机|关键词-串口)(相关搜索:51单片机|单片机|测试代码)
  • ¥15 电力市场出清matlab yalmip kkt 双层优化问题
  • ¥30 ros小车路径规划实现不了,如何解决?(操作系统-ubuntu)