m0_56972208 2022-02-28 23:46 采纳率: 100%
浏览 46
已结题

请教,根据excel内的关键词 输入到指定网页中搜索 复制保存结果页面的文字

例如http://12366.beijing.chinatax.gov.cn:8080/
如何利用excel表格中的关键词通过上面网址搜索

img


得出结果后点击链接,复制页面的文字收集到excel或word都可以

img


感谢各位!!最好是mac系统的解法,excel VBA ,python也可以,感谢!

  • 写回答

3条回答 默认 最新

  • 关注

    用 pandas 读取excel内的关键词,并用 requests获取指定网页中搜索结果

    你题目的解答代码如下:

    import pandas as pd
    import requests
    
    df = pd.read_excel('xxx.xlsx')
    headers = {
        "Accept": "application/json, text/javascript, */*; q=0.01",
        'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.106 Safari/537.36',
        "Host": "12366.beijing.chinatax.gov.cn:8080",
        "Origin": "http://12366.beijing.chinatax.gov.cn:8080",
        "Pragma": "no-cache",
        "Referer": "http://12366.beijing.chinatax.gov.cn:8080/",
        "X-Requested-With": "XMLHttpRequest",
        "Content-Type": "application/x-www-form-urlencoded; charset=UTF-8"
    
    }
    li = []
    for v in df['关键词']:
        print(v)
        data = {
            "page": "1",
            "pageSize": "5",
            "zltype": "1",
            "zlflag": "1",
            "keywords": v,
            "order": "",
            "sortField": ""
        }
        url = "http://12366.beijing.chinatax.gov.cn:8080/zsk/zsksearch/search"
        r = requests.post(url, data=data, headers=headers)
        res = r.json()
        if 'pageContent' in res and len(res['pageContent'])>0:
            title = res['pageContent'][0]['TITLE']
            zlnr = res['pageContent'][0]['ZLNR']
            li.append(title+" "+zlnr)
        else:
            li.append("没有搜索结果")
    print(li)
    df['搜索结果'] = li
    df.to_excel(r'xxx2.xlsx',index=None)
    

    读取的excel

    img


    保存结果excel

    img

    如有帮助,请点击我的回答下方的【采纳该答案】按钮帮忙采纳下,谢谢!

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 3月9日
  • 已采纳回答 3月1日
  • 创建了问题 2月28日

悬赏问题

  • ¥50 我撰写的python爬虫爬不了 要爬的网址有反爬机制
  • ¥15 Centos / PETSc / PETGEM
  • ¥15 centos7.9 IPv6端口telnet和端口监控问题
  • ¥120 计算机网络的新校区组网设计
  • ¥20 完全没有学习过GAN,看了CSDN的一篇文章,里面有代码但是完全不知道如何操作
  • ¥15 使用ue5插件narrative时如何切换关卡也保存叙事任务记录
  • ¥20 海浪数据 南海地区海况数据,波浪数据
  • ¥20 软件测试决策法疑问求解答
  • ¥15 win11 23H2删除推荐的项目,支持注册表等
  • ¥15 matlab 用yalmip搭建模型,cplex求解,线性化处理的方法