m0_56972208 2022-02-28 23:46 采纳率: 100%
浏览 49
已结题

请教,根据excel内的关键词 输入到指定网页中搜索 复制保存结果页面的文字

例如http://12366.beijing.chinatax.gov.cn:8080/
如何利用excel表格中的关键词通过上面网址搜索

img


得出结果后点击链接,复制页面的文字收集到excel或word都可以

img


感谢各位!!最好是mac系统的解法,excel VBA ,python也可以,感谢!

  • 写回答

3条回答 默认 最新

  • 关注

    用 pandas 读取excel内的关键词,并用 requests获取指定网页中搜索结果

    你题目的解答代码如下:

    import pandas as pd
    import requests
    
    df = pd.read_excel('xxx.xlsx')
    headers = {
        "Accept": "application/json, text/javascript, */*; q=0.01",
        'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.106 Safari/537.36',
        "Host": "12366.beijing.chinatax.gov.cn:8080",
        "Origin": "http://12366.beijing.chinatax.gov.cn:8080",
        "Pragma": "no-cache",
        "Referer": "http://12366.beijing.chinatax.gov.cn:8080/",
        "X-Requested-With": "XMLHttpRequest",
        "Content-Type": "application/x-www-form-urlencoded; charset=UTF-8"
    
    }
    li = []
    for v in df['关键词']:
        print(v)
        data = {
            "page": "1",
            "pageSize": "5",
            "zltype": "1",
            "zlflag": "1",
            "keywords": v,
            "order": "",
            "sortField": ""
        }
        url = "http://12366.beijing.chinatax.gov.cn:8080/zsk/zsksearch/search"
        r = requests.post(url, data=data, headers=headers)
        res = r.json()
        if 'pageContent' in res and len(res['pageContent'])>0:
            title = res['pageContent'][0]['TITLE']
            zlnr = res['pageContent'][0]['ZLNR']
            li.append(title+" "+zlnr)
        else:
            li.append("没有搜索结果")
    print(li)
    df['搜索结果'] = li
    df.to_excel(r'xxx2.xlsx',index=None)
    

    读取的excel

    img


    保存结果excel

    img

    如有帮助,请点击我的回答下方的【采纳该答案】按钮帮忙采纳下,谢谢!

    img

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论 编辑记录
查看更多回答(2条)

报告相同问题?

问题事件

  • 系统已结题 3月9日
  • 已采纳回答 3月1日
  • 创建了问题 2月28日

悬赏问题

  • ¥15 ansys fluent计算闪退
  • ¥15 有关wireshark抓包的问题
  • ¥15 需要写计算过程,不要写代码,求解答,数据都在图上
  • ¥15 向数据表用newid方式插入GUID问题
  • ¥15 multisim电路设计
  • ¥20 用keil,写代码解决两个问题,用库函数
  • ¥50 ID中开关量采样信号通道、以及程序流程的设计
  • ¥15 U-Mamba/nnunetv2固定随机数种子
  • ¥15 vba使用jmail发送邮件正文里面怎么加图片
  • ¥15 vb6.0如何向数据库中添加自动生成的字段数据。