请教，根据excel内的关键词输入到指定网页中搜索复制保存结果页面的文字

例如http://12366.beijing.chinatax.gov.cn:8080/
如何利用excel表格中的关键词通过上面网址搜索

得出结果后点击链接，复制页面的文字收集到excel或word都可以

感谢各位！！最好是mac系统的解法，excel VBA ，python也可以，感谢！

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

3条回答默认最新

CSDN专家-天际的海浪 2022-02-28 23:59

关注

用 pandas 读取excel内的关键词,并用 requests获取指定网页中搜索结果

你题目的解答代码如下：

import pandas as pd
import requests

df = pd.read_excel('xxx.xlsx')
headers = {
    "Accept": "application/json, text/javascript, */*; q=0.01",
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.106 Safari/537.36',
    "Host": "12366.beijing.chinatax.gov.cn:8080",
    "Origin": "http://12366.beijing.chinatax.gov.cn:8080",
    "Pragma": "no-cache",
    "Referer": "http://12366.beijing.chinatax.gov.cn:8080/",
    "X-Requested-With": "XMLHttpRequest",
    "Content-Type": "application/x-www-form-urlencoded; charset=UTF-8"

}
li = []
for v in df['关键词']:
    print(v)
    data = {
        "page": "1",
        "pageSize": "5",
        "zltype": "1",
        "zlflag": "1",
        "keywords": v,
        "order": "",
        "sortField": ""
    }
    url = "http://12366.beijing.chinatax.gov.cn:8080/zsk/zsksearch/search"
    r = requests.post(url, data=data, headers=headers)
    res = r.json()
    if 'pageContent' in res and len(res['pageContent'])>0:
        title = res['pageContent'][0]['TITLE']
        zlnr = res['pageContent'][0]['ZLNR']
        li.append(title+" "+zlnr)
    else:
        li.append("没有搜索结果")
print(li)
df['搜索结果'] = li
df.to_excel(r'xxx2.xlsx',index=None)

读取的excel

保存结果excel

如有帮助，请点击我的回答下方的【采纳该答案】按钮帮忙采纳下，谢谢!

本回答被题主选为最佳回答 , 对您是否有帮助呢?

编辑记录

查看更多回答(2条)

报告相同问题？

关注问题

别再只当GitHub旁观者！从0到1搞懂程序员“刷爆”的宝藏平台，新手也能快速上手
2025-10-04 19:15

来酱何人的博客坚持一周，你会发现自己的代码有...看到好的项目（比如“100个Python小案例”），点一下右上角的 Star，就能把它放进你的“Stars”列表里，以后想找的时候直接在首页点“Stars”就能快速定位，不用再靠关键词大海捞针。
【完结】cyのMemo（20231231~20240208）
2023-12-31 21:35

囚生CY的博客当为False时，会将dataframe中的每一个column或每一个index上以Series的形式传到函数中（这也是常规的做法，此时逻辑是循环，通常很慢）。当为True时，则会把数据以np.ndarray的形式传到函数中，如果这个时候func用...
【信息科学与工程学】【管理科学】第六十二篇企业组织的人性/情感/资源/关系及组织利益/组织政治/组织斗争及组织的模拟推演01 人事即政治
2026-03-21 06:51

flyair_China的博客、组合数学特征】在组织中，个体拥有私有信息（如真实能力、工作负荷、项目风险），通过发送“信号”（如加班、做精美PPT、夸大难度）来影响上级或同事的认知。员工感知到的组织公平（分配公平、程序公平、互动公平...
51c大模型~合集159
2025-07-25 16:57

whaosoft-143的博客整个框架采用模块化和框架无关的设计理念，不仅能够与多种 Agent 架构无缝集成，更为跨框架的经验...当遇到新的数据集中的测试例子的时候，从历史经验中检索相关的解决策略，将其他 agent 的经验适配到新的任务场景。
我了解的软件测试基本概念
2020-04-19 00:21

wtg4452的博客题目汇总共293道题目录题目汇总 1 一....二....1.什么是兼容性测试？兼容性测试侧重哪些方面？...2.正交表测试用例设计...请分别以具体的例子来说明这些方法在测试用例设计工作中的应用。 10 5.请以您以往的实际工作为例...
数据可视化
2021-01-09 23:31

四十岁老处男的博客 excel提供了商业标准的可视化内容，但总显笨拙。也不希望excel形成垄断，到时候坐地起价。程序员的求知天性，也要求随心所欲得设计，总希望是设置参数而不是选项，是调用函数而不是下拉列表框。自由是要付出代价的，...
我了解的软件测试总结
2020-04-19 00:23

wtg4452的博客题目汇总共293道题目录题目汇总 1 一....二....1.什么是兼容性测试？兼容性测试侧重哪些方面？...2.正交表测试用例设计...请分别以具体的例子来说明这些方法在测试用例设计工作中的应用。 10 5.请以您以往的实际工作为例...
JAVA
2018-09-03 22:41

weixin_33810302的博客 2019独角兽企业重金招聘Python工程师标准>>> ...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 3月9日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 3月1日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月28日

请教，根据excel内的关键词 输入到指定网页中搜索 复制保存结果页面的文字

3条回答 默认 最新

问题事件

请教，根据excel内的关键词输入到指定网页中搜索复制保存结果页面的文字

3条回答默认最新