目前我有这样的一个excel数据表,
我需要将excel第三列的数据每一条都复制到下面的网页上去检索:
https://www.cir-safety.org/ingredients
如果搜索有结果,我就在excel表的第8列填“有”;
如果搜索没有结果,我就在excel表的第8列填“无”。
每一条都这样复制太累了,我也尝试过一些办法,不太行得通。
目前我有这样的一个excel数据表,
我需要将excel第三列的数据每一条都复制到下面的网页上去检索:
https://www.cir-safety.org/ingredients
如果搜索有结果,我就在excel表的第8列填“有”;
如果搜索没有结果,我就在excel表的第8列填“无”。
每一条都这样复制太累了,我也尝试过一些办法,不太行得通。
按你需求, 那就是个简单功能的爬虫了, 如果网站能直接接受post 数据的方式, 那可以找类似postman的工具批量执行查询,返回结果。
如果不能接受直接post 数据的方式 , 那可能要用到selenium 来访问网站,自己写爬虫脚本, 关键语句就是打开网站,定位input框,模拟sendkeys , 模拟点击 search 按钮, 读取页面数据 。
然后用openpyxl 库读取你的excel文件, 遍历行, 调用上述完成的爬虫模块, 获取数据写入excel
大概过程的过程就是这样。