baidu_21427217 2024-08-20 20:00 采纳率: 50%
浏览 25
已结题

用VBA抓取淘宝的发票号码和下载发票pdf遇到的问题

需求:电商采购的工作需要,要经常处理电商网页中的发票(如图),为了批量处理,我想用VBA根据对应网址,自动获取发票号码,下载发票pdf,并打印pdf。京东网站上的发票下载和打印容易些,参考网上知识和案例,已经搞定。但是淘宝就遇到障碍。
例如:https://invoice-ua.taobao.com/detail/pc?spm=a220l.16.0.0.5f4825a5sNDVZp#/?orderId=2253891543943287862
.
目前遇到的具体问题如下(对网页解析等,我不熟悉):
.
1.我用MSXML2.XMLHTTP的.responsetext 得到此网页的HTML源文本,
1.1.看不到淘宝网页上的发票号码:24922000000044702570
1.2.也看不到:pdf字样,无从下载
.
2.我猜用VBA完整抓包该淘宝发票网页前,增加用户名和密码登录就可以了,是吗?
2.1.若是,请教 解析源代码,而找到该淘宝发票网页中 用户名和密码的元素名称和ID 的过程和结果
2.2.若否,请教 .responsetext 得到的数据不完整的原因
.
我的联系信息13950414554@139.com,万谢
.

img

  • 写回答

19条回答 默认 最新

  • tom_rabbit_black 2024-08-24 19:17
    关注

    淘宝的反爬虫机制,我试过,但js让我很烦恼。
    如果是windows系统,可以用ahk模拟键盘,虽然需要比较多的等待,但也算一个还不错的选择。

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
查看更多回答(18条)

报告相同问题?

问题事件

  • 系统已结题 9月1日
  • 已采纳回答 8月24日
  • 创建了问题 8月20日