weixin_42620528
lanthon
采纳率16.7%
2018-09-14 01:53

已知公司名称,总数超过3万家,如何写python代码批量提取注册地址、注册日期、注册资本等关键字

20

如题,因为工作需要,要对部分合伙企业进行统计费。总计三万家,企业名称已经知道,如何批量操作提取工商注册信息,同时避开企查查、天眼查等单日的查询限制。个人用python语言。

  • 点赞
  • 写回答
  • 关注问题
  • 收藏
  • 复制链接分享
  • 邀请回答

5条回答

  • m0_55460211 m0_55460211 10天前

    同求,朋友做好了吗

    点赞 评论 复制链接分享
  • huxiangen huxiangen 2年前

    https://blog.csdn.net/huxiangen/article/details/85006330 参考这个博客,这个工具完全满足

    点赞 评论 复制链接分享
  • ugrggame ugrg 3年前

    你这是想做一个爬虫啊,企查查、天眼查这些网站的查询现在现在貌似大多是针对帐号的,你可能需要大量的帐号。然后做好自动登录,再做好网页爬虫,这个有点复杂的。
    其中的爬虫好整,能找到现成的代码。
    关键问题在于网站的高频限制,你需要事先分析出这些网站的限制规则,常见的就那么几种,ip,帐号,如果是ip的,你就需要搞大量的肉机,或自己去阿里云上一次搞上几十台,然后分布式计算。如果是帐号的话,就要事先注册一堆帐号。这两种成本都不低。

    点赞 评论 复制链接分享
  • oyljerry oyljerry 3年前

    用python把数据导入数据库,然后通过数据库的sql来进行各种查询,这样会比较灵活,利用数据库来进行数据的各种过滤处理

    点赞 评论 复制链接分享
  • weixin_42620528 lanthon 3年前

    同时导出为excel文件。

    点赞 评论 复制链接分享

为你推荐