梵印  bingo 2021-12-23 09:06 采纳率: 87.5%
浏览 101
已结题

java+selenium爬虫,获取到的List<WebElement>,遍历很慢

爬取地址:https://www.worldometers.info/coronavirus/

数据内容:

img

部分代码:

ChromeDriver chromeDriver = new ChromeDriver();
chromeDriver.get("https://www.worldometers.info/coronavirus/");
WebElement content = chromeDriver.findElement(By.id("main_table_countries_yesterday"));
List<WebElement> tr2 = content.findElements(By.tagName("tr"));
ArrayList<String> arrayList = new ArrayList<>();
        for (int i = 0; i < tr2.size(); i++) {
            WebElement webElement = tr2.get(i);
            if (i!=0&&i!=240){
                if (!webElement.getText().equals("")){
                    List<WebElement> td = webElement.findElements(By.tagName("td"));
                    StringBuilder sb = new StringBuilder();
                    for (int j = 0; j < td.size(); j++) {
                        if (j != 15) {
                            WebElement element = td.get(j);
                            sb.append(element.getText()).append(";");
                        }
                    }
                    arrayList.add(sb.toString());
                }
            }
        }
  • 写回答

1条回答 默认 最新

  • Vae 东 2021-12-23 09:23
    关注

    明天验证下.现在是多少秒

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论
    梵印  bingo 2021-12-23 09:26

    一分多钟

    回复
    Vae 东 回复 梵印  bingo 2021-12-23 09:32

    网页打开太慢了

    回复
    Vae 东 回复 梵印  bingo 2021-12-23 09:33

    img

    回复
    展开全部12条评论
编辑
预览

报告相同问题?

问题事件

  • 系统已结题 1月12日
  • 已采纳回答 1月5日
  • 创建了问题 12月23日
手机看
程序员都在用的中文IT技术交流社区

程序员都在用的中文IT技术交流社区

专业的中文 IT 技术社区,与千万技术人共成长

专业的中文 IT 技术社区,与千万技术人共成长

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

关注【CSDN】视频号,行业资讯、技术分享精彩不断,直播好礼送不停!

客服 返回
顶部