梵印  bingo 2021-12-23 17:06 采纳率: 87.5%
浏览 102
已结题

java+selenium爬虫,获取到的List<WebElement>,遍历很慢

爬取地址:https://www.worldometers.info/coronavirus/

数据内容:

img

部分代码:

ChromeDriver chromeDriver = new ChromeDriver();
chromeDriver.get("https://www.worldometers.info/coronavirus/");
WebElement content = chromeDriver.findElement(By.id("main_table_countries_yesterday"));
List<WebElement> tr2 = content.findElements(By.tagName("tr"));
ArrayList<String> arrayList = new ArrayList<>();
        for (int i = 0; i < tr2.size(); i++) {
            WebElement webElement = tr2.get(i);
            if (i!=0&&i!=240){
                if (!webElement.getText().equals("")){
                    List<WebElement> td = webElement.findElements(By.tagName("td"));
                    StringBuilder sb = new StringBuilder();
                    for (int j = 0; j < td.size(); j++) {
                        if (j != 15) {
                            WebElement element = td.get(j);
                            sb.append(element.getText()).append(";");
                        }
                    }
                    arrayList.add(sb.toString());
                }
            }
        }
  • 写回答

1条回答 默认 最新

  • Vae 东 2021-12-23 17:23
    关注

    明天验证下.现在是多少秒

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 1月13日
  • 已采纳回答 1月5日
  • 创建了问题 12月23日