梵印  bingo 2021-12-23 17:06 采纳率: 78.3%
浏览 95
已结题

java+selenium爬虫,获取到的List<WebElement>,遍历很慢

爬取地址:https://www.worldometers.info/coronavirus/

数据内容:

img

部分代码:

ChromeDriver chromeDriver = new ChromeDriver();
chromeDriver.get("https://www.worldometers.info/coronavirus/");
WebElement content = chromeDriver.findElement(By.id("main_table_countries_yesterday"));
List<WebElement> tr2 = content.findElements(By.tagName("tr"));
ArrayList<String> arrayList = new ArrayList<>();
        for (int i = 0; i < tr2.size(); i++) {
            WebElement webElement = tr2.get(i);
            if (i!=0&&i!=240){
                if (!webElement.getText().equals("")){
                    List<WebElement> td = webElement.findElements(By.tagName("td"));
                    StringBuilder sb = new StringBuilder();
                    for (int j = 0; j < td.size(); j++) {
                        if (j != 15) {
                            WebElement element = td.get(j);
                            sb.append(element.getText()).append(";");
                        }
                    }
                    arrayList.add(sb.toString());
                }
            }
        }
  • 写回答

1条回答 默认 最新

  • Vae 东 2021-12-23 17:23
    关注

    明天验证下.现在是多少秒

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 1月13日
  • 已采纳回答 1月5日
  • 创建了问题 12月23日

悬赏问题

  • ¥15 Attention is all you need 的代码运行
  • ¥15 一个服务器已经有一个系统了如果用usb再装一个系统,原来的系统会被覆盖掉吗
  • ¥15 使用esm_msa1_t12_100M_UR50S蛋白质语言模型进行零样本预测时,终端显示出了sequence handled的进度条,但是并不出结果就自动终止回到命令提示行了是怎么回事:
  • ¥15 前置放大电路与功率放大电路相连放大倍数出现问题
  • ¥30 关于<main>标签页面跳转的问题
  • ¥80 部署运行web自动化项目
  • ¥15 腾讯云如何建立同一个项目中物模型之间的联系
  • ¥30 VMware 云桌面水印如何添加
  • ¥15 用ns3仿真出5G核心网网元
  • ¥15 matlab答疑 关于海上风电的爬坡事件检测