具有理想型 2023-02-17 23:57 采纳率: 100%
浏览 17
已结题

关于#爬虫#的问题:报错msg: "Text '中国专利 2019-06-25 2022-11-25' could not be parsed at index 0(语言-java)

java爬虫,解析html数据后,使用element.getElementsByClass(" ").text()拿去对应的class名的数据时发现有三个数据的class名一样

报错msg: "Text '中国专利 2019-06-25 2022-11-25' could not be parsed at index 0

idea,语言是springboot
Document parse = Jsoup.parse(pantenHtml );
Elements tr = parse.getElementsByClass("result-table-list").first().getElementsByTag("tr");
tr.remove(0);
for (Element element : tr) {
String date1 = element.getElementsByClass("date").text();
String date2 = element.getElementsByClass("date").text();
String date3 = element.getElementsByClass("date").text();
}
html图片:

img

暂时不知道如何解决
我想要达到的结果:想要这三个数据分别对应到date1,date2,date3里
  • 写回答

1条回答 默认 最新

  • 文盲老顾 WEB应用领新星创作者 2023-02-18 00:03
    关注

    getElementsByClass 返回的不是一个数组么?为什么不遍历取值放到数组里?

    本回答被题主选为最佳回答 , 对您是否有帮助呢?
    评论

报告相同问题?

问题事件

  • 系统已结题 2月26日
  • 已采纳回答 2月18日
  • 创建了问题 2月17日

悬赏问题

  • ¥60 许可证msc licensing软件报错显示已有相同版本软件,但是下一步显示无法读取日志目录。
  • ¥15 Attention is all you need 的代码运行
  • ¥15 一个服务器已经有一个系统了如果用usb再装一个系统,原来的系统会被覆盖掉吗
  • ¥15 使用esm_msa1_t12_100M_UR50S蛋白质语言模型进行零样本预测时,终端显示出了sequence handled的进度条,但是并不出结果就自动终止回到命令提示行了是怎么回事:
  • ¥15 前置放大电路与功率放大电路相连放大倍数出现问题
  • ¥30 关于<main>标签页面跳转的问题
  • ¥80 部署运行web自动化项目
  • ¥15 腾讯云如何建立同一个项目中物模型之间的联系
  • ¥30 VMware 云桌面水印如何添加
  • ¥15 用ns3仿真出5G核心网网元