关于#爬虫#的问题：报错msg: "Text '中国专利 2019-06-25 2022-11-25' could not be parsed at index 0(语言-java)

java爬虫，解析html数据后，使用element.getElementsByClass(" ").text()拿去对应的class名的数据时发现有三个数据的class名一样

报错msg: "Text '中国专利 2019-06-25 2022-11-25' could not be parsed at index 0

idea，语言是springboot

Document parse = Jsoup.parse(pantenHtml );
Elements tr = parse.getElementsByClass("result-table-list").first().getElementsByTag("tr");
tr.remove(0);
for (Element element : tr) {
String date1 = element.getElementsByClass("date").text();
String date2 = element.getElementsByClass("date").text();
String date3 = element.getElementsByClass("date").text();
}

html图片：

暂时不知道如何解决

我想要达到的结果：想要这三个数据分别对应到date1，date2，date3里

写回答
好问题 0 提建议
关注问题
分享
邀请回答
编辑收藏删除
收藏举报

1条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
文盲老顾新星创作者: 信息安全技术领域 2023-02-18 00:03
关注
getElementsByClass 返回的不是一个数组么？为什么不遍历取值放到数组里？

本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决 1
无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

报告相同问题？

关注问题

JSON parse error: syntax error, expect {, actual error, pos 0, fastjson-version 1.2.58; nested excep...
2019-09-30 18:47

weixin_30390075的博客这个报错信息告诉你，你提交的参数需要是json类型。所以，POST请求携带的数据需要序列化一下json.dumps(data)。转载于:https://www.cnblogs.com/aaronthon/p/11609185.html...
Python爬虫实战：高效提取与处理日期信息的全新技术指南
2025-07-18 15:58

Python爬虫项目的博客本文将深入探讨如何使用Python爬虫技术高效提取和处理网页中的日期信息。我们将从基础的爬虫概念讲起，逐步深入到最新的异步爬虫技术、机器学习日期解析以及大规模分布式爬虫系统。文章包含详细的代码示例、性能优化...
python怎么安装scrapy_Python-2.7安装Scrapy 1.0爬虫实例
2020-11-23 12:58

weixin_39640262的博客 Scrapy，Python开发的一个快速,高层次的屏幕抓取和web抓取框架，用于抓取web站点并从页面中...它也提供了多种类型爬虫的基类，如BaseSpider、sitemap爬虫等，最新版本又提供了web2.0爬虫的支持。使用python2.7.11h...
NMAP6 网络探索和安全审计秘籍（五）
2024-07-18 11:12

绝不原创的飞龙的博客原文：annas-archive.org/md5/0DC464DD8E91DC475CC40B74E4774B2B 译者：飞龙协议：CC BY-NC-SA 4.0 第九章：编写您自己的 NSE 脚本注意本章将向您展示如何执行在许多情况下可能是非法、不道德、违反服务条款或不...
Python-2.7安装Scrapy 1.0爬虫实例
2016-04-13 14:27

TURING.DT的博客 Scrapy，Python开发的一个快速,高层次的屏幕抓取和web抓取框架，用于抓取web站点并从页面中提取结构...它也提供了多种类型爬虫的基类，如BaseSpider、sitemap爬虫等，最新版本又提供了web2.0爬虫的支持。使用python2
scrapy的name变量_scrapy使用爬取多个页面 - Come~on!
2020-12-21 04:43

weixin_39542111的博客 scrapy是个好玩的爬虫框架，基本用法就是：输入起始的一堆url，让爬虫去get这些网页，然后parse页面，获取自己喜欢的东西。。用上去有django的感觉，有settings，有field。还会自动生成一堆东西。。用法：scrapy-...
Vue及Element UI&vue-element-admin简记
2019-10-14 23:45

李小白杂货铺的博客文章目录概念索引安装vue API 基本语法 ... if (this.question.indexOf('?') === -1) { this.answer = 'Questions usually contain a question mark. ;-)' return } this.answer = 'Thinking...' ...
memcached源码分析-----set命令处理流程
2015-03-13 09:28

luotuo44的博客转载请注明出处：前一篇博文以get命令为例子把...具体的命令为“set tt 3 0 10”，并假设当然memcached服务器没有名为tt的item。读取命令：在前一篇博文的最后，conn的状态被设置为conn_new_cmd，回
Python爬虫基础入门
2019-09-21 14:38

aqcqw8464的博客网络爬虫（又被称为网页蜘蛛，网络机器人，在FOAF社区中间，更经常的称为网页追逐者），是一种按照一定的规则，自动的抓取万维网信息的程序或者脚本。一、urllib简介　python3中的urllib模块相对于Python2做了很...
趣味学RUST基础篇(异步)
2025-09-11 14:34

编码浪子的博客 ("Its title could not be parsed."), } }) } 发生了什么？ fut1 和 fut2 是两个 Future，代表“获取标题”的未来任务。 trpl::race 创建了一个新的 Future，它会同时监控 fut1 和 fut2。当其中一个先完成，race 的...
【python】requests的方法
2018-08-14 23:00

测试小白在成长_耶的博客 raise ValueError("Data must not be a string.") new_fields = [] fields = to_key_val_list(data or {}) files = to_key_val_list(files or {}) for field, val in fields: if isinstance(val, basestring...
Google内部 Python 代码风格指南(中文版)
2021-05-16 00:36

CVGao的博客 find_next_open_port(minimum) if not port: raise ConnectionError('Could not connect to service on %d or higher.' % (minimum,)) assert port >= minimum, 'Unexpected port %d when ...
Google 内部的 Python 代码风格指南
2021-05-10 00:14

菜鸟学Python的博客 find_next_open_port(minimum) if not port: raise ConnectionError('Could not connect to service on %d or higher.' % (minimum,)) assert port >= minimum, 'Unexpected port %d when ...
快快快收藏！！Google内部Python代码风格指南(中文版)
2021-03-27 00:15

菜鸟学Python的博客 find_next_open_port(minimum) if not port: raise ConnectionError('Could not connect to service on %d or higher.' % (minimum,)) assert port >= minimum, 'Unexpected port %d when ...
scrapy使用爬取多个页面
2019-09-29 04:36

as3166073的博客 scrapy是个好玩的爬虫框架，基本用法就是：输入起始的一堆url，让爬虫去get这些网页，然后parse页面，获取自己喜欢的东西。。用上去有django的感觉，有settings，有field。还会自动生成一堆东西。。用法：scrapy...
《Agentic AI 实战》第7章 DeepResearcher：基于MCP和browser-use实现深度研究Agent
2025-06-23 23:10

光子AI的博客 browser-use是基于Playwright的自动化浏览器控制库，支持以下核心能力：网页渲染与交互：可自动打开任意URL，模拟用户点击、滚动、输入等操作，突破传统爬虫的反爬机制。内容提取与结构化：支持HTML解析、正文...
【Python爬虫】写真专辑智能下载器开发全攻略：从爬虫到GUI的完整实现
2025-07-04 17:26

创客白泽的博客该项目创新性地将网络爬虫技术与PySide6图形界面结合，实现了从搜索、预览到批量下载的完整工作流。文章详细解析了多线程爬虫、请求模拟、Qt界面开发等关键技术，展示了如何构建功能完善且用户友好的专业级下载工具...
没有解决我的问题, 去提问

问题事件

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
系统已结题 2月26日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
已采纳回答 2月18日
关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
创建了问题 2月17日

关于#爬虫#的问题：报错msg: "Text '中国专利 2019-06-25 2022-11-25' could not be parsed at index 0(语言-java)

java爬虫，解析html数据后，使用element.getElementsByClass(" ").text()拿去对应的class名的数据时发现有三个数据的class名一样

idea，语言是springboot

html图片：

暂时不知道如何解决

我想要达到的结果：想要这三个数据分别对应到date1，date2，date3里

1条回答 默认 最新

问题事件

1条回答默认最新