如何用Java爬取网页的copyright？

谢谢了！新人不知道要怎么爬，这是老师论文中的内容，论文中写用了11种正则来抓取
请求大家支援QAQ

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
tony4geek 2016-02-05 06:51
关注
jsoup

import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.select.Elements; public static void main(String[] args) throws IOException { Document doc = Jsoup.connect(" http://www.ccopyright.com.cn/cpcc/index.jsp") .get(); Elements es = doc.getElementsContainingOwnText("版权所有"); System.out.println(es.html().replaceAll("<([^>]*)>", "")); }
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

如何用Java爬取网页的copyright？ java
2016-02-05 03:44

回答 4 已采纳 [jsoup](http://jsoup.org/download "") ``` import org.jsoup.Jsoup; import org.jsoup.nodes.Docu
java nio scoket的连接问题 java
2014-01-17 13:34

回答 1 已采纳楼主想表达什么意思？第一个连接到百度第二个连接到的是你本机的80.他们输出当然不一样啊？HTTP协议的话需要指定下HOST就行了，不然默认会按ip解析请求
关于解决no setter found for property 'prefix' in class 的问题！(语言-java|开发工具-eclipse) eclipse java spring
2021-12-26 23:54

回答 1 已采纳感觉你配置文件的class写错了，配置的应该是视图解析器，而不是视图 org.springframework.web.servlet.view.InternalResourceViewResolver
java爬虫系列（二）——爬取动态网页
2018-01-01 15:59

Mr_OOO的博客准备工作项目地址网页解析工具地址启动网页解析器根据系统选择所需文件 ...新手的话推荐使用seimiagent+seimicrawler的爬取方式，非常容易上手，轻松爬取动态网页，目测初步上手10分钟以内...
Javaweb登陆界面验证码不显示，是一个x，且后台也没有验证码？ bootstrap java javascript 有问必答
2021-06-09 17:10

回答 2 已采纳你看下这个接口LoginServlet?method=GetVCode，返回的内容是什么。
java如何停止当前正在运行的线程，新手求解答 java
2013-09-10 02:08

回答 1 已采纳你这个只要停止方法即可停止线程比如 new GPRSRemoteServer();这句代码是在线程中执行的你改成全局定义一个变量 GPRSRemoteSe
爬取指定类型图片.求解！！ python 爬虫
2022-06-10 17:09

回答 4 已采纳 1、为什么只能爬到猫猫类的？这个跟你输入label1 = str(input("输入指定的类型:"))这句有关，虽然你后边a1 = list(label1)给它定义成列表，但转成列表后就不是你想要的意
JAVA爬取网站查询网络IP所在地
2019-12-05 14:35

panlupeng的博客 JAVA爬取网站查询网络IP所在地网络中我们上网都是一个ip地址，在获取对象网络ip的时候，如果想查询他所在网络的地址怎么搞呢？上代码 1.写一个方法通过站长工具网站查询到你输入的ip的地址，需要用URL去爬取网站...
spring boot项目中使用Runtime.exec()调用pyhton脚本没有反应 java python spring ubuntu
2019-01-03 15:06

回答 2 已采纳尝试用 tputStream ops = process.getOutputStream(); 然后看ops里是什么 ``` Process process = Runtime.getRunt
Java实现短信验证码发送功能
2016-08-03 13:46

回答 4 已采纳 zhe这需要那个第三方的jar包吧
centos7下，tomcat启动成功，但页面无法访问 java spring tomcat
2019-07-30 00:39

回答 5 已采纳执行shutdown.sh的时候就报错了，经验之谈，你这个应该是server.xml这个配置文件有问题，导致执行start.sh时tomcat没有启动成功，执行shutdown.sh的时候报错。建
Java爬取网页图片携带header认证访问
2023-08-14 17:16

Java毕计的博客要在有html元素有的情况下，才能通过jsoup来爬虫，如果是这接口获得的数据，那么通过jsoup是无法获取到的。java爬虫在爬取网络的数据用到了jsoup中的方法,在下载css,img和创建html就用到了I/O流。
html页面渲染不出来 java
2020-06-03 22:07

回答 1 已采纳 <html xmlns="http://www.w3.org/1999/xhtml" xmlns:th="http://www.thymeleaf.org">
java抓取网站数据
2022-11-12 17:14

猫一样的女子245的博客 java 抓取网站数据假设你需要获取51job 人才网上java 人才的需求数量，首先你需要分析51job 网站的搜索这一块是怎么运作的，通过解析网页的源代码，我们发现了以下一些信息： 1. 搜索时页面请求的URL 是 ...
java+HttpClients实现百度图片批量爬取
2021-04-25 23:12

谨衡的博客在网页上右键单击，弹出菜单中选择“检查”，进入开发者模式。选择Network，并且选中XHR后，滑动滚轮，更多图片会自动加载，左侧框中出现一些文件名类似的文件，再选择Headers窗口。然后我们就可以在窗口中的...
Java利用JSoup工具包爬取网站数据
2021-03-09 14:28

CoreCmd的博客 jsoup 是一款Java 的HTML解析器，可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API，可通过DOM，CSS以及类似于jQuery的操作方法来取出和操作数据。有了它，我们就可以很轻松的获取某个web页面的...
elasticSearch的基本使用加项目实战(Java爬取数据+elasticSearch)
2022-05-07 10:40

码上在线的博客找官网 Welcome to Elastic Docs | Elastic elasticsearch的官方文档 Java REST Client [7.17] | Elastic 同时也可以在这个官网上面查看到我们的这个maven依赖我们的这个maven依赖，注意这个依赖的版本要和我的这...
Java 爬取BiliBili追番排行榜
2019-10-02 15:49

拾荒的小咸鱼的博客看了標哥（代码忘烦恼）两篇爬虫博客，自己...java爬取前程无忧(51job) 准备工作：创建一个普通maven工程 pom依赖 <dependencies> <dependency> <groupId>org.apache.httpcomponents</g...
Java 爬取BiliBili番剧封面图
2019-10-03 19:36

拾荒的小咸鱼的博客本次爬取使用到了Jsoup，不知道的朋友可以学一下官方文档准备工作：创建一个普通maven工程 pom依赖 <dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</...
（Java篇）爬取微信公众号文章并保存为 PDF 格式
2019-05-28 14:12

幕后眼光的博客好像代码也不是特别多，哈哈，然后把爬取的数据保存到一个 txt 文本文件里面，我这边用的格式是：时间-@@-标题-@@-链接（后面方便使用“-@@-”分割字符串），当然你也可以连接 Mysql，来存储信息，我就偷懒了...
没有解决我的问题, 去提问

悬赏问题

¥15 深度学习根据CNN网络模型，搭建BP模型并训练MNIST数据集
¥15 lammps拉伸应力应变曲线分析
¥15 C++ 头文件/宏冲突问题解决
¥15 用comsol模拟大气湍流通过底部加热（温度不同）的腔体
¥50 安卓adb backup备份子用户应用数据失败
¥20 有人能用聚类分析帮我分析一下文本内容嘛
¥15 请问Lammps做复合材料拉伸模拟，应力应变曲线问题
¥30 python代码，帮调试，帮帮忙吧
¥15 #MATLAB仿真#车辆换道路径规划
¥15 java 操作 elasticsearch 8.1 实现索引的重建

如何用Java爬取网页的copyright？

4条回答 默认 最新

悬赏问题

4条回答默认最新