如何用Java爬取网页的copyright？

谢谢了！新人不知道要怎么爬，这是老师论文中的内容，论文中写用了11种正则来抓取
请求大家支援QAQ

写回答
好问题 0 提建议
追加酬金
关注问题
分享
邀请回答
编辑收藏删除结题
收藏举报

4条回答默认最新

关注

码龄粉丝数原力等级 --

被采纳

被点赞

采纳率
tony4geek 2016-02-05 06:51
关注
jsoup

import org.jsoup.Jsoup; import org.jsoup.nodes.Document; import org.jsoup.select.Elements; public static void main(String[] args) throws IOException { Document doc = Jsoup.connect(" http://www.ccopyright.com.cn/cpcc/index.jsp") .get(); Elements es = doc.getElementsContainingOwnText("版权所有"); System.out.println(es.html().replaceAll("<([^>]*)>", "")); }
本回答被题主选为最佳回答 , 对您是否有帮助呢?

解决无用
评论打赏
分享
举报

评论

按下Enter换行，Ctrl+Enter发表内容

查看更多回答(3条)

报告相同问题？

关注问题

java nio scoket的连接问题 java
2014-01-17 13:34

回答 1 已采纳楼主想表达什么意思？第一个连接到百度第二个连接到的是你本机的80.他们输出当然不一样啊？HTTP协议的话需要指定下HOST就行了，不然默认会按ip解析请求
关于解决no setter found for property 'prefix' in class 的问题！(语言-java|开发工具-eclipse) eclipse java spring
2021-12-26 23:54

回答 1 已采纳感觉你配置文件的class写错了，配置的应该是视图解析器，而不是视图 org.springframework.web.servlet.view.InternalResourceViewResolver
Javaweb登陆界面验证码不显示，是一个x，且后台也没有验证码？ bootstrap java javascript 有问必答
2021-06-09 17:10

回答 2 已采纳你看下这个接口LoginServlet?method=GetVCode，返回的内容是什么。
java如何停止当前正在运行的线程，新手求解答 java
2013-09-10 02:08

回答 1 已采纳你这个只要停止方法即可停止线程比如 new GPRSRemoteServer();这句代码是在线程中执行的你改成全局定义一个变量 GPRSRemoteSe
爬取指定类型图片.求解！！ python 爬虫
2022-06-10 17:09

回答 4 已采纳 1、为什么只能爬到猫猫类的？这个跟你输入label1 = str(input("输入指定的类型:"))这句有关，虽然你后边a1 = list(label1)给它定义成列表，但转成列表后就不是你想要的意
html页面渲染不出来 java
2020-06-03 22:07

回答 1 已采纳 <html xmlns="http://www.w3.org/1999/xhtml" xmlns:th="http://www.thymeleaf.org">
centos7下，tomcat启动成功，但页面无法访问 java spring tomcat
2019-07-30 00:39

回答 5 已采纳执行shutdown.sh的时候就报错了，经验之谈，你这个应该是server.xml这个配置文件有问题，导致执行start.sh时tomcat没有启动成功，执行shutdown.sh的时候报错。建
Java实现短信验证码发送功能
2016-08-03 13:46

回答 4 已采纳 zhe这需要那个第三方的jar包吧
spring boot项目中使用Runtime.exec()调用pyhton脚本没有反应 java python spring ubuntu
2019-01-03 15:06

回答 2 已采纳尝试用 tputStream ops = process.getOutputStream(); 然后看ops里是什么 ``` Process process = Runtime.getRunt
没有解决我的问题, 去提问

悬赏问题

¥15 这个复选框什么作用？
¥15 单通道放大电路的工作原理
¥30 YOLO检测微调结果p为1
¥20 求快手直播间榜单匿名采集ID用户名简单能学会的
¥15 DS18B20内部ADC模数转换器
¥15 做个有关计算的小程序
¥15 MPI读取tif文件无法正常给各进程分配路径
¥15 如何用MATLAB实现以下三个公式（有相互嵌套）
¥30 关于#算法#的问题：运用EViews第九版本进行一系列计量经济学的时间数列数据回归分析预测问题求各位帮我解答一下
¥15 setInterval 页面闪烁，怎么解决

如何用Java爬取网页的copyright？

4条回答 默认 最新

悬赏问题

4条回答默认最新