android怎么用正则表达式,截取html中的<p>内容?

![图片说明](https://img-ask.csdn.net/upload/201604/23/1461402582_756815.png)图片说明

0

6个回答

![图片说明](https://img-ask.csdn.net/upload/201604/23/1461402664_408990.png)图片说明

0
qq_26365019
重重姒姒 这是一部分网页
大约 3 年之前 回复

用Pattern和Matcher
正则表达式:
String reg = "<p.*?>.+?</p>";
申明的时候忽略大小写匹配。
不断的用Matcher的find来就行组个匹配。
最后获取到的就是p标签了

0
w172087242
little_how 回复绮蓁尔: 如果对你有帮助,麻烦结贴。Pattern.CASE_INSENSITIVE参数表示忽略大小写,因为标签有时是大写有时是小写。
大约 3 年之前 回复
w172087242
little_how 回复绮蓁尔: String html = "<P style=\"123df\"'>sdfsdf</p>sdfjklsdf<p style=\"color:red;left:10px;\">jdklfjl<div>djf</div></p>"; String reg = "<p.*?>.+?</p>"; Pattern p = Pattern.compile(reg, Pattern.CASE_INSENSITIVE); Matcher m = p.matcher(html); while(m.find()){ System.out.println(m.group()); }
大约 3 年之前 回复
w172087242
little_how 回复绮蓁尔: String reg = "<p.*?>.+?</p>";Pattern p = Pattern.compile(reg); Matcher m = p.matcher(your html); while(m.find){ System.out.println(m.group());}
大约 3 年之前 回复
qq_26365019
重重姒姒 能详细些么?
大约 3 年之前 回复

Pattern pattern=Pattern.compile("

(.+?)");
Matcher matcher=pattern.matcher("你的内容");
if(matcher.find()){
System.out.println(matcher.group(1));
}
0

我的土办法:
String [] contents=html.spilt("

");
String reg="

";
String content;
for(int i=0;i<contents.length;i++){
content=contents[i];
content[i]=content.subString(content.indexOf(reg)+reg.length,congent.length-1);
}

System.out.println(contents.toString());

0

我的土办法:


String [] contents=html.spilt("</p>");
String reg="<p  style=\"text-indent:2em ; padding: 3px  0px ;\">";
String content;
for(int i=0;i<contents.length;i++){
content=contents[i];
contents[i]=content.subString(content.indexOf(reg)+reg.length,congent.length-1);
}

System.out.println(contents.toString());
0

直接用Jsoup解析HTML即可

0
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
js正则表达式--获取标签内的文本
先抓取 &amp;gt;文本&amp;lt;/,再抓取 文本nfunction fn(str){n var patt1=/\&amp;gt;.[\u2E80-\u9FFF]*\&amp;lt;\//g;n var arr=str.match(patt1);n var patt2=/[\u4e00-\u9fa5]/g;n var arr2=arr[0].match(patt2);n return arr2.join('') ...
[python] 常用正则表达式爬取网页信息及分析HTML标签总结
这篇文章主要是介绍Python爬取网页信息时,经常使用的正则表达式及方法。它是一篇总结性文章,实用性比较大,主要解决自己遇到的爬虫问题,也希望对你有所帮助~n1.获取<tr></tr>标签之间内容 2.获取<a href..></a>超链接之间内容 3.获取URL最后一个参数命名图片或传递参数n4.爬取网页中所有URL链接 5.爬取网页标题title两种方法 6.定位table位置并爬取属性-属性值 7.过滤<span></span>等标签 8.获取<script></script>等标签内容
java利用正则表达式截取想要的内容
下面代码是从a.txt中读取内容并且输出,且输出想要截取的内容。nn直接甩代码:nnnnimport java.io.BufferedReader;nimport java.io.FileInputStream;nimport java.io.IOException;nimport java.io.InputStreamReader;nimport java.util.regex.Matcher;...
python中使用正则表达式取出html标签
n# 方法 1npre = re.compile('&amp;gt;(.*?)&amp;lt;')ns1 = ''.join(pre.findall(htmlString))nprint(s1) # '随笔文章日记评论链接相册文件设置选项'n n n# 方法 2ns2 = re.sub(r'&amp;lt;.*?&amp;gt;','',htmlString)nprint(s2) # '\n\n随笔\n文章\n日记\n评...
java/android 正则表达式去除所有HTML标签
protected string str = "sdasasdsddsdsaaassss<img src='http://www.baidu.com/img/baidu_logo.gif' width='100' height='50'rn alt=''> 说是道 ";rnprotected void Page_Load(object sender, EventArgs e)rn{rn//stri
正则提取html网页中字符串
方式一:rnrnRULES = [n [r'', ''],n [r'', ''],n [r'', '\n'],n [r'', '\n'],n [r']+?>', ''],n [r'&nbsp;', ' '],n [r'&amp;', '&'],n [r'&lt;', '],n [r'&gt;', '>'],n [r'&quot;', '"
Android提取HTML代码内的所有文字内容
需求是:TextView只显示HTML里的纯文字内容,去掉CSS样式、超链接、图片等等。解决方法:用正则表达式匹配并清除掉各种HTML标签。嗯,就这样干。
android 通过正则表达式遍历html中所有的img标签
String reg = "<img.*?>";nPattern pattern = Pattern.compile(reg);nMatcher matcher = pattern.matcher(sendString);//sendString为网页源码n//使用find()方法查找第一个匹配的对象 nboolean result = matcher.find(); n//使用循环找出 html里
正则表达式提取HTML文本中的图片图片
/**n* 截取 HTML 文本中的图片n* @param htmlStrn* @returnn*/npublic static List getImgStr(String htmlStr) {nString img = "";nPattern p_image;nMatcher m_image;nList pics = new ArrayList();nString regEx
Android使用正则表达式获取字符串
Android通过正则表达式从指定字符串中,获取满足正则表达式的所有字符串,下面我们来看看怎么实现?正则表达式获取字符串用正则表达式从一个字符串中取出所有满足正则表达式的字符串,代码如下:/**n* 获取所有满足正则表达式的字符串n* @param str 需要被获取的字符串n* @param regex 正则表达式n* @return 所有满足正则表达式的字符串n*/nprivate ArrayL
利用正则表达式爬取HTML页面内容
闲来使用正则表达式做了一个HTML页面的数据爬虫,主要是根据页面规则去匹配相应字段内容,记录一下。n利用HttpGet获取页面内容,使用pattern获取匹配内容nCloseableHttpClient client = HttpClientBuilder.create().build();n long t = new Date().getTime();n for (i...
正则表达式去除数据带HTML标签方法
新的消息列表接口,后台返回的简要说明和详细说明是一个字段,还是带HTML标签的字段,只能自行 去除HTML标签。
Java中用正则表达式截取“()”之间的内容
nPattern pattern = Pattern.compile(&quot;(?&amp;lt;=\\()(.+?)(?=\\))&quot;);nMatcher matcher = pattern.matcher(匹配的内容);nwhile(matcher.find()){n 返回的数据= matcher.group();n }nn 
火车头采集器 截取字符串 正则表达式
有时需要从采集内容或者网址中截取部分字符串,可以使用正则表达式截取rn如从/.../中截取出来,\/[\w]+\/,截取/example/字符串,含//符号,非常实用rnrnrn附录:rn以此网址为列 http://tieba.baidu.com/p/2376714043 采集 标题、时间、邮箱 来讲解 rnrn标题我们需要采集和 中间的内容rnrn写法 (?[\s\S]*?)rn这种与 正则参数
js中用正则表达式根据某个关键字截取此关键字之后的字符串
问题描述:一段字符串里面有多个关键字,把此关键字之后的字符串截取出来一起组成一个键值对 n我的思路是用什么来截取,JavaScript提供了三种截取字符串中子串的方法: n1.substring(str,end) nstr是必须输入,必须是正值; nend是可选的必须是正值; n根据字面意思,str为截取的开始位置,字符串的第一个字符位置为0;end为截取的结束位置. nsubstring() 方法
正则提取html 标签内容
例如:n&amp;lt;script&amp;gt;nvar str='&amp;lt;a&amp;gt;132123213&amp;lt;/a&amp;gt;&amp;lt;img/&amp;gt;&amp;lt;b&amp;gt;&amp;lt;b&amp;gt;'nvar afstr=str.replace(/&amp;lt;[^&amp;gt;]+&amp;gt;/g,&quot;&quot;)nalert(str)//&amp;lt;a&amp;gt;132123213&amp;lt;/a&amp
Android中如何提取HTML源码内的所有文字内容
前言近期一个需求,要提取到网页源码中的文字,然后对这些文字做进一步的处理,首先想到的就是正则表达式,那么下边说一下怎么用正则表达式来提取到文字内容。做法①我们得到的HTML源码,是带有格式的,比如换行,缩进等,所以我们首先要对这些内容进行清除。private String regMatchEnter="\\s*|\t|\r|\n";上面对应的分别是空格,制表符,回车,换行的正则表达式,然后匹配到后,
android 开发--抓取网页解析网页内容的若干方法(网络爬虫)(正则表达式)
网页有两种格式,一种是xml另一种是html,目前似乎好像大部分都是html格式的,查看网页格式的方法是在浏览器中右键-->查看源码n一,XML解析的三大方法n(1) SAX: Simple API for XMLnSAX是一个解析速度快并且占用内存少的XML解析器。SAX解析XML文件采用的是事件驱动,也就是它并不需要解析完整个文档,n在按内容顺序解析文档的过程中,SAX会判断当前读到的
正则表达式匹配网页标签内容
推荐一个在线正则表示试测试网站:http://tool.oschina.net/regex/#nn1,得到网页上的链接地址:nstring matchString = @&quot;&amp;lt;a[^&amp;gt;]+href=\s*(?:'(?&amp;lt;href&amp;gt;[^']+)'|&quot;&quot;(?&amp;lt;href&amp;gt;[^&quot;&quot;]+)&quot;&quot;|(?&amp;lt;href&amp;gt;[^&amp;gt;\s]+))
正则匹配HTML标签(div,p等~~)适用于replace
var newMsgHandle =whatSay.replace(//g, '')rnrnrn上面是一个字符串中替换掉所有div标签的小例子,上面的征辟适用于所有html标签的匹配,只要将替换即可简单实用有帮助的点个赞
使用正则表达式提取字符串中的内容
[code=&quot;java&quot;]package cn.com.songjy.test;rnrnimport java.util.regex.Matcher;rnimport java.util.regex.Pattern;rnrnpublic class RegexTest {rnrn public static void main(String[] args) {rn String regex = ...
java根据 正则表达式解析html网页内容
仅供参考:rnimport java.io.DataInputStream;nimport java.io.File;nimport java.io.FileOutputStream;nimport java.io.IOException;nimport java.net.MalformedURLException;nimport java.net.URL;nimport java.util.Ar
正则表达式去除html标签
大部分博客网站的首页文章的内容都是截取了文章的一部分,然后点击“查看更多”才能看完整的文字。所以,截取字符串是必不可少的。rn但是如果我们直接用 substring 截取,会出现很多问题。比如样式不会改变,加粗的,文字颜色都不会去掉。还有就是一个 html标签如可能会被截成两段,导致后面的文字全部加粗之类的。这种情况绝不允许。rn像下图的,首页文章列表中 部分文章颜色全部变红,截取不正当导致。rn
Python小白爬虫(二) _使用正则表达式获取页面中我们想要的数据(案例)
Python使用正则表达式获取想要的数据n上篇文章我们说了如果通过requests get 获取到我们的页面内容,不过页面的内容太多了,我们需要找到指定的内容就一定要通过其他的模块来获取,我们这篇文章主要就是写个正则表达式获取页面a标签的案例。这个 案例非常简单,n废话不多说了,上代码:n# -*- coding: UTF-8 -*-nimport requests # 导入requests包n...
C# 处理html 标签一些正则表达式 整理收集
1:取得A 标签中的内容或者 url titlen岛上书店&nbsp;[专著]&nbsp;=&nbsp;The storied life of A.J.Fikrynn(?is)]|\1).)+\1>(?(?:(?!n(?is)(?]+>)((?!n]*>([\s\S]+?)n//替换掉A标签nvar billno = Regex.Replace(item.WorldexSinotra
正则表达式提取电话号码
android中在字符串中提取电话号码package app.myapplication;import android.os.Bundle;nimport android.support.v7.app.ActionBarActivity;import java.util.ArrayList;nimport java.util.regex.Matcher;nimport java.util.regex
Java 正则 , 截取两个特殊字符之间字符串
String formula = &quot;【1】【2】【3】&quot;;String regex = &quot;【([^】]*)】&quot;;Pattern pattern = Pattern. compile(regex);Matcher matchar = pattern.matcher(formula);while (matchar.find()) {      System.out.println(matchar.gr...
利用正则获取script标签内的内容
var regJs = &quot;&quot;;nnvarresdata = &quot;nn&amp;lt;style&amp;gt;n #slyderAdv {n height: 100%; background: #f02e38;n }n&amp;lt;/style&amp;gt;n&amp;lt;div class=&quot;tmp-editable&quot; id=&quot;slyderAdv&quot;n&amp;lt;/div&amp;gt;n&amp;lt;script&amp;g
java正则表达式获取指定HTML标签的指定属性值且替换
public static String repDomain(String source, String domain, String element, String attr) {nn String img = "";n Pattern p_image;n Matcher m_image;n String regEx_img = "]*?\
js 使用正则截取字符串中两字符中的内容
var text = '活动名称:{{keyword1.DATA}}'n var regex=/\{\{(.+?)\./g;n var result;n while((result=regex.exec(text))!=null) {n console.log(result[1]);n console.log(&quot;!!!!!!!!!!!!!!!!!!!!!!!!...
Java正则表达式获取指定HTML标签的指定属性值
在上一篇文章中写到导出图片到EXCEL表格中,因为我保存的是图片路径,所以需要获取img标签下src属性的属性值,刚开始只存了一个图片,所以我想着用substring来截取,但是效果并不好,如果是获取多张图片则存在弊端,此时就想到用正则来获取,以下代码可放到工具类中直接调用即可。rnrnpackage com.mmq.regex;rnrnimport java.util.ArrayList; rnimpor...
正则表达式初探-获取<p class='demo'>hello icketang</p>内部文案
var reg = /^<.+>.+<.+>$/;n // console.log(reg.exec("<p class='demo'>hello icketang</p>"));n var str = "<p class='demo'>hello icketang</p>".replace(/^<.+>(.+)<.+>$/,function(match,$1){
使用正则表达式处理html标签方案分享
首先呢,阅读本文前建议大家去读下这篇文章点击打开链接,是关于java正则工具类Matcher相关的一些探讨和建议n下面这是其中一项关于处理匹配内容替换的范例,nnappendReplacement() + appendTail()组合nnnimport java.util.regex.Pattern;nimport java.util.regex.Matcher;nnpublic cl
asp.net正则表达式提取网址、标题、图片等
1、asp.net正则表达式提取网址、标题、图片等nn例如,有如下的字符串:nn&amp;lt;li&amp;gt;&amp;lt;a href=&quot;http://www.webkaka.com/blog/archives/how-to-add-links-on-baidu-blog.html&quot; title=&quot;怎样在百度空间添加友情链接&quot;&amp;gt;&amp;lt;span class=&quot;article-date&quot;&amp;gt;[14/11..
正则表达式截取指定字符串内容
获取某个字符串中某一部分的字符内容,通常大家会首先想到使用String.substring方法,但String.substring方法对于某些包含特殊字符和HTML标签的处理不是很完善。例如如下字符串,想要获取sign中的字符,用String.subString方法虽然也能拿到sign中的内容,但有缺陷....rnString str="rn                "&subject=\"
正则表达式表示html
1、获标签之间内容
截取html标签里面的文本
String html = shareContent.getHtml();Document document = Jsoup.parse(html);String summary = document.getAllElements().get(0).text();if(summary.length() &amp;gt; 100){    summary = summary.substring(0, 100...
MySQL字符串截取 和 截取字符进行查询
Mysql字符串截取 和 截取字符进行查询一、MySQL中字符串的截取 n MySQL中有专门的字符串截取函数:其中常用的有两种:substring_index(str,delim,count) 和concat n 1.substring_index(str,delim,count) 函数的使用较为普遍。 n 函数括号里面的依次为:要分隔截取的字符串(如:”aaa_bbb_
Ruby 正则表达式(二)
使用quote方法的正则表达式n有时候我们想转义正则表达式中所有的元字符。而quote方法就可以实现。quote 方法会返回转义了的正则表达式字符串,然后在结合new方法,就可以生成新的正则表达式对象。nre1 = Regexp.new("abc*def")nnre2 = Regexp.new(Regexp.quote("abc*def"))nnp (re1 = ~ "abc*def")
C#正则表达式 解析html+table tr td 内容
aspx页面获取方法:n   var tbZHXX = GetWorldexWyHtml(s, @"id=""tbZHXX""", @"class=""GridCommonItem""", "Worldex");nn提交参数及隐藏hiddle值nvar postUrl = "http://xxm.cn/glj/querydata/xxSearchOld.aspx";
文章热词 机器学习教程 Objective-C培训 交互设计视频教程 颜色模型 设计制作学习
相关热词 mysql关联查询两次本表 native底部 react extjs glyph 图标 产品经理+p课程 产品经理p课程