python sax模块解析xml遇到非法字符怎么解决? 1C

用python的sax模块解析xml的时候出现非法字符直接停止了,百度搜到有大神说用回调函数处理当前的非法字符或者跳过直接运行接下来的内容。不过具体应该怎么实现呢?求大神赐教。下面是我的代码,非法字符是出现再其中的很多个tagname="url"中的内容,能在原来的基础上改就更好了,再次感谢

import xml.sax

class XmlHandler( xml.sax.ContentHandler ):
    def __init__(self):
        self.CurrentData = ""
        self.url = ""
        self.id = ""
        self.detail = ""

   # 元素开始事件处理
    def startElement(self, name,attr):
        self.CurrentData = name
        if name == "entry":
            print("*****Entry*****")

   # 元素结束事件处理
    def endElement(self, name):
        if self.CurrentData == "url":
            print("url:", self.url)
        elif self.CurrentData == "phish_id":
            print("phish_id:", self.id)
        elif self.CurrentData == "phish_detail_url":
            print("phish_detail_url:", self.detail)
        self.CurrentData = ""
   # 内容事件处理
    def characters(self, content):
        if self.CurrentData == "url":
            self.url = content
        elif self.CurrentData == "phish_id":
            self.id = content
        elif self.CurrentData == "phish_detail_url":
            self.detail = content
        else:


if __name__ == "__main__":
    # 创建一个 XMLReader
    parser = xml.sax.make_parser()
    # turn off namepsaces
    parser.setFeature(xml.sax.handler.feature_namespaces, 0)

    # 重写 ContextHandler
    Handler = XmlHandler()
    parser.setContentHandler( Handler )
    parser.parse("online-valid.xml")

1个回答

这是一个非法的 XML,正常的解析应该拿它没办法。

如果你确定这个 XML 文档里面不可能出现任何的 XML entity,可以先替换 & 字符为 & 再解析。

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
Sax解析xml可不可以不需要用JavaBean?
Sax解析xml可不可以不需要用JavaBean?Sax解析xml可不可以不需要用JavaBean?Sax解析xml可不可以不需要用JavaBean?
SAX解析XML文件出现中文乱码问题
我用tomcat搭建了服务器,然后客户端从服务器端下载xml文件并进行解析,但是解析完成后输出的内容中,中文内容出现了乱码。我将服务器端的xml编码格式设置为: <?xml version="1.0" encoding="GBK"?>,然后在修改程序代码: ``` InputSource inputSource = new InputSource(new StringReader(xmlStr)); inputSource.setEncoding("GBK"); xmlReader.parse(inputSource); ``` 结果中文输出的还是乱码。请问该问题怎么解决?
SAX无法解析root。不知道是不是bug
有两种情况 这种格式化的XML是能解析: ``` <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> </xml> ``` 没有格式化不能被正确解析: ``` <xml><return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> </xml> ``` 解析到<xml>就解析不出标签.不执行此方法 public void characters(char ch[], int start, int length) ``` import java.io.ByteArrayInputStream; import java.util.LinkedHashMap; import java.util.Map; import java.util.Vector; import javax.xml.parsers.SAXParser; import javax.xml.parsers.SAXParserFactory; import org.json.simple.JSONObject; import org.xml.sax.Attributes; import org.xml.sax.SAXException; import org.xml.sax.helpers.DefaultHandler; public class XMLParser extends DefaultHandler { private Vector<String> tagName; private Vector<String> tagValue; private int step; private Map<String, String> map = new LinkedHashMap<String, String>(); // 开始解析XML文件 public void startDocument() throws SAXException { tagName = new Vector<String>(); tagValue = new Vector<String>(); step = 0; } // 结束解析XML文件 public void endDocument() throws SAXException { for (int i = 0; i < tagName.size(); i++) { if (!tagName.get(i).equals("") || tagName.get(i) != null) { map.put(tagName.get(i), tagValue.get(i)); //System.out.println("节点名称:" + tagName.get(i)); //System.out.println("节点值:" + tagValue.get(i)); } } } /** * 在解释到一个开始元素时会调用此方法.但是当元素有重复时可以自己写算法来区分 这些重复的元素.qName是什么? <name:page * ll=""></name:page>这样写就会抛出SAXException错误 通常情况下qName等于localName */ public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException { tagName.add(qName);// 节点名称 /* for (int i = 0; i < attributes.getLength(); i++) {// 循环输出属性 System.out.println("属性名称:" + attributes.getQName(i));// 获取属性名称 System.out.println("属性值:"+ attributes.getValue(attributes.getQName(i)));// 获取属性值 } */ } /** * 在遇到结束标签时调用此方法 */ public void endElement(String uri, String localName, String qName) throws SAXException { step = step + 1; } /** * 读取标签里的值,ch用来存放某行的xml的字符数据,包括标签,初始大小是2048, 每解释到新的字符会把它添加到char[]里。 * * 注意,这个char字符会自己管理存储的字符, 并不是每一行就会刷新一次char,start,length是由xml的元素数据确定的, * 暂时找不到规律,以后看源代码. * * 这里一个正标签,反标签都会被执行一次characters,所以在反标签时不用获得其中的值 */ public void characters(char ch[], int start, int length) throws SAXException { // 只要当前的标签组的长度一至,值就不赋,则反标签不被计划在内 if (tagName.size() - 1 == tagValue.size()) { tagValue.add(new String(ch, start, length)); } } public Map<String, String> xmlConvertMap(String xmlContent){ SAXParserFactory spf = SAXParserFactory.newInstance(); try { SAXParser saxParser = spf.newSAXParser(); XMLParser parseXML = new XMLParser(); saxParser.parse(new ByteArrayInputStream(xmlContent.getBytes("utf-8")), parseXML); return parseXML.map; } catch (Exception e) { e.printStackTrace(); } return null; } @SuppressWarnings("unchecked") public JSONObject xmlConvertJson(String xmlContent){ Map<String, String> tempMap = xmlConvertMap(xmlContent); JSONObject json = new JSONObject(); json.putAll(tempMap); return json; } } ```
求助SAX解析XML时为什么不加上stack.pop()无法打印出元素文本内容?
package com.shengsiyuan.xml.sax; import java.io.File; import java.util.Stack; import javax.xml.parsers.SAXParser; import javax.xml.parsers.SAXParserFactory; import org.xml.sax.Attributes; import org.xml.sax.SAXException; import org.xml.sax.helpers.DefaultHandler; public class SaxTest2 { public static void main(String[] args) throws Exception { SAXParserFactory factory = SAXParserFactory.newInstance(); SAXParser parser = factory.newSAXParser(); parser.parse(new File("student.xml"), new MyHandler2()); } } class MyHandler2 extends DefaultHandler { private Stack<String> stack = new Stack<String>(); private String name; private String gender; private String age; @Override public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException { stack.push(qName); for(int i = 0; i < attributes.getLength(); i++) { String attrName = attributes.getQName(i); String attrValue = attributes.getValue(i); System.out.println(attrName + "=" + attrValue); } } @Override public void characters(char[] ch, int start, int length) throws SAXException { String tag = stack.peek(); if("姓名".equals(tag)) { name = new String(ch, start,length); } else if("性别".equals(tag)) { gender = new String(ch, start, length); } else if("年龄".equals(tag)) { age = new String(ch, start, length); } } @Override public void endElement(String uri, String localName, String qName) throws SAXException { //stack.pop(); if("学生".equals(qName)) { System.out.println("姓名:" + name); System.out.println("性别:" + gender); System.out.println("年龄:" + age); System.out.println(); } } } 不加stack.pop()程序运行结果如下,而加上就可以把元素里的文本打印出来,实在想不明白为什么要加上stack.pop()代码,把堆栈里的东西每次读到元素末尾就清空,求高手解答 //运行结果 学号=1 姓名: 性别: 年龄: //XML文档如下 <?xml version="1.0" encoding="utf-8" standalone="yes"?> <学生名册> <学生 学号="1"> <姓名>张三</姓名> <性别>男</性别> <年龄>20</年龄> </学生> </学生名册>
sax解析xml,Tag的设置
Tag在startElement方法执行后变为book,那在character方法中是如何判断preTag的? public void startDocument() throws SAXException { books = new ArrayList<Book>(); } @Override public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException { if("book".equals(qName)){ book = new Book(); book.setId(Integer.parseInt(attributes.getValue(0))); } preTag = qName;//将正在解析的节点名称赋给preTag } [size=1em] @Override public void characters(char[] ch, int start, int length) throws SAXException { if(preTag!=null){ String content = new String(ch,start,length); if("name".equals(preTag)){ book.setName(content); }else if("price".equals(preTag)){ book.setPrice(Float.parseFloat(content)); } } }
SAX生成XML文件第一行根节点不换行怎么解决?
SAX生成XML文件第一行根节点不换行怎么解决,走过路过不要错过了。。。 ``` <?xml version="1.0" encoding="utf-8"?><persons> <person id="23"> <name>李磊</name> <age>30</age> </person> <person id="20"> <name>韩梅梅</name> <age>25</age> </person> </persons> ``` 已经添加换行了 ``` // 是否自动添加额外的空白 transformer.setOutputProperty(OutputKeys.INDENT, "yes"); ```
想知道fld文件可以像xml文件一样用SAX或DOM解析吗
像通过java类解析配置jsp标签的fld文件获取自定义jsp标签的人 种类以及属性。去不知道该通过哪种方式进行解析,不知道fld文件可以像xml文件一样用SAX或DOM解析吗。求高手指点
sax 解析问题
用sax解析xml时,如果xml内容是: <dynamic-page> <file name="customer">customer.jsp</file> </dynamic-page> <static-page> <file name="staff">staff.jsp</file> </static-page> 在解析时候使用的监听模式,当监听到startElement后,发现qName=file 那么我可以做相应的事情,但是如果我想让<dynamic-page>标签中的<file>标签与<static-page>标签中的<file>做不同的事情,那sax如何实现呢? [b]问题补充:[/b] 。。。那如果file中的name相同,就不行了?囧。。。。。 [b]问题补充:[/b] 元素相同,属性相同,但是父节点不同啊。。。这难道不能识别出来? dom解析不就可以获得整个element然后再去递归下一级element,这样不就可以用父节点的element name去做判断了吗?
python爬虫爬取时提示org.xml.sax.SAXParseException: Content is not allowed in prolog.
最近在研究爬虫,请求方法是POST,请求内容类型是application/x-www-form-urlencoded,说明以表单的方式提交。 观察响应正文,可以发现,响应内容类型是xml,其中想要提取的数据就在new节点内: ![图片说明](https://img-ask.csdn.net/upload/201908/28/1566957248_729059.png) 首先构造headers: ![图片说明](https://img-ask.csdn.net/upload/201908/28/1566957271_146204.png) 请求参数在请求正文中: ![图片说明](https://img-ask.csdn.net/upload/201908/28/1566957295_533999.png) 可以发现请求参数也是放在xml中,将__xml参数解码后可以发现内容如下: ![图片说明](https://img-ask.csdn.net/upload/201908/28/1566957318_627236.png) 提交的参数放在p标签里,每次提交请求变化的也只有那些参数,并没有发现加密的迹象 因此构造params: ![图片说明](https://img-ask.csdn.net/upload/201908/28/1566957346_765493.png) 代码如下: ```python import requests target = ".../dorado/smartweb2.RPC.d?__rpc=true" # 公司内网地址,外网无法访问 headers = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64; Trident/7.0; rv:11.0) like Gecko", "Referer": ".../pages/policynewbiz/inputapplication/pmGDVehicleQuery.jsp?VEHICLELICENSE=&VIN=LEFYECG257HN34234&LICENSETYPE=&Kind=AUTOCOMPRENHENSIVEINSURANCE2014PRODUCT&", "Content-Type": "application/x-www-form-urlencoded", "Cookie": "jsessionidp09=X2tfdlLTBZH7xzKwnhSgh2W2N5374T0HnHWYQkl2MRShjBxfpKpW!1484787398; F5cookie=1410712842.6521.0000" } params = { "__type": "loadData", "__viewInstanceId": "org.view.policynewbiz.inputapplication.pmGDVehicleQuery~org.view.common.viewmodel.CpicViewModel", "__xml": '%3Crpc%20id%3D%22datasetResult%22%20type%3D%22wrapper%22%20objectClazz%3D%22%22%20pi%3D%221%22%20ps%3D%22100%22%20pc%3D%221%22%20prc%3D%220%22%20fs%3D%22vin%2ClicensePlateNo%2ClicensePlateType%2CengineNo%2CpmVehicleType%2CpmUserNature%2CineffectualDate%2CrejectDate%2CfirstRegisterDate%2ClastCheckDate%2CtransferDate%2CwholeWeight%2CratedPassengerCapacity%2Ctonnage%2Cdisplacement%2CmadeFactory%2Cmodel%2CbrandCN%2CbrandEN%2Chaulage%2Ccolor%2CfuelType%2CvehicleStatus%2CmotorTypeCode%22%3E%3Cps%3E%3Cp%20name%3D%22flag%22%3E1%3C/p%3E%3Cp%20name%3D%22carMark%22/%3E%3Cp%20name%3D%22RackNo%22%3E2FMDK3J95DBC93811%3C/p%3E%3C/ps%3E%3C/rpc%3E%0D%0A', "__rpc": "true", } res = requests.post(url=target, headers=headers, data=params) html = res.content.decode("utf-8") print(html) ``` 执行结果报错: ```python D:\Users\CPIC\AppData\Local\Programs\Python\Python37\python.exe E:/Workspace/Python/SchoolInfo/test56.py <?xml version="1.0"?> <result succeed="false" > <errorMessage>org.xml.sax.SAXParseException: Content is not allowed in prolog.</errorMessage> <stackTrace><![CDATA[com.bstek.dorado.utils.xml.dom4j.Dom4jXmlBuilder.buildDocument(Dom4jXmlBuilder.java:59) com.bstek.dorado.view.rpc.AbstractRPCHandler.init(AbstractRPCHandler.java:58) com.bstek.dorado.view.rpc.LoadDataRPCHandler.init(LoadDataRPCHandler.java:41) com.bstek.dorado.core.FilterHandle.doFilter(FilterHandle.java:131) com.bstek.dorado.core.DoradoFilter.doFilter(DoradoFilter.java:70) weblogic.servlet.internal.FilterChainImpl.doFilter(FilterChainImpl.java:43) com.cpic.p09.auto.common.filter.CompatibleFilter.doFilter(CompatibleFilter.java:34) weblogic.servlet.internal.FilterChainImpl.doFilter(FilterChainImpl.java:43) com.cpic.p09.auto.common.filter.ClientCacheFilter.doFilter(ClientCacheFilter.java:71) weblogic.servlet.internal.WebAppServletContext$ServletInvocationAction.run(WebAppServletContext.java:3242) weblogic.security.acl.internal.AuthenticatedSubject.doAs(AuthenticatedSubject.java:321) weblogic.servlet.internal.WebAppServletContext.execute(WebAppServletContext.java:1916) weblogic.servlet.internal.ServletRequestImpl.run(ServletRequestImpl.java:1366) weblogic.work.ExecuteThread.run(ExecuteThread.java:181) ]]></stackTrace> <viewProperties></viewProperties> </result> Process finished with exit code 0 ``` 有哪位大神遇到过这种情况,小弟要抓狂了
sax 解析:从 div 标签中获取值
在 android 应用程序中,我要解析一个 xml 页面。xml 页面中的数据是下面这种格式: <root> <tag1>data</tag1> <tag2> <div>data1</div><div>data2</div> </tag2> </root> 通过 sax 解析来获取数据: if (localName.equalsIgnoreCase("tag1")) if (localName.equalsIgnoreCase("tag2")) 但是我不能从tag2中得到任何数据,能从tag1中获得值。我想获取所有数据包括div标签 然后把数据显示在html页面上。
org.xml.sax.SAXNotRecognizedException
项目里使用了jfreechart,生成报表的时候后,在resinn3.0.1版本会报这个错误:org.xml.sax.SAXNotRecognizedException: http://apache.org/xml/features/validation/dynamic,查看了下应该是resin_home/lib/resin.jar中的com.caucho.xml.parsers.XmlSAXParserFactory解析不了项目中用jasperreport生产的xml文件,这个问题在tomcat4和5以及resin3.2中都不会出现,那么我如何设置path使系统优先使用jasperreport的xml解析包来解析这些xml文件呢
求教:SAX解析中法语的重音符号怎么处理?
从一个欧洲的服务器获取xml的时候。xml有这样的内容 <br /> <br />&nbsp; &lt;?xml version="1.0" encoding="iso-8859-1" standalone="yes" ?&gt; <br /> <br />&nbsp; ... <br /> <br />&nbsp; &lt;StationDesc&gt;Alternative Times Radio je internetové rádio.&lt;/StationDesc&gt; <br /> <br />&nbsp; 这样的内容。人家已经定好了编码格式,我这边获取到é就会出错,试了很多方法都没有解决,我怀疑是应该服务器那边先把这些特殊字符先处理好才合理,可是现在我们管不了那个。 <br /> <br />&nbsp; 我最后用的DOM来解析的。但我一直怀疑这个地方SAX应该也是有办法处理的。请大家指教一下。感激不尽<br/><strong>问题补充</strong><br/>not well-formed (invalid token)<br />很明显是字符编码的问题。<br />只是编码是在服务方那边设置好的,然后内容里又有了é这样的字符是不应该的(这一点我没有把握),应该是服务方把这个字符处理成unicode,比如á = \u00e8,另外在网上查到说可能是重音那个降音符号是个特殊字符要做特殊处理。<br />现在的问题是,我这边设置不了服务器那边发过来的文档编码,只能从里面读数据,读到这个特殊符号的时候才会报错。
解析xml问题求解
[color=red]用SAX怎么解析带命名空间的xml [/color] 例如:以下xml解析不完整,也不正确 <?xml version="1.0" encoding="gb2312"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns" xmlns:cim="http://www.dt.ch/TC57/2003 xmlns:cimDNG="http://www.dd.cn> <cim:SubControl rdf:ID="11111111"> <cim:Naming.name>衡水</cim:Naming.name> </cim:SubControl> <cim:BaseP rdf:ID="00000001"> <cim:BasePo.basePow>100</cim:BasePo.basePow> </cim:BaseP> <cim:BaseVo rdf:ID="21000002"> <cim:BaseVo.nominalVo>525.000000</cim:BaseVo.nominalVo> <cimNA:BaseVo.name>500KV</cimNA:BaseVo.name> <cimNA:BaseVo.nominal>201.22</cimNA:BaseVo.nominal> <cimNA:IdentifiedObject.mRID>21000002</cimNA:IdentifiedObject.mRID> </cim:BaseVo> ..... </rdf:RDF> 例如:以下的xml可以解析出来 <?xml version="1.0" encoding="gb2312"?> <row> <person> <name>王小明</name> <college>信息学院</college> <telephone>6258113</telephone> <notes>男,1955年生,博士,95年调入海南大学</notes> </person> </row>  [color=red]请给点建议,谢谢!![/color]
java如何解析大型xml文件
有个xml文件,100M,200多万行数据。要进行解析,不知道要用什么方式。尝试了jsoup,但是读不进去。dom4j提示到6.8w行就截断了。sax感觉效率太低。有更好的方法么?xml里面的数据都是有用的,要入库管理。
Android二维码解析xml的问题
通过将二维码扫描出来的结果先保存在sd卡中,通过读取sd卡中的内容,用sax方式进行解析 有谁做过这方面的吗![图片说明](https://img-ask.csdn.net/upload/201512/07/1449456638_640619.jpg)
一个android中XML解析的问题。
我遇到一个SAX解析XML文件的问题,求高手指导下。如何将如下XML文件解析: <content type="part" name="学"> <content type="part" name="一部分"> <content type="text" name="一"> 我<font color="red">是</font> 一<font color="red">个</font> 兵<word index="1">来</word> <sentence>自</sentence> <text index="1">老百姓。</text> </content> <decript> 士兵 </decript> </content> <content> 求只要简单写出ContentHandler接口中的处理方法就好,万分感激,求指导教育。
java 用sax生成xml文件怎么释放
``` File file = new File(“g:/123.xml”); try { SAXTransformerFactory stf = (SAXTransformerFactory) SAXTransformerFactory.newInstance(); TransformerHandler handler = stf.newTransformerHandler(); Transformer tf = handler.getTransformer(); tf.setOutputProperty(OutputKeys.INDENT, "yes");// 标签自动换行 tf.setOutputProperty(OutputKeys.ENCODING, "UTF-8");// 编码格式 StreamResult result = new StreamResult(file);// 创建Result对象 handler.setResult(result);// 关联 handler.startDocument(); handler.startElement("", "", "tb_students", null);// 根节点标签 . . . handler.endElement("", "", "tb_students");// 结束根节点标签 handler.endDocument(); ```
context:property-placeholder 不能解析xml中配置的键值
org.springframework.beans.factory.xml.XmlBeanDefinitionStoreException: Line 9 in XML document from URL [file:/E:/PT/Installtomcat/webapps/SSHTest1/WEB-INF/classes/applicationContext.xml] is invalid; nested exception is org.xml.sax.SAXParseException; lineNumber: 9; columnNumber: 61; cvc-complex-type.2.4.c: 通配符的匹配很全面, 但无法找到元素 'context:property-placeholder' 的声明。 at org.springframework.beans.factory.xml.XmlBeanDefinitionReader.doLoadBeanDefinitions(XmlBeanDefinitionReader.java:396) at org.springframework.beans.factory.xml.XmlBeanDefinitionReader.loadBeanDefinitions(XmlBeanDefinitionReader.java:334) at org.springframework.beans.factory.xml.XmlBeanDefinitionReader.loadBeanDefinitions(XmlBeanDefinitionReader.java:302) !!!!!!!!!!!!!!!! 代码如下: ![图片说明](https://img-ask.csdn.net/upload/201504/14/1429020132_531878.jpg)
使用DefaultHandler2 进行 SAX解析 出错
因为我是第一次使用DefaultHandler2这个类 sax解析带有CDATA标签的xml文件, 还不太熟悉,不知道我这样用对不对。 xml文件内容如下:![图片说明](https://img-ask.csdn.net/upload/201507/21/1437494051_620016.png) 我只需要得到 url 标签下 encode、decode、lrcid这三个标签里面的内容。 下面是Java代码 public class MyDefaultHandler2 extends DefaultHandler2{ String currentElement=null; int flag=0; String cData; int count=0; @Override public void endCDATA() throws SAXException { // TODO Auto-generated method stub super.endCDATA(); } @Override public void characters(char[] ch, int start, int length) throws SAXException { // TODO Auto-generated method stub count++; System.out.println("xiaoqiang:"+count); if(flag==1&&currentElement.equals("encode")){ cData=new String(ch,start,length); System.out.println("xiaoqiang:"+cData); }else if(flag==1&&currentElement.equals("decode")){ cData=new String(ch,start,length); System.out.println("xiaoqiang:"+cData); }else if (flag==1&&currentElement.equals("lrcid")) { String thedata=new String(ch,start,length); System.out.println("xiaoqiang:"+thedata); } super.characters(ch, start, length); } @Override public void endDocument() throws SAXException { // TODO Auto-generated method stub super.endDocument(); } @Override public void endElement(String uri, String localName, String qName) throws SAXException { // TODO Auto-generated method stub if(localName.equals("url")){ flag=0; }else { currentElement=null; } super.endElement(uri, localName, qName); } @Override public void startDocument() throws SAXException { // TODO Auto-generated method stub super.startDocument(); } @Override public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException { // TODO Auto-generated method stub if(localName.equals("url")){ flag=1; }else if(localName.equals("encode")){ currentElement="encode"; startCDATA(); }else if(localName.equals("decode")){ currentElement="decode"; startCDATA(); }else if(localName.equals("lrcid")){ currentElement="lrcid"; } super.startElement(uri, localName, qName, attributes); } @Override public void startCDATA() throws SAXException { // TODO Auto-generated method stub cData=null; super.startCDATA(); } } 最后是loagCat的信息: ![图片说明](https://img-ask.csdn.net/upload/201507/21/1437494321_856898.png) 我在每一次触发characters方法的时候记一次数,可以看到是第四次的时候出问题的。而且 encode 和 decode 标签里面的内容也成功获取,而 lrcid 标签里的内容则没有获取。那么应该是解析到 lrcid 标签的时候出了错误。 想请问如何解决这个问题,为什么会出错?
终于明白阿里百度这样的大公司,为什么面试经常拿ThreadLocal考验求职者了
点击上面↑「爱开发」关注我们每晚10点,捕获技术思考和创业资源洞察什么是ThreadLocalThreadLocal是一个本地线程副本变量工具类,各个线程都拥有一份线程私有的数
程序员必须掌握的核心算法有哪些?
由于我之前一直强调数据结构以及算法学习的重要性,所以就有一些读者经常问我,数据结构与算法应该要学习到哪个程度呢?,说实话,这个问题我不知道要怎么回答你,主要取决于你想学习到哪些程度,不过针对这个问题,我稍微总结一下我学过的算法知识点,以及我觉得值得学习的算法。这些算法与数据结构的学习大多数是零散的,并没有一本把他们全部覆盖的书籍。下面是我觉得值得学习的一些算法以及数据结构,当然,我也会整理一些看过...
《奇巧淫技》系列-python!!每天早上八点自动发送天气预报邮件到QQ邮箱
此博客仅为我业余记录文章所用,发布到此,仅供网友阅读参考,如有侵权,请通知我,我会删掉。 补充 有不少读者留言说本文章没有用,因为天气预报直接打开手机就可以收到了,为何要多此一举发送到邮箱呢!!!那我在这里只能说:因为你没用,所以你没用!!! 这里主要介绍的是思路,不是天气预报!不是天气预报!!不是天气预报!!!天气预报只是用于举例。请各位不要再刚了!!! 下面是我会用到的两个场景: 每日下
死磕YOLO系列,YOLOv1 的大脑、躯干和手脚
YOLO 是我非常喜欢的目标检测算法,堪称工业级的目标检测,能够达到实时的要求,它帮我解决了许多实际问题。 这就是 YOLO 的目标检测效果。它定位了图像中物体的位置,当然,也能预测物体的类别。 之前我有写博文介绍过它,但是每次重新读它的论文,我都有新的收获,为此我准备写一个系列的文章来详尽分析它。这是第一篇,从它的起始 YOLOv1 讲起。 YOLOv1 的论文地址:https://www.c...
知乎高赞:中国有什么拿得出手的开源软件产品?(整理自本人原创回答)
知乎高赞:中国有什么拿得出手的开源软件产品? 在知乎上,有个问题问“中国有什么拿得出手的开源软件产品(在 GitHub 等社区受欢迎度较好的)?” 事实上,还不少呢~ 本人于2019.7.6进行了较为全面的回答,对这些受欢迎的 Github 开源项目分类整理如下: 分布式计算、云平台相关工具类 1.SkyWalking,作者吴晟、刘浩杨 等等 仓库地址: apache/skywalking 更...
20行Python代码爬取王者荣耀全英雄皮肤
引言 王者荣耀大家都玩过吧,没玩过的也应该听说过,作为时下最火的手机MOBA游戏,咳咳,好像跑题了。我们今天的重点是爬取王者荣耀所有英雄的所有皮肤,而且仅仅使用20行Python代码即可完成。 准备工作 爬取皮肤本身并不难,难点在于分析,我们首先得得到皮肤图片的url地址,话不多说,我们马上来到王者荣耀的官网: 我们点击英雄资料,然后随意地选择一位英雄,接着F12打开调试台,找到英雄原皮肤的图片...
简明易理解的@SpringBootApplication注解源码解析(包含面试提问)
欢迎关注文章系列 ,关注我 《提升能力,涨薪可待》 《面试知识,工作可待》 《实战演练,拒绝996》 欢迎关注我博客,原创技术文章第一时间推出 也欢迎关注公 众 号【Ccww笔记】,同时推出 如果此文对你有帮助、喜欢的话,那就点个赞呗,点个关注呗! 《提升能力,涨薪可待篇》- @SpringBootApplication注解源码解析 一、@SpringBootApplication 的作用是什...
西游记团队中如果需要裁掉一个人,会先裁掉谁?
2019年互联网寒冬,大批企业开始裁员,下图是网上流传的一张截图: 裁员不可避免,那如何才能做到不管大环境如何变化,自身不受影响呢? 我们先来看一个有意思的故事,如果西游记取经团队需要裁员一名,会裁掉谁呢,为什么? 西游记团队组成: 1.唐僧 作为团队teamleader,有很坚韧的品性和极高的原则性,不达目的不罢休,遇到任何问题,都没有退缩过,又很得上司支持和赏识(直接得到唐太宗的任命,既给袈...
Python语言高频重点汇总
Python语言高频重点汇总 GitHub面试宝典仓库 回到首页 目录: Python语言高频重点汇总 目录: 1. 函数-传参 2. 元类 3. @staticmethod和@classmethod两个装饰器 4. 类属性和实例属性 5. Python的自省 6. 列表、集合、字典推导式 7. Python中单下划线和双下划线 8. 格式化字符串中的%和format 9. 迭代器和生成器 10...
究竟你适不适合买Mac?
我清晰的记得,刚买的macbook pro回到家,开机后第一件事情,就是上了淘宝网,花了500元钱,找了一个上门维修电脑的师傅,上门给我装了一个windows系统。。。。。。 表砍我。。。 当时买mac的初衷,只是想要个固态硬盘的笔记本,用来运行一些复杂的扑克软件。而看了当时所有的SSD笔记本后,最终决定,还是买个好(xiong)看(da)的。 已经有好几个朋友问我mba怎么样了,所以今天尽量客观
程序员一般通过什么途径接私活?
二哥,你好,我想知道一般程序猿都如何接私活,我也想接,能告诉我一些方法吗? 上面是一个读者“烦不烦”问我的一个问题。其实不止是“烦不烦”,还有很多读者问过我类似这样的问题。 我接的私活不算多,挣到的钱也没有多少,加起来不到 20W。说实话,这个数目说出来我是有点心虚的,毕竟太少了,大家轻喷。但我想,恰好配得上“一般程序员”这个称号啊。毕竟苍蝇再小也是肉,我也算是有经验的人了。 唾弃接私活、做外
ES6基础-ES6的扩展
进行对字符串扩展,正则扩展,数值扩展,函数扩展,对象扩展,数组扩展。 开发环境准备: 编辑器(VS Code, Atom,Sublime)或者IDE(Webstorm) 浏览器最新的Chrome 字符串的扩展: 模板字符串,部分新的方法,新的unicode表示和遍历方法: 部分新的字符串方法 padStart,padEnd,repeat,startsWith,endsWith,includes 字...
Python爬虫爬取淘宝,京东商品信息
小编是一个理科生,不善长说一些废话。简单介绍下原理然后直接上代码。 使用的工具(Python+pycharm2019.3+selenium+xpath+chromedriver)其中要使用pycharm也可以私聊我selenium是一个框架可以通过pip下载 pip install selenium -i https://pypi.tuna.tsinghua.edu.cn/simple/ 
阿里程序员写了一个新手都写不出的低级bug,被骂惨了。
你知道的越多,你不知道的越多 点赞再看,养成习惯 本文 GitHub https://github.com/JavaFamily 已收录,有一线大厂面试点思维导图,也整理了很多我的文档,欢迎Star和完善,大家面试可以参照考点复习,希望我们一起有点东西。 前前言 为啥今天有个前前言呢? 因为你们的丙丙啊,昨天有牌面了哟,直接被微信官方推荐,知乎推荐,也就仅仅是还行吧(心里乐开花)
Java工作4年来应聘要16K最后没要,细节如下。。。
前奏: 今天2B哥和大家分享一位前几天面试的一位应聘者,工作4年26岁,统招本科。 以下就是他的简历和面试情况。 基本情况: 专业技能: 1、&nbsp;熟悉Sping了解SpringMVC、SpringBoot、Mybatis等框架、了解SpringCloud微服务 2、&nbsp;熟悉常用项目管理工具:SVN、GIT、MAVEN、Jenkins 3、&nbsp;熟悉Nginx、tomca
Python爬虫精简步骤1 获取数据
爬虫的工作分为四步: 1.获取数据。爬虫程序会根据我们提供的网址,向服务器发起请求,然后返回数据。 2.解析数据。爬虫程序会把服务器返回的数据解析成我们能读懂的格式。 3.提取数据。爬虫程序再从中提取出我们需要的数据。 4.储存数据。爬虫程序把这些有用的数据保存起来,便于你日后的使用和分析。 这一篇的内容就是:获取数据。 首先,我们将会利用一个强大的库——requests来获取数据。 在电脑上安装
作为一个程序员,CPU的这些硬核知识你必须会!
CPU对每个程序员来说,是个既熟悉又陌生的东西? 如果你只知道CPU是中央处理器的话,那可能对你并没有什么用,那么作为程序员的我们,必须要搞懂的就是CPU这家伙是如何运行的,尤其要搞懂它里面的寄存器是怎么一回事,因为这将让你从底层明白程序的运行机制。 随我一起,来好好认识下CPU这货吧 把CPU掰开来看 对于CPU来说,我们首先就要搞明白它是怎么回事,也就是它的内部构造,当然,CPU那么牛的一个东
破14亿,Python分析我国存在哪些人口危机!
2020年1月17日,国家统计局发布了2019年国民经济报告,报告中指出我国人口突破14亿。 猪哥的朋友圈被14亿人口刷屏,但是很多人并没有看到我国复杂的人口问题:老龄化、男女比例失衡、生育率下降、人口红利下降等。 今天我们就来分析一下我们国家的人口数据吧! 更多有趣分析教程,扫描下方二维码关注vx公号「裸睡的猪」 即可查看! 一、背景 1.人口突破14亿 2020年1月17日,国家统计局发布
web前端javascript+jquery知识点总结
Javascript javascript 在前端网页中占有非常重要的地位,可以用于验证表单,制作特效等功能,它是一种描述语言,也是一种基于对象(Object)和事件驱动并具有安全性的脚本语言 ,语法同java类似,是一种解释性语言,边执行边解释。 JavaScript的组成: ECMAScipt 用于描述: 语法,变量和数据类型,运算符,逻辑控制语句,关键字保留字,对象。 浏览器对象模型(Br
Qt实践录:开篇
本系列文章介绍笔者的Qt实践之路。
在家远程办公效率低?那你一定要收好这个「在家办公」神器!
相信大家都已经收到国务院延长春节假期的消息,接下来,在家远程办公可能将会持续一段时间。 但是问题来了。远程办公不是人在电脑前就当坐班了,相反,对于沟通效率,文件协作,以及信息安全都有着极高的要求。有着非常多的挑战,比如: 1在异地互相不见面的会议上,如何提高沟通效率? 2文件之间的来往反馈如何做到及时性?如何保证信息安全? 3如何规划安排每天工作,以及如何进行成果验收? ......
作为一个程序员,内存和磁盘的这些事情,你不得不知道啊!!!
截止目前,我已经分享了如下几篇文章: 一个程序在计算机中是如何运行的?超级干货!!! 作为一个程序员,CPU的这些硬核知识你必须会! 作为一个程序员,内存的这些硬核知识你必须懂! 这些知识可以说是我们之前都不太重视的基础知识,可能大家在上大学的时候都学习过了,但是嘞,当时由于老师讲解的没那么有趣,又加上这些知识本身就比较枯燥,所以嘞,大家当初几乎等于没学。 再说啦,学习这些,也看不出来有什么用啊!
这个世界上人真的分三六九等,你信吗?
偶然间,在知乎上看到一个问题 一时间,勾起了我深深的回忆。 以前在厂里打过两次工,做过家教,干过辅导班,做过中介。零下几度的晚上,贴过广告,满脸、满手地长冻疮。   再回首那段岁月,虽然苦,但让我学会了坚持和忍耐。让我明白了,在这个世界上,无论环境多么的恶劣,只要心存希望,星星之火,亦可燎原。   下文是原回答,希望能对你能有所启发。   如果我说,这个世界上人真的分三六九等,
为什么听过很多道理,依然过不好这一生?
记录学习笔记是一个重要的习惯,不希望学习过的东西成为过眼云烟。做总结的同时也是一次复盘思考的过程。 本文是根据阅读得到 App上《万维钢·精英日课》部分文章后所做的一点笔记和思考。学习是一个系统的过程,思维模型的建立需要相对完整的学习和思考过程。以下观点是在碎片化阅读后总结的一点心得总结。
B 站上有哪些很好的学习资源?
哇说起B站,在小九眼里就是宝藏般的存在,放年假宅在家时一天刷6、7个小时不在话下,更别提今年的跨年晚会,我简直是跪着看完的!! 最早大家聚在在B站是为了追番,再后来我在上面刷欧美新歌和漂亮小姐姐的舞蹈视频,最近两年我和周围的朋友们已经把B站当作学习教室了,而且学习成本还免费,真是个励志的好平台ヽ(.◕ฺˇд ˇ◕ฺ;)ノ 下面我们就来盘点一下B站上优质的学习资源: 综合类 Oeasy: 综合
雷火神山直播超两亿,Web播放器事件监听是怎么实现的?
Web播放器解决了在手机浏览器和PC浏览器上播放音视频数据的问题,让视音频内容可以不依赖用户安装App,就能进行播放以及在社交平台进行传播。在视频业务大数据平台中,播放数据的统计分析非常重要,所以Web播放器在使用过程中,需要对其内部的数据进行收集并上报至服务端,此时,就需要对发生在其内部的一些播放行为进行事件监听。 那么Web播放器事件监听是怎么实现的呢? 01 监听事件明细表 名
3万字总结,Mysql优化之精髓
本文知识点较多,篇幅较长,请耐心学习 MySQL已经成为时下关系型数据库产品的中坚力量,备受互联网大厂的青睐,出门面试想进BAT,想拿高工资,不会点MySQL优化知识,拿offer的成功率会大大下降。 为什么要优化 系统的吞吐量瓶颈往往出现在数据库的访问速度上 随着应用程序的运行,数据库的中的数据会越来越多,处理时间会相应变慢 数据是存放在磁盘上的,读写速度无法和内存相比 如何优化 设计
一条链接即可让黑客跟踪你的位置! | Seeker工具使用
搬运自:冰崖的部落阁(icecliffsnet) 严正声明:本文仅限于技术讨论,严禁用于其他用途。 请遵守相对应法律规则,禁止用作违法途径,出事后果自负! 上次写的防社工文章里边提到的gps定位信息(如何防止自己被社工或人肉) 除了主动收集他人位置信息以外,我们还可以进行被动收集 (没有技术含量) Seeker作为一款高精度地理位置跟踪工具,同时也是社交工程学(社会工程学)爱好者...
作为程序员的我,大学四年一直自学,全靠这些实用工具和学习网站!
我本人因为高中沉迷于爱情,导致学业荒废,后来高考,毫无疑问进入了一所普普通通的大学,实在惭愧...... 我又是那么好强,现在学历不行,没办法改变的事情了,所以,进入大学开始,我就下定决心,一定要让自己掌握更多的技能,尤其选择了计算机这个行业,一定要多学习技术。 在进入大学学习不久后,我就认清了一个现实:我这个大学的整体教学质量和学习风气,真的一言难尽,懂的人自然知道怎么回事? 怎么办?我该如何更好的提升
前端JS初级面试题二 (。•ˇ‸ˇ•。)老铁们!快来瞧瞧自己都会了么
1. 传统事件绑定和符合W3C标准的事件绑定有什么区别? 传统事件绑定 &lt;div onclick=""&gt;123&lt;/div&gt; div1.onclick = function(){}; &lt;button onmouseover=""&gt;&lt;/button&gt; 注意: 如果给同一个元素绑定了两次或多次相同类型的事件,那么后面的绑定会覆盖前面的绑定 (不支持DOM事...
相关热词 c# id读写器 c#俄罗斯方块源码 c# linq原理 c# 装箱有什么用 c#集合 复制 c# 一个字符串分组 c++和c#哪个就业率高 c# 批量动态创建控件 c# 模块和程序集的区别 c# gmap 截图
立即提问