java程序用pd4ml将jsp转成pdf

有谁用过pd4ml将jsp转成pdf的,我的是动态的jsp ,或者其他的也可以

1个回答

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
用PD4ML把HTML转成PDF时出现问题
用PD4ML把HTML转成PDF时CSS解析时,表格的框线都没了,有没有大神能帮忙解决一下,麻烦了。 在线等,着急!!! ![图片说明](https://img-ask.csdn.net/upload/201609/28/1475049924_214808.png) ![图片说明](https://img-ask.csdn.net/upload/201609/28/1475049933_325881.png)
pd4ml使html转pdf时字体怎么换行?
当使用pd4ml技术让html转pdf时,大文本标签(textarea)转成pdf,文本全部展示在一行,各位使用过的大神,看看这个怎么解决。难道没人遇到过?
用PD4ML导出PDF,怎么竖向显示?
用PD4ML将HTML导出为PDF。 用 pd4ml.setPageSize(pd4ml.changePageOrientation(PD4Constants.A4)); 设置打印页面。 导出的PDF纸张为横向显示的,怎么设置为竖向啊?
IE9下JSP转换为PDF求解
最近做一个项目,要求必须用IE9浏览器,JSP的内容大致有4000多行,比较复杂,里面的格式有表格、图片、汉字,汉字的大小和粗细是不一样的,请问各路大神有没有什么合适的解决方案(前端或者后端都可以)? 试过了在后台使用flying saucer,一个是它对于标签的匹配比较变态,另一个是用IE9浏览器的时候,table里面的colspan是没有效果的,字体的大小和粗细也不识别;也试过了PD4ML,结果还是colspan不识别;前台试过了html2canvas截图转换为pdf,问题首先是ie9浏览器客户端截图时间太长(大概要3分钟),其次是截下来的图不全(估计是浏览器的缓存或者其他问题)。
使用pd4ml html转pdf的时候,“傢”这个字变成了?,其他字符都正常显示中文。
java 代码: ![图片说明](https://img-ask.csdn.net/upload/201905/31/1559274443_24537.png) html代码: ![图片说明](https://img-ask.csdn.net/upload/201905/31/1559274514_728380.png) 效果: ![图片说明](https://img-ask.csdn.net/upload/201905/31/1559274686_888602.png) 当输入“傢”这个字的时候就是?了,我想知道怎么解决这个字,如何变为正常的傢字。谢谢了
java导出的PDF和ireport预览时生成的PD字体的样式大小都不一样
我在用ireport做报表,报表是PDF格式的,报表已经做好了,而且预览的时候没有问题,但是用java导出PDF的时候,导出的PDF和我设计的字体的大小和样式,还有格式都不一样,和预览的效果也不一样,求大神指点
Linux中使用libreoffice转换PDF,soffice 和libreoffice的区别
soffice --headless --invisible --convert-to pdf /usr/file/a --outdir /data/file libreoffice --headless --invisible --convert-to pdf /usr/file/a --outdir /data/file 这两个命令有什么区别吗? 还有转出来的PDF文件中文乱码。
java中查询部门表,转换为树形json
java中查询部门表,转换为树形json,最终需要使用Dtree 在前端展示树形结构 数据结构如下图 ![图片说明](https://img-ask.csdn.net/upload/201909/19/1568890786_416772.jpg) 不管用什么方式,最终希望得到json格式为: ``` { "id": "1", "name": "GM", "Children": [{ "id": "22", "name": "PM", "Children": [{ "id": "67", "name": "MO", "Children": [{}] }] }, { "id": "23", "name": "PD", "Children": [{}] }, { "id": "24", "name": "PE", "Children": [{}] } ] } ``` 求大神指点
java大神帮我解决下网页搜索框的问题
这是serlet: package sjbsjb; import java.io.IOException; import java.io.PrintWriter; import java.sql.ResultSet; import java.sql.SQLException; import java.util.ArrayList; import java.util.List; import javax.servlet.ServletException; import javax.servlet.http.HttpServlet; import javax.servlet.http.HttpServletRequest; import javax.servlet.http.HttpServletResponse; import sjb.db.*; import sjb.entity.*; public class search extends HttpServlet { /** * The doGet method of the servlet. <br> * * This method is called when a form has its tag value method equals to get. * * @param request the request send by the client to the server * @param response the response send by the server to the client * @throws ServletException if an error occurred * @throws IOException if an error occurred */ public void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException { dbtools dt = new dbtools();// 实例化数据库连接工具 String server = "localhost"; String dbname = "qimo"; String username = "root"; String pwd = "aaaa"; try { dt.setConnection(server, dbname, username, pwd); String keyword= request.getParameter("text"); byte[] keyword1=keyword.getBytes("ISO-8859-1"); keyword =new String(keyword1); System.out.print(" keyword="+ keyword); List<phone> phoneList = new ArrayList<phone>(); { String sql ="SELECT * FROM view_phonedetail where Name like '%"+keyword+"%' or name like '%"+keyword+"%'; "; System.out.print("sql="+sql); ResultSet rs = dt.executeQuery(sql); while (rs.next()) { phone pd=new phone(); pd.setId(rs.getInt("id")); pd.setName(rs.getString("name")); pd.setPrice(rs.getString("price")); pd.setZhongjie(rs.getString("Zhongjie")); pd.setTupian(rs.getString("Tupian")); System.out.println(rs.getString("name")); System.out.println(rs.getString("price")); System.out.println(rs.getInt("id")); System.out.println(rs.getString("zhongjie")); System.out.println(rs.getString("tupian")); phoneList.add(pd); } } request.setAttribute("phoneList", phoneList); request.getRequestDispatcher("search.jsp").forward(request, response); } catch (ClassNotFoundException e) { // TODO Auto-generated catch block e.printStackTrace(); } catch (SQLException e) { // TODO Auto-generated catch block e.printStackTrace(); } finally { dt.closeAll(); } } public void doPost(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException { doGet(request, response); } } 这是JSP: <%@ page language="java" import="java.util.*" pageEncoding="gbk"%> <%@page import="sjb.entity.*"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+"://"+request.getServerName()+":"+request.getServerPort()+path+"/"; %> <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> <html> <head> <base href="<%=basePath%>"> <title>My JSP 'search.jsp' starting page</title> <meta http-equiv="pragma" content="no-cache"> <meta http-equiv="cache-control" content="no-cache"> <meta http-equiv="expires" content="0"> <meta http-equiv="keywords" content="keyword1,keyword2,keyword3"> <meta http-equiv="description" content="This is my page"> <!-- <link rel="stylesheet" type="text/css" href="styles.css"> --> </head> <body> <div id="header"> <div id="logo"> <form id="logo_form" action="search" name="form1" method="post" > <input type="text" name="text" value="请在这里输入搜索关键词" style="height:26px" size="21" /> <input type="submit" value="查询" /> </form> </div> </div> <div id="content" > <div class="global_module prolist"> <% List<phone> phoneList = (List<phone>) request.getAttribute("phoneList"); phone pd=new phone(); for(int i=0;i<phoneList.size();i++){ phoneList.get(i).setCount(i+1); pd=phoneList.get(i); } %> <h3><strong>共搜索到<%=pd.getCount()%> 条结果</strong></h3> <div id="prolist_foods"> <% for(int i=0;i<phoneList.size();i++){ pd=phoneList.get(i); %> <div class="prolist_food1"> <div class="prolist_left"> <a href="detail?productid=<%=pd.getId() %>"> <img src="images/productimage/<%= pd.getTupian()%>.jpg" width="280" height="200" /> </div></a> </br> <div class="prolist_right"> <div class="prolist_title"> <a href="#"><%=pd.getName()%></a> </div><div class="prolist_price"> 价格:¥<%=pd.getPrice() %> </div> <div class="prolist_storeprice"> 店铺价格:¥<%=pd.getPrice() %> </div> </div> </br> <div class="clear"></div> <div class="prolist_text"> <strong>简介:<%=pd.getZhongjie()%></strong> </div> </div> <% } %> </div> </div> </div> </div> <div class="clear"> </div> </body> </html> 错误提示: HTTP Status 500 - java.lang.NullPointerException type Exception report message java.lang.NullPointerException description The server encountered an internal error that prevented it from fulfilling this request. exception org.apache.jasper.JasperException: java.lang.NullPointerException org.apache.jasper.servlet.JspServletWrapper.handleJspException(JspServletWrapper.java:502) org.apache.jasper.servlet.JspServletWrapper.service(JspServletWrapper.java:430) org.apache.jasper.servlet.JspServlet.serviceJspFile(JspServlet.java:313) org.apache.jasper.servlet.JspServlet.service(JspServlet.java:260) javax.servlet.http.HttpServlet.service(HttpServlet.java:723) root cause java.lang.NullPointerException org.apache.jsp.search_jsp._jspService(search_jsp.java:103) org.apache.jasper.runtime.HttpJspBase.service(HttpJspBase.java:70) javax.servlet.http.HttpServlet.service(HttpServlet.java:723) org.apache.jasper.servlet.JspServletWrapper.service(JspServletWrapper.java:388) org.apache.jasper.servlet.JspServlet.serviceJspFile(JspServlet.java:313) org.apache.jasper.servlet.JspServlet.service(JspServlet.java:260) javax.servlet.http.HttpServlet.service(HttpServlet.java:723) note The full stack trace of the root cause is available in the Apache Tomcat/6.0.37 logs. Apache Tomcat/6.0.37
html转word,excle,pd格式,内容要一致,要跨平台的
html转word,excle,pd格式,内容要一致,要跨平台的,怎么搞,itext试过对HTML的格式过与严格,有些标签属性识别不出来
使用pdfplumber提取pdf表格内容时,得到的全是cid:xxxx,怎么解决?
``` import pdfplumber import pandas as pd path="./2017数据.pdf" with pdfplumber.open(path) as pdf: page = pdf.pages[0] text = page.extract_text() print(text) table = page.extract_tables(table_settings={}) for t in table: df = pd.DataFrame(t[1:], columns=t[0]) print(df) ``` ![图片说明](https://img-ask.csdn.net/upload/201911/30/1575094125_710900.png)
Pandas 区间频率转换里,从高频率转成低频率,不太理解,求解?
Pandas 区间频率转换里,从高频率转成低频率,不太理解,《利用Python进行数据分析(第二版)》中说明是: **从高频率向低频率转换时,根据子区间的“所属”决定父区间。** 书中例子: ``` In [109]: p = pd.Period('AUG-2007','M') In [110]: p.asfreq('A-JUN') Out[110]: Period('2008', 'A-JUN') ``` 对这个有点不太理解,有疑问: 1,这里的所属,是指低频率区间要包含高频率区间吗?即是父区间包含子区间。 2,对于上面的例子,asfreq()的参数‘how’取值为‘start’,‘end’对结果有什么影响?按照所属关系的话,how的取值如何应该对结果不影响吧? 以上是自己的疑问,求大佬答疑。
jdbc连接数据库,查询成功返回数据但是还是报错java.sql.SQLException: Operation not allowed after ResultSet closed 这是怎么回事?
try { Class.forName("com.mysql.jdbc.Driver"); String ur1="jdbc:mysql://localhost:3306/lingshi"; String username="root"; String password="root"; Connection con=DriverManager.getConnection(ur1,username,password); Statement stmt=con.createStatement(); String sql1="select * from guogan"; ResultSet rs1=stmt.executeQuery(sql1); while(rs1.next()){ String id=rs1.getString(1); System.out.print(id+"\t"); String name=rs1.getString("name"); System.out.print(name+"\t"); String price=rs1.getString(3); System.out.print(price+"\t"); String weight=rs1.getString("weight"); System.out.print(weight+"\t"); String birthdate=rs1.getString("birthdate"); System.out.print(birthdate+"\t"); String enddate=rs1.getString("enddate"); System.out.print(enddate+"\t"); String PD=rs1.getString("PD"); System.out.print(PD+"\t"); rs1.close(); stmt.close(); con.close(); } } catch (ClassNotFoundException e) { // TODO Auto-generated catch block e.printStackTrace(); }catch(SQLException e1){ e1.printStackTrace(); } 我的结果如下 1 芒果干 13.00 106g 2019.12.29 2020.12.29 12months java.sql.SQLException: Operation not allowed after ResultSet closed at com.mysql.jdbc.SQLError.createSQLException(SQLError.java:963)
python pd.merge()合并后的DataFrame无法输出到excel表
代码: import pandas as pd from pandas import DataFrame df3 = DataFrame({'key1': ['one', 'two', 'three', 'two'], 'key2': ['two', 'three', 'one', 'one'], 'data': [1, 2, 3, 4]}) df4 = DataFrame({'key1': ['two', 'two', 'three'], 'key2': ['one', 'two', 'one'], 'data': [1, 2, 3]}) data = pd.merge(df3, df4, on=['key1', 'key2'], how='outer') print(data) data.to_excel('D:\01.xls', na_rep=None) 结果: key1 key2 data_x data_y 0 one two 1.0 NaN 1 two three 2.0 NaN 2 three one 3.0 3.0 3 two one 4.0 1.0 4 two two NaN 2.0 Traceback (most recent call last): File "D:/python项目/02.py", line 232, in <module> data.to_excel('D:\01.xls', na_rep=None) File "F:\python\lib\site-packages\pandas\core\generic.py", line 2256, in to_excel engine=engine, File "F:\python\lib\site-packages\pandas\io\formats\excel.py", line 742, in write writer.save() File "F:\python\lib\site-packages\pandas\io\excel\_xlwt.py", line 32, in save return self.book.save(self.path) File "F:\python\lib\site-packages\xlwt\Workbook.py", line 710, in save doc.save(filename_or_stream, self.get_biff_data()) File "F:\python\lib\site-packages\xlwt\CompoundDoc.py", line 262, in save f = open(file_name_or_filelike_obj, 'w+b') OSError: [Errno 22] Invalid argument: 'D:\x01.xls' 为什么会报错呢?两个DataFrame使用merge方法合并后不是变成一个DataFrame了吗,为什么使用to_excel方法会出现错误?
java io File not found 找不到系统指定的文件,工程目录下有此文件源码如下
PrintWriter out = response.getWriter(); response.setContentType("text/html"); // 图片上传路径 String uploadPath = request.getSession().getServletContext().getRealPath("/") + "upload/images/"; System.out.println("uploadPath=" + uploadPath); // 图片临时上传路径 String tempPath = request.getSession().getServletContext().getRealPath("/") + "upload/images/temp/"; System.out.println("tempPath=" + tempPath); // 图片网络相对路径 String imagePath = request.getScheme() + "://" + request.getServerName() + ":" + request.getServerPort() + request.getContextPath() + "/"; System.out.println("imagePath=" + imagePath); try { DiskFileUpload fu = new DiskFileUpload(); // 设置最大文件尺寸,这里是4MB fu.setSizeMax(4194304); // 设置缓冲区大小,这里是4kb fu.setSizeThreshold(4096); // 设置临时目录: fu.setRepositoryPath(tempPath); // 得到所有的文件: List fileItems = fu.parseRequest(request); Iterator i = fileItems.iterator(); // 依次处理每一个文件: while (i.hasNext()) { FileItem file = (FileItem) i.next(); // 获得文件名,这个文件名是用户上传时用户的绝对路径: String sourcefileName = file.getName(); if (sourcefileName != null && (sourcefileName.endsWith(".jpg") || sourcefileName.endsWith(".gif"))) { // 在这里可以记录用户和文件信息,生成上传后的文件名 String destinationfileName = null; Random rd = new Random(); Calendar time = Calendar.getInstance(); if (sourcefileName.endsWith(".jpg")) { destinationfileName = String.valueOf(time.get(Calendar.YEAR)) + String.valueOf(time.get(Calendar.MONTH)) + String.valueOf(time.get(Calendar.DAY_OF_MONTH)) + String.valueOf(time.get(Calendar.HOUR_OF_DAY)) + String.valueOf(time.get(Calendar.MINUTE)) + String.valueOf(time.get(Calendar.SECOND)) + String.valueOf(rd.nextInt(100)) + ".jpg"; } else if (sourcefileName.endsWith(".gif")) { destinationfileName = String.valueOf(time.get(Calendar.YEAR)) + String.valueOf(time.get(Calendar.MONTH)) + String.valueOf(time.get(Calendar.DAY_OF_MONTH)) + String.valueOf(time.get(Calendar.HOUR_OF_DAY)) + String.valueOf(time.get(Calendar.MINUTE)) + String.valueOf(time.get(Calendar.SECOND)) + String.valueOf(rd.nextInt(100)) + ".gif"; } PhotoBean pb = new PhotoBean(); PhotoDao pd = new PhotoDao(); File Photopath1 = new File(uploadPath + destinationfileName); pb.setPhotopath(TpUtil.getBytes(Photopath1)); int result = pd.addPhoto(pb); file.write(Photopath1); if (result < 0) { out.print(sourcefileName + "成功上传!"); // out.print("<img src="+imagePath+"upload/images/"+destinationfileName+">"); } else { out.println("上传文件出错,只能上传 *.jpg , *.gif"); } // 跳转到上传成功提示页面 } } } catch (Exception e) { // 可以跳转出错页面 } out.flush(); // out.close(); ----------------------异常如下----------------------------------- uploadPath=E:\Tomcat\webapps\UpLoadTest\upload/images/ tempPath=E:\Tomcat\webapps\UpLoadTest\upload/images/temp/ imagePath=http://localhost:80/UpLoadTest/ java.io.FileNotFoundException: E:\Tomcat\webapps\UpLoadTest\upload\images\201402413141853.jpg (系统找不到指定的文件。) at java.io.FileInputStream.open(Native Method) at java.io.FileInputStream.<init>(FileInputStream.java:106) at com.nycgsweb.db.TpUtil.getBytes(TpUtil.java:50) at com.nycgsweb.servlet.UploadServlet.doPost(UploadServlet.java:122) at javax.servlet.http.HttpServlet.service(HttpServlet.java:637) at javax.servlet.http.HttpServlet.service(HttpServlet.java:717) at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter(ApplicationFilterChain.java:290) at org.apache.catalina.core.ApplicationFilterChain.doFilter(ApplicationFilterChain.java:206) at org.apache.catalina.core.StandardWrapperValve.invoke(StandardWrapperValve.java:233) at org.apache.catalina.core.StandardContextValve.invoke(StandardContextValve.java:191) at org.apache.catalina.core.StandardHostValve.invoke(StandardHostValve.java:127) at org.apache.catalina.valves.ErrorReportValve.invoke(ErrorReportValve.java:102) at org.apache.catalina.core.StandardEngineValve.invoke(StandardEngineValve.java:109) at org.apache.catalina.connector.CoyoteAdapter.service(CoyoteAdapter.java:293) at org.apache.coyote.http11.Http11Processor.process(Http11Processor.java:859) at org.apache.coyote.http11.Http11Protocol$Http11ConnectionHandler.process(Http11Protocol.java:602) at org.apache.tomcat.util.net.JIoEndpoint$Worker.run(JIoEndpoint.java:489) at java.lang.Thread.run(Thread.java:619) INSERT INTO Photo(phtot) VALUES (?)
请问如何把一列LIST转换成一列普通的浮点型
各位好: 手头有一列从汉字+数字类型字符串中提取出来的LIST,格式如下: ![图片说明](https://img-ask.csdn.net/upload/201911/15/1573807396_703846.jpg) 希望把这一列LIST转换成普通的浮点型或者整型数字,请问应该用什么办法。从网上找了几种办法都不可行,特来求助。 下面是我自己尝试的办法: alljob_new_first2['房号2'] = alljob_new_first2['房号2'].convert_objects(convert_numeric=True) alljob_new_first2['房号2'][0] = pd.to_numeric(alljob_new_first2['房号2'][0]) alljob_new_first2['房号2'][0].apply(pd.to_numeric, errors='ignore')
javabean报错java.lang.ClassNotFoundException
如题,只是书上的简单例子,三个类放在一个包中,用IntrospectorDemo去解析Colors类,系统提示java.lang.ClassNotFoundException。不知道哪边有问题。 import java.beans.*; public class IntrospectorDemo { public static void main(String[] args) { try{Class<?> c=Class.forName("Colors"); BeanInfo beanInfo=Introspector.getBeanInfo(c); System.out.println("Properties:"); PropertyDescriptor propertyDescriptor[]=beanInfo.getPropertyDescriptors(); for(int i=0;i<propertyDescriptor.length;i++) {System.out.println(propertyDescriptor[i].getName());} System.out.println("Events:"); EventSetDescriptor eventSetDescriptor[]=beanInfo.getEventSetDescriptors(); for(int i=0;i<eventSetDescriptor.length;i++) {System.out.println(eventSetDescriptor[i].getName());} }catch(Exception e) {System.out.println(e);} } } import java.awt.*; import java.awt.event.*; import java.beans.*; import java.io.*; public class ColorsBeanInfo extends SimpleBeanInfo { public PropertyDescriptor[] getPropertyDescriptors() { try{PropertyDescriptor rectangular=new PropertyDescriptor("rectangular",Colors.class); PropertyDescriptor pd[]={rectangular}; return pd; } catch(Exception e) {System.out.println(e);} return null; } } public class Colors extends Canvas implements Serializable{ transient private Color color; private boolean rectangular=false; public Colors() { addMouseListener(new MouseAdapter(){ public void mousePressed(MouseEvent me){change();} }); setSize(200,100); change(); } public boolean getRectangular() {return rectangular;} public void setRectangular(boolean flag) {this.rectangular=flag; repaint();} public void change() {color=randomColor(); repaint();} private Color randomColor() {int r=(int)(255*Math.random()); int g=(int)(255*Math.random()); int b=(int)(255*Math.random()); return new Color(r,g,b); } public void paint(Graphics g) { Dimension d=getSize(); int h=d.height; int w=d.width; g.setColor(color); if(rectangular){g.fillRect(0, 0, w-1, h-1);} else {g.fillOval(0, 0, w-1, h-1);} } }
python3 用pdfminer3k爬取PDF文件不完整,请问有什么解决方法吗?
最近在用Python爬交易所公告的PDF文件,参考了论坛上各位大神的介绍,安装了pdfminer3k,并成功解析了PDF文件。不过我发现有些PDF文件解析的时候只能解析一部分内容出来,大段的文字没有解析出来,请问是什么问题,有什么解决方案吗?查了好久没找到类似的问题,感谢大家! 下面是我的代码: # -*- coding: utf-8 -*- from urllib.request import Request from urllib.request import quote from urllib.request import urlopen import pandas as pd from pdfminer.converter import PDFPageAggregator from pdfminer.layout import LTTextBoxHorizontal, LAParams from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter from pdfminer.pdfinterp import PDFTextExtractionNotAllowed from pdfminer.pdfparser import PDFParser, PDFDocument headers = {'content-type': 'application/json', 'Accept-Encoding': 'gzip, deflate', 'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:53.0) Gecko/20100101 Firefox/53.0'} baseurl = "http://" def parse(docucode, txtcode): try: # 打开在线PDF文档 #_path = baseurl + quote(docucode) + "?random=0.3006649122149502" _path = baseurl + quote(docucode) request = Request(url=_path, headers=headers) # 随机从user_agent列表中抽取一个元素 fp = urlopen(request,timeout=500) #timeout设置超时的时间,防止出现访问超时问题 # 读取本地文件 # path = './2015.pdf' # fp = open(path, 'rb') # 用文件对象来创建一个pdf文档分析器 praser_pdf = PDFParser(fp) # 创建一个PDF文档 doc = PDFDocument() # 连接分析器 与文档对象 praser_pdf.set_document(doc) doc.set_parser(praser_pdf) # 提供初始化密码doc.initialize("123456") # 如果没有密码 就创建一个空的字符串 doc.initialize() # 检测文档是否提供txt转换,不提供就忽略 if not doc.is_extractable: raise PDFTextExtractionNotAllowed else: # 创建PDf资源管理器 来管理共享资源 rsrcmgr = PDFResourceManager() # 创建一个PDF参数分析器 laparams = LAParams() # 创建聚合器 device = PDFPageAggregator(rsrcmgr, laparams=laparams) # 创建一个PDF页面解释器对象 interpreter = PDFPageInterpreter(rsrcmgr, device) # 循环遍历列表,每次处理一页的内容 # doc.get_pages() 获取page列表 for page in doc.get_pages(): # 使用页面解释器来读取 interpreter.process_page(page) # 使用聚合器获取内容 layout = device.get_result() # 这里layout是一个LTPage对象 里面存放着 这个page解析出的各种对象 一般包括LTTextBox, # LTFigure, LTImage, LTTextBoxHorizontal 等等 想要获取文本就获得对象的text属性, for out in layout: # 判断是否含有get_text()方法,图片之类的就没有 # if ``hasattr(out,"get_text"): docname = str(txtcode).split('.')[0]+'.txt' with open(docname, 'a') as f: if isinstance(out, LTTextBoxHorizontal): results = out.get_text() #print(results) f.write(results) except Exception as e: #抛出超时异常 print("a", str(e)) pdfurl = 'www.sse.com.cn/disclosure/credibility/supervision/inquiries/opinion/c/8135857143683813.pdf' txtname = 'ceshi' parse(pdfurl, txtname)
终于明白阿里百度这样的大公司,为什么面试经常拿ThreadLocal考验求职者了
点击上面↑「爱开发」关注我们每晚10点,捕获技术思考和创业资源洞察什么是ThreadLocalThreadLocal是一个本地线程副本变量工具类,各个线程都拥有一份线程私有的数
程序员必须掌握的核心算法有哪些?
由于我之前一直强调数据结构以及算法学习的重要性,所以就有一些读者经常问我,数据结构与算法应该要学习到哪个程度呢?,说实话,这个问题我不知道要怎么回答你,主要取决于你想学习到哪些程度,不过针对这个问题,我稍微总结一下我学过的算法知识点,以及我觉得值得学习的算法。这些算法与数据结构的学习大多数是零散的,并没有一本把他们全部覆盖的书籍。下面是我觉得值得学习的一些算法以及数据结构,当然,我也会整理一些看过
《奇巧淫技》系列-python!!每天早上八点自动发送天气预报邮件到QQ邮箱
此博客仅为我业余记录文章所用,发布到此,仅供网友阅读参考,如有侵权,请通知我,我会删掉。 补充 有不少读者留言说本文章没有用,因为天气预报直接打开手机就可以收到了,为何要多此一举发送到邮箱呢!!!那我在这里只能说:因为你没用,所以你没用!!! 这里主要介绍的是思路,不是天气预报!不是天气预报!!不是天气预报!!!天气预报只是用于举例。请各位不要再刚了!!! 下面是我会用到的两个场景: 每日下
死磕YOLO系列,YOLOv1 的大脑、躯干和手脚
YOLO 是我非常喜欢的目标检测算法,堪称工业级的目标检测,能够达到实时的要求,它帮我解决了许多实际问题。 这就是 YOLO 的目标检测效果。它定位了图像中物体的位置,当然,也能预测物体的类别。 之前我有写博文介绍过它,但是每次重新读它的论文,我都有新的收获,为此我准备写一个系列的文章来详尽分析它。这是第一篇,从它的起始 YOLOv1 讲起。 YOLOv1 的论文地址:https://www.c
知乎高赞:中国有什么拿得出手的开源软件产品?(整理自本人原创回答)
知乎高赞:中国有什么拿得出手的开源软件产品? 在知乎上,有个问题问“中国有什么拿得出手的开源软件产品(在 GitHub 等社区受欢迎度较好的)?” 事实上,还不少呢~ 本人于2019.7.6进行了较为全面的 回答 - Bravo Yeung,获得该问题下回答中得最高赞(236赞和1枚专业勋章),对这些受欢迎的 Github 开源项目分类整理如下: 分布式计算、云平台相关工具类 1.SkyWalk
20行Python代码爬取王者荣耀全英雄皮肤
引言 王者荣耀大家都玩过吧,没玩过的也应该听说过,作为时下最火的手机MOBA游戏,咳咳,好像跑题了。我们今天的重点是爬取王者荣耀所有英雄的所有皮肤,而且仅仅使用20行Python代码即可完成。 准备工作 爬取皮肤本身并不难,难点在于分析,我们首先得得到皮肤图片的url地址,话不多说,我们马上来到王者荣耀的官网: 我们点击英雄资料,然后随意地选择一位英雄,接着F12打开调试台,找到英雄原皮肤的图片
简明易理解的@SpringBootApplication注解源码解析(包含面试提问)
欢迎关注文章系列 ,关注我 《提升能力,涨薪可待》 《面试知识,工作可待》 《实战演练,拒绝996》 欢迎关注我博客,原创技术文章第一时间推出 也欢迎关注公 众 号【Ccww笔记】,同时推出 如果此文对你有帮助、喜欢的话,那就点个赞呗,点个关注呗! 《提升能力,涨薪可待篇》- @SpringBootApplication注解源码解析 一、@SpringBootApplication 的作用是什
西游记团队中如果需要裁掉一个人,会先裁掉谁?
2019年互联网寒冬,大批企业开始裁员,下图是网上流传的一张截图: 裁员不可避免,那如何才能做到不管大环境如何变化,自身不受影响呢? 我们先来看一个有意思的故事,如果西游记取经团队需要裁员一名,会裁掉谁呢,为什么? 西游记团队组成: 1.唐僧 作为团队teamleader,有很坚韧的品性和极高的原则性,不达目的不罢休,遇到任何问题,都没有退缩过,又很得上司支持和赏识(直接得到唐太宗的任命,既给
Python语言高频重点汇总
Python语言高频重点汇总 GitHub面试宝典仓库——点这里跳转 文章目录Python语言高频重点汇总**GitHub面试宝典仓库——点这里跳转**1. 函数-传参2. 元类3. @staticmethod和@classmethod两个装饰器4. 类属性和实例属性5. Python的自省6. 列表、集合、字典推导式7. Python中单下划线和双下划线8. 格式化字符串中的%和format9.
究竟你适不适合买Mac?
我清晰的记得,刚买的macbook pro回到家,开机后第一件事情,就是上了淘宝网,花了500元钱,找了一个上门维修电脑的师傅,上门给我装了一个windows系统。。。。。。 表砍我。。。 当时买mac的初衷,只是想要个固态硬盘的笔记本,用来运行一些复杂的扑克软件。而看了当时所有的SSD笔记本后,最终决定,还是买个好(xiong)看(da)的。 已经有好几个朋友问我mba怎么样了,所以今天尽量客观
程序员一般通过什么途径接私活?
二哥,你好,我想知道一般程序猿都如何接私活,我也想接,能告诉我一些方法吗? 上面是一个读者“烦不烦”问我的一个问题。其实不止是“烦不烦”,还有很多读者问过我类似这样的问题。 我接的私活不算多,挣到的钱也没有多少,加起来不到 20W。说实话,这个数目说出来我是有点心虚的,毕竟太少了,大家轻喷。但我想,恰好配得上“一般程序员”这个称号啊。毕竟苍蝇再小也是肉,我也算是有经验的人了。 唾弃接私活、做外
ES6基础-ES6的扩展
进行对字符串扩展,正则扩展,数值扩展,函数扩展,对象扩展,数组扩展。 开发环境准备: 编辑器(VS Code, Atom,Sublime)或者IDE(Webstorm) 浏览器最新的Chrome 字符串的扩展: 模板字符串,部分新的方法,新的unicode表示和遍历方法: 部分新的字符串方法 padStart,padEnd,repeat,startsWith,endsWith,includes 字
Python爬虫爬取淘宝,京东商品信息
小编是一个理科生,不善长说一些废话。简单介绍下原理然后直接上代码。 使用的工具(Python+pycharm2019.3+selenium+xpath+chromedriver)其中要使用pycharm也可以私聊我selenium是一个框架可以通过pip下载 pip install selenium -i https://pypi.tuna.tsinghua.edu.cn/simple/ 
阿里程序员写了一个新手都写不出的低级bug,被骂惨了。
你知道的越多,你不知道的越多 点赞再看,养成习惯 本文 GitHub https://github.com/JavaFamily 已收录,有一线大厂面试点思维导图,也整理了很多我的文档,欢迎Star和完善,大家面试可以参照考点复习,希望我们一起有点东西。 前前言 为啥今天有个前前言呢? 因为你们的丙丙啊,昨天有牌面了哟,直接被微信官方推荐,知乎推荐,也就仅仅是还行吧(心里乐开花)
Java工作4年来应聘要16K最后没要,细节如下。。。
前奏: 今天2B哥和大家分享一位前几天面试的一位应聘者,工作4年26岁,统招本科。 以下就是他的简历和面试情况。 基本情况: 专业技能: 1、&nbsp;熟悉Sping了解SpringMVC、SpringBoot、Mybatis等框架、了解SpringCloud微服务 2、&nbsp;熟悉常用项目管理工具:SVN、GIT、MAVEN、Jenkins 3、&nbsp;熟悉Nginx、tomca
Python爬虫精简步骤1 获取数据
爬虫的工作分为四步: 1.获取数据。爬虫程序会根据我们提供的网址,向服务器发起请求,然后返回数据。 2.解析数据。爬虫程序会把服务器返回的数据解析成我们能读懂的格式。 3.提取数据。爬虫程序再从中提取出我们需要的数据。 4.储存数据。爬虫程序把这些有用的数据保存起来,便于你日后的使用和分析。 这一篇的内容就是:获取数据。 首先,我们将会利用一个强大的库——requests来获取数据。 在电脑上安装
作为一个程序员,CPU的这些硬核知识你必须会!
CPU对每个程序员来说,是个既熟悉又陌生的东西? 如果你只知道CPU是中央处理器的话,那可能对你并没有什么用,那么作为程序员的我们,必须要搞懂的就是CPU这家伙是如何运行的,尤其要搞懂它里面的寄存器是怎么一回事,因为这将让你从底层明白程序的运行机制。 随我一起,来好好认识下CPU这货吧 把CPU掰开来看 对于CPU来说,我们首先就要搞明白它是怎么回事,也就是它的内部构造,当然,CPU那么牛的一个东
破14亿,Python分析我国存在哪些人口危机!
2020年1月17日,国家统计局发布了2019年国民经济报告,报告中指出我国人口突破14亿。 猪哥的朋友圈被14亿人口刷屏,但是很多人并没有看到我国复杂的人口问题:老龄化、男女比例失衡、生育率下降、人口红利下降等。 今天我们就来分析一下我们国家的人口数据吧! 更多有趣分析教程,扫描下方二维码关注vx公号「裸睡的猪」 即可查看! 一、背景 1.人口突破14亿 2020年1月17日,国家统计局发布
web前端javascript+jquery知识点总结
Javascript javascript 在前端网页中占有非常重要的地位,可以用于验证表单,制作特效等功能,它是一种描述语言,也是一种基于对象(Object)和事件驱动并具有安全性的脚本语言 ,语法同java类似,是一种解释性语言,边执行边解释。 JavaScript的组成: ECMAScipt 用于描述: 语法,变量和数据类型,运算符,逻辑控制语句,关键字保留字,对象。 浏览器对象模型(Br
Qt实践录:开篇
本系列文章介绍笔者的Qt实践之路。 背景 笔者首次接触 Qt 大约是十多年前,当时试用了 Qt ,觉得不如 MFC 好用。现在 Qt 的 API、文档等都比较完善,在年初决定重新拾起,正所谓技多不压身,将 Qt 当为一种谋生工具亦未尝不可。利用春节假期的集中时间,快速专攻一下。 本系列名为“Qt实践”,故不是教程,笔者对 Qt 的定位是“使用”,可以帮助快速编写日常的工具,如串口、网络等。所以不
在家远程办公效率低?那你一定要收好这个「在家办公」神器!
相信大家都已经收到国务院延长春节假期的消息,接下来,在家远程办公可能将会持续一段时间。 但是问题来了。远程办公不是人在电脑前就当坐班了,相反,对于沟通效率,文件协作,以及信息安全都有着极高的要求。有着非常多的挑战,比如: 1在异地互相不见面的会议上,如何提高沟通效率? 2文件之间的来往反馈如何做到及时性?如何保证信息安全? 3如何规划安排每天工作,以及如何进行成果验收? ......
作为一个程序员,内存和磁盘的这些事情,你不得不知道啊!!!
截止目前,我已经分享了如下几篇文章: 一个程序在计算机中是如何运行的?超级干货!!! 作为一个程序员,CPU的这些硬核知识你必须会! 作为一个程序员,内存的这些硬核知识你必须懂! 这些知识可以说是我们之前都不太重视的基础知识,可能大家在上大学的时候都学习过了,但是嘞,当时由于老师讲解的没那么有趣,又加上这些知识本身就比较枯燥,所以嘞,大家当初几乎等于没学。 再说啦,学习这些,也看不出来有什么用啊!
这个世界上人真的分三六九等,你信吗?
偶然间,在知乎上看到一个问题 一时间,勾起了我深深的回忆。 以前在厂里打过两次工,做过家教,干过辅导班,做过中介。零下几度的晚上,贴过广告,满脸、满手地长冻疮。   再回首那段岁月,虽然苦,但让我学会了坚持和忍耐。让我明白了,在这个世界上,无论环境多么的恶劣,只要心存希望,星星之火,亦可燎原。   下文是原回答,希望能对你能有所启发。   如果我说,这个世界上人真的分三六九等,
为什么听过很多道理,依然过不好这一生?
记录学习笔记是一个重要的习惯,不希望学习过的东西成为过眼云烟。做总结的同时也是一次复盘思考的过程。 本文是根据阅读得到 App上《万维钢·精英日课》部分文章后所做的一点笔记和思考。学习是一个系统的过程,思维模型的建立需要相对完整的学习和思考过程。以下观点是在碎片化阅读后总结的一点心得总结。
B 站上有哪些很好的学习资源?
哇说起B站,在小九眼里就是宝藏般的存在,放年假宅在家时一天刷6、7个小时不在话下,更别提今年的跨年晚会,我简直是跪着看完的!! 最早大家聚在在B站是为了追番,再后来我在上面刷欧美新歌和漂亮小姐姐的舞蹈视频,最近两年我和周围的朋友们已经把B站当作学习教室了,而且学习成本还免费,真是个励志的好平台ヽ(.◕ฺˇд ˇ◕ฺ;)ノ 下面我们就来盘点一下B站上优质的学习资源: 综合类 Oeasy: 综合
雷火神山直播超两亿,Web播放器事件监听是怎么实现的?
Web播放器解决了在手机浏览器和PC浏览器上播放音视频数据的问题,让视音频内容可以不依赖用户安装App,就能进行播放以及在社交平台进行传播。在视频业务大数据平台中,播放数据的统计分析非常重要,所以Web播放器在使用过程中,需要对其内部的数据进行收集并上报至服务端,此时,就需要对发生在其内部的一些播放行为进行事件监听。 那么Web播放器事件监听是怎么实现的呢? 01 监听事件明细表 名
3万字总结,Mysql优化之精髓
本文知识点较多,篇幅较长,请耐心学习 MySQL已经成为时下关系型数据库产品的中坚力量,备受互联网大厂的青睐,出门面试想进BAT,想拿高工资,不会点MySQL优化知识,拿offer的成功率会大大下降。 为什么要优化 系统的吞吐量瓶颈往往出现在数据库的访问速度上 随着应用程序的运行,数据库的中的数据会越来越多,处理时间会相应变慢 数据是存放在磁盘上的,读写速度无法和内存相比 如何优化 设计
一条链接即可让黑客跟踪你的位置! | Seeker工具使用
搬运自:冰崖的部落阁(icecliffsnet) 严正声明:本文仅限于技术讨论,严禁用于其他用途。 请遵守相对应法律规则,禁止用作违法途径,出事后果自负! 上次写的防社工文章里边提到的gps定位信息(如何防止自己被社工或人肉) 除了主动收集他人位置信息以外,我们还可以进行被动收集 (没有技术含量) Seeker作为一款高精度地理位置跟踪工具,同时也是社交工程学(社会工程学)爱好者...
作为程序员的我,大学四年一直自学,全靠这些实用工具和学习网站!
我本人因为高中沉迷于爱情,导致学业荒废,后来高考,毫无疑问进入了一所普普通通的大学,实在惭愧...... 我又是那么好强,现在学历不行,没办法改变的事情了,所以,进入大学开始,我就下定决心,一定要让自己掌握更多的技能,尤其选择了计算机这个行业,一定要多学习技术。 在进入大学学习不久后,我就认清了一个现实:我这个大学的整体教学质量和学习风气,真的一言难尽,懂的人自然知道怎么回事? 怎么办?我该如何更好的提升
前端JS初级面试题二 (。•ˇ‸ˇ•。)老铁们!快来瞧瞧自己都会了么
1. 传统事件绑定和符合W3C标准的事件绑定有什么区别? 传统事件绑定 &lt;div onclick=""&gt;123&lt;/div&gt; div1.onclick = function(){}; &lt;button onmouseover=""&gt;&lt;/button&gt; 注意: 如果给同一个元素绑定了两次或多次相同类型的事件,那么后面的绑定会覆盖前面的绑定 (不支持DOM事...
Python学习笔记(语法篇)
本篇博客大部分内容摘自埃里克·马瑟斯所著的《Python编程:从入门到实战》(入门类书籍),采用举例的方式进行知识点提要 关于Python学习书籍推荐文章 《学习Python必备的8本书》 Python语法特点: 通过缩进进行语句组织 不需要变量或参数的声明 冒号 1 变量和简单数据结构 1.1 变量命名 只能包含字母、数字和下划线,且不能以数字打头。 1.2 字符串 在Python中,用引号...
相关热词 c#导入fbx c#中屏蔽键盘某个键 c#正态概率密度 c#和数据库登陆界面设计 c# 高斯消去法 c# codedom c#读取cad文件文本 c# 控制全局鼠标移动 c# temp 目录 bytes初始化 c#
立即提问