大神求救 htmlunit 爬虫抓取中国移动数据的问题。 20C

移动登陆地址:https://sn.ac.10086.cn/login

以下是我的测试代码。 根据元素获取图片保存到本地,然后scanner输入验证码之后模拟提交。但是 如果说 验证码输入的位数不对,还会给我返回 验证码必须为4位
如果按照我下载保存的验证码 去输入没有任何提示了,打印的页面还是 登陆页面。
所以 小弟不知道是因为验证码输入错了。 还是因为这种方法不行?求指教

    String phoneNo = "18220834780";
    String passwords = "xxx";
    String validateCodes = null;
    // 5、模拟用户登录
    final WebClient webClient = new WebClient();
    // 1.获取某个待测页面
    final HtmlPage page = webClient.getPage("https://sn.ac.10086.cn/login");

    System.out.println(page.getTitleText() + "---------------------");

    HtmlForm form = page.getForms().get(0);

    HtmlTextInput username = (HtmlTextInput) form.getInputByName("userName");
    System.out.println(username);

    HtmlPasswordInput password = (HtmlPasswordInput) form.getInputByName("password");
    System.out.println(password);
    HtmlTextInput verifyCode = (HtmlTextInput) form.getInputByName("verifyCode");
    username.setValueAttribute(phoneNo);
    password.setValueAttribute(passwords);

    DomNodeList<DomNode> iList = page.querySelectorAll(".loginPageBtn2013");
    HtmlImage valiCodeImg = (HtmlImage) page.getElementById("verifyImg");
    ImageReader imageReader = valiCodeImg.getImageReader();
    BufferedImage bufferedImage = imageReader.read(0);

    BufferedImage inputbig = new BufferedImage(256, 256, BufferedImage.TYPE_INT_BGR);
    Graphics2D g = (Graphics2D) inputbig.getGraphics();
    g.drawImage(bufferedImage, 0, 0, 100, 100, null); // 画图
    g.dispose();
    inputbig.flush();

    File file2 = new File("e:/"); // 此目录保存缩小后的关键图
    if (file2.exists()) {
        System.out.println("多级目录已经存在不需要创建!!");
    } else {
        // 如果要创建的多级目录不存在才需要创建。
        file2.mkdirs();
    }
    String name = "asasdas.png";
    String fname = name.substring(0, name.lastIndexOf("."));// 新名字
    ImageIO.write(inputbig, "jpg", new File("e:/" + fname + ".jpg")); // 将其保存在C:/imageSort/targetPIC/下
    System.out.println("请输入验证码");
    Scanner scanner = new Scanner(System.in);

    verifyCode.setValueAttribute(scanner.next());
    HtmlPage retPage = ((DomElement) iList.get(0)).click();
    System.out.println(retPage.asXml());

1个回答

会报错,校验到密码了

 四月 25, 2017 11:00:34 上午 com.gargoylesoftware.htmlunit.javascript.host.Window jsxFunction_confirm
警告: window.confirm("尊敬的客户,由于您的服务密码过于简单,为有效保护您个人信息安全,请您先修改服务密码!") no confirm handler installed, simulating the OK button
四月 25, 2017 11:00:34 上午 com.gargoylesoftware.htmlunit.WebClient openWindow
严重: Error loading content into window
javax.net.ssl.SSLPeerUnverifiedException: peer not authenticated
    at sun.security.ssl.SSLSessionImpl.getPeerCertificates(Unknown Source)
    at org.apache.http.conn.ssl.AbstractVerifier.verify(AbstractVerifier.java:128)
    at org.apache.http.conn.ssl.SSLSocketFactory.connectSocket(SSLSocketFactory.java:397)
    at org.apache.http.impl.conn.DefaultClientConnectionOperator.openConnection(DefaultClientConnectionOperator.java:148)
    at org.apache.http.impl.conn.AbstractPoolEntry.open(AbstractPoolEntry.java:149)
    at org.apache.http.impl.conn.AbstractPooledConnAdapter.open(AbstractPooledConnAdapter.java:121)

验证码应该是通过了,我改了一些:

        File path = new File("d:/login"); // 此目录保存缩小后的关键图
        if (!path.isDirectory())
            path.mkdirs();

        ImageIO.write(inputbig, "png", new File(path,"code.png")); // 将其保存在C:/imageSort/targetPIC/下
        System.out.println("请输入验证码");
        Scanner scanner = new Scanner(System.in);

        verifyCode.setValueAttribute(scanner.next());
        HtmlPage retPage = ((HtmlElement) iList.get(0)).click();
        System.out.println(retPage.asXml());
        scanner.close();
caoheike
caoheike 回复_1_1_7_: 我看了下 初始化密码的话 页面有消息框,验证码错误的情况下 也回这样提示,并且。如果不用默认的密码他直接登录之后又返回到首页了
2 年多之前 回复
u011606457
_1_1_7_ 还有就是注意版本的问题,我用的是htmlunit-2.9
2 年多之前 回复
caoheike
caoheike 还有 我没有输出 密码校验结果
2 年多之前 回复
caoheike
caoheike 谢谢 大牛 可以提供下 联系方式吗?交流下
2 年多之前 回复
Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
htmlunit抓取数据时,遇到滚动条,抓取的页面信息不全
用htmlunit抓取数据时,如果遇到了滚动条,滚动条拉到低才能加载所有的信息,求解答:这种情况下如何抓取所有信息
关于htmlunit登陆QQ邮箱的问题 ,大神求救
以下代码返回 ptuiCB('22009','0','','0','对不起,你的号码登录异常,请使用QQ手机版扫描二维码安全登录。(帮助反馈)(22009)', ''); 都说是js版本的问题 QQ邮箱登录地址:https://ui.ptlogin2.qq.com/cgi-bin/login?style=9&appid=522005705&daid=4&s_url=https%3A%2F%2Fw.mail.qq.com%2Fcgi-bin%2Flogin%3Fvt%3Dpassport%26vm%3Dwsk%26delegate_url%3D%26f%3Dxhtml%26target%3D&hln_css=http%3A%2F%2Fmail.qq.com%2Fzh_CN%2Fhtmledition%2Fimages%2Flogo%2Fqqmail%2Fqqmail_logo_default_200h.png&low_login=1&hln_autologin=%E8%AE%B0%E4%BD%8F%E7%99%BB%E5%BD%95%E7%8A%B6%E6%80%81&pt_no_onekey=1 如果说是js版本问题,请问大牛有没有最新邮箱JS加密的方法 谢谢了! WebClient webClients = new WebClient(BrowserVersion.CHROME); webClients.getCookieManager().setCookiesEnabled(true);// 开启cookie管理 webClients.getOptions().setTimeout(90000); webClients.getOptions().setCssEnabled(true); webClients.getOptions().setJavaScriptEnabled(true); webClients.setJavaScriptTimeout(40000); webClients.getOptions().setRedirectEnabled(true); webClients.getOptions().setThrowExceptionOnScriptError(false); webClients.getOptions().setThrowExceptionOnFailingStatusCode(false); webClients.setAjaxController(new NicelyResynchronizingAjaxController()); webClients.getOptions().setCssEnabled(false); webClients.getOptions().setJavaScriptEnabled(true); HtmlPage page = webClients.getPage("https://ssl.ptlogin2.qq.com/check?pt_tea=2&uin=1121212159&appid=522005705&ptlang=2052&regmaster=&pt_uistyle=9&r=0.07655477741844985&pt_jstoken=1515144655"); String info = page.asText();//返回结果为ptui_checkVC('0','!WMQ','\x00\x00\x00\x00\x42\xd4\x56\xff','c7b633efb1ed1aee687d7c01a5610dcddaf6401e6eb6bcb71530a57d261f1ed8964ea74d502171e67019c0018468e489bebfe01c55775031','2'); System.out.println(info); //截取 ptui_checkVC('0','!WMQ','\x00\x00\x00\x00\x42\xd4\x56\xff','c7b633efb1ed1aee687d7c01a5610dcddaf6401e6eb6bcb71530a57d261f1ed8964ea74d502171e67019c0018468e489bebfe01c55775031','2'); String[] infoarry = info.split(","); String xx = infoarry[2].replace("'", ""); String code = infoarry[1].replace("'", ""); String sess = infoarry[3].replace("'", ""); ScriptEngineManager factory = new ScriptEngineManager(); ScriptEngine engine = factory.getEngineByName("JavaScript"); engine.eval(new FileReader("D:/js/qq.js")); engine.eval("var encryptionPassword = getEncryption('weizai9527','" + xx+ "','" + code + "', undefined);"); String p = engine.get("encryptionPassword").toString(); HtmlPage pages = webClients .getPage("https://ssl.ptlogin2.qq.com/login?pt_vcode_v1=0&" + "pt_verifysession_v1=" + sess + "&" + "verifycode=" + code + "&u=1121212159&" + "p=" + p + "" + "&" + "pt_randsalt=2&" + "ptlang=2052&" + "low_login_enable=1&" + "low_login_hour=720&" + "u1=https%3A%2F%2Fw.mail.qq.com%2Fcgi-bin%2Flogin%3Fvt%3Dpassport%26vm%3Dwsk%26delegate_url%3D%26f%3Dxhtml%26target%3D%26ss%3D1&" + "from_ui=1&fp=loginerroralert&device=2&" + "aid=522005705&" + "daid=4&pt_3rd_aid=0&ptredirect=1&h=1&g=1&pt_uistyle=9&regmaster=&"); System.out.println(pages.asText()); } ``` ```
Htmlunit抓取数据失败
Cannot locate declared field class org.apache.http.impl.client.HttpClientBuilder.dnsResolver ![图片说明](https://img-ask.csdn.net/upload/201704/21/1492761765_782220.png)
htmlunit 调用js获取返回数据
以前没接触过htmlunit 在网上找不到,只有通过标签调用事件,得到下一个页面, 我想知道怎么 直接执行js的方法 这个放个是向和后台发送请求的,返回请求数据, 用htmlunit怎么做才能直接调用该方法并的到返回的数据
java htmlunit 导致的残留好多webSocket线程 问题 ?求解
java htmlunit 导致的残留好多webSocket线程 问题 ?求解
JAVA htmlunit 抓取不到 页面 元素
下面代码中 能获取到百度页面的Form 表单, 但是获取不到另外一个 网页的表单, 此时该如何处理? ps:获取另外一个网页的源码保存html后,用浏览器打开,能看到 form 表单。 package com.xttx.cn.fetchpro.fetchImp; import java.io.IOException; import java.net.URL; import java.util.List; import com.gargoylesoftware.htmlunit.BrowserVersion; import com.gargoylesoftware.htmlunit.CollectingAlertHandler; import com.gargoylesoftware.htmlunit.FailingHttpStatusCodeException; import com.gargoylesoftware.htmlunit.HttpWebConnection; import com.gargoylesoftware.htmlunit.NicelyResynchronizingAjaxController; import com.gargoylesoftware.htmlunit.WebClient; import com.gargoylesoftware.htmlunit.WebRequest; import com.gargoylesoftware.htmlunit.html.HtmlForm; import com.gargoylesoftware.htmlunit.html.HtmlPage; import com.xttx.cn.fetchpro.exception.PageNotFoundException; public class SimulationFetch { protected static WebClient webClient = null; public WebClient getWebClient() { return webClient; } public void setWebClient(WebClient webClient) { this.webClient = webClient; } static WebRequest request = null; public static void main(String[] args) throws FailingHttpStatusCodeException, IOException, PageNotFoundException, InterruptedException { // TODO Auto-generated method stub BrowserVersion.FIREFOX_24.setBrowserLanguage("zh-CN"); BrowserVersion.FIREFOX_24.setSystemLanguage("zh-CN"); BrowserVersion.FIREFOX_24.setUserLanguage("zh-CN"); BrowserVersion.FIREFOX_24.setUserAgent("Mozilla/5.0 (Windows NT 6.1; WOW64; rv:46.0) Gecko/20100101 Firefox/46.0"); BrowserVersion.FIREFOX_24.setBrowserVersion(46.0f); BrowserVersion.FIREFOX_24.setCpuClass("x64"); webClient = new WebClient(BrowserVersion.FIREFOX_24); webClient.setWebConnection(new HttpWebConnection(webClient)); webClient.getCache().clear(); webClient.getCookieManager().clearCookies(); webClient.getOptions().setJavaScriptEnabled(true); webClient.setJavaScriptTimeout(60*1000); webClient.getOptions().setCssEnabled(true); webClient.getOptions().setActiveXNative(true); webClient.getOptions().setPopupBlockerEnabled(true); webClient.getOptions().setRedirectEnabled(true); webClient.getOptions().setTimeout(10000); webClient.getOptions().setDoNotTrackEnabled(true); webClient.getCookieManager().setCookiesEnabled(true); webClient.getOptions().setThrowExceptionOnFailingStatusCode(true); webClient.getOptions().setThrowExceptionOnScriptError(false); webClient.getOptions().setUseInsecureSSL(true); webClient.getOptions().setSSLInsecureProtocol("TLSv1.2"); webClient.setAjaxController(new NicelyResynchronizingAjaxController()); webClient.setAlertHandler(new CollectingAlertHandler()); HtmlPage loginPageWithForm =(HtmlPage)webClient.getPage(new WebRequest(new URL("https://login.youzan.com/sso/index?service=kdt&from_source=pzshouye"))); List<HtmlForm> htmlForm0 = loginPageWithForm.getForms(); HtmlPage loginPageNoForm = (HtmlPage)webClient.getPage(new WebRequest(new URL("https://www.baidu.com/"))); HtmlForm htmlForm = loginPageNoForm.getForms().get(0); System.out.println("---"); } }
htmlunit+jsoup爬取知乎视频,获取的html字符串中缺少视频信息,如何解决?
大神帮忙看一下 今天使用htmlunit+jsoup爬取知乎网站的视频,发现爬取到的html中缺少视频的信息,无法进行下一步了 知乎视频网址:https://video.zhihu.com/video/1157743087110549504?autoplay=false&useMSE= 浏览器检查中查看到的视频信息 ![图片说明](https://img-ask.csdn.net/upload/201910/12/1570872018_377176.png) java代码 ``` @Test public void testttt() { final WebClient webClient = new WebClient(BrowserVersion.CHROME);//新建一个模拟谷歌Chrome浏览器的浏览器客户端对象 webClient.getOptions().setThrowExceptionOnScriptError(false);//当JS执行出错的时候是否抛出异常, 这里选择不需要 webClient.getOptions().setThrowExceptionOnFailingStatusCode(false);//当HTTP的状态非200时是否抛出异常, 这里选择不需要 webClient.getOptions().setActiveXNative(false); webClient.getOptions().setCssEnabled(false);//是否启用CSS, 因为不需要展现页面, 所以不需要启用 webClient.getOptions().setJavaScriptEnabled(true); //很重要,启用JS webClient.setAjaxController(new NicelyResynchronizingAjaxController());//很重要,设置支持AJAX HtmlPage page = null; try { page = webClient.getPage("https://video.zhihu.com/video/1157743087110549504?autoplay=false&useMSE=");//尝试加载上面图片例子给出的网页 // page = webClient.getPage("http://ent.sina.com.cn/film/");//尝试加载上面图片例子给出的网页 } catch (Exception e) { e.printStackTrace(); }finally { webClient.close(); } webClient.waitForBackgroundJavaScript(30000000);//异步JS执行需要耗时,所以这里线程要阻塞30秒,等待异步JS执行结束 String pageXml = page.asXml();//直接将加载完成的页面转换成xml格式的字符串 System.out.println(pageXml); //TODO 下面的代码就是对字符串的操作了,常规的爬虫操作,用到了比较好用的Jsoup库 // Document document = Jsoup.parse(pageXml);//获取html文档 // List<Element> infoListEle = document.getElementById("feedCardContent").getElementsByAttributeValue("class", "feed-card-item");//获取元素节点等 // infoListEle.forEach(element -> { // System.out.println(element.getElementsByTag("h2").first().getElementsByTag("a").text()); // System.out.println(element.getElementsByTag("h2").first().getElementsByTag("a").attr("href")); // }); } ``` 运行程序打印的html如下: ![图片说明](https://img-ask.csdn.net/upload/201910/12/1570872108_470794.png) 有大神遇到过这个问题吗?帮忙看一下
关于htmlunit 滑动验证码的问题
现在很多网站的验证码都是拖拉的,所以用htmlunit 如何去实现。 请大神指教,最好是有代码
java HtmlUnit无法读取js网页
第一次学习爬虫,要爬几层的链接,但是爬到js链接时就报错,不知什么解决,有用过HTMLunit的大神没
在安卓项目中用HTMLunit写爬虫,报错入下,请大家帮帮忙,谢谢
05-16 13:49:12.365: E/AndroidRuntime(678): FATAL EXCEPTION: main 05-16 13:49:12.365: E/AndroidRuntime(678): java.lang.NoClassDefFoundError: com.gargoylesoftware.htmlunit.DefaultCssErrorHandler 05-16 13:49:12.365: E/AndroidRuntime(678): at com.gargoylesoftware.htmlunit.WebClient.<init>(WebClient.java:154) 05-16 13:49:12.365: E/AndroidRuntime(678): at com.gargoylesoftware.htmlunit.WebClient.<init>(WebClient.java:176) 05-16 13:49:12.365: E/AndroidRuntime(678): at com.hyt.data.HtmlText.gethtml(HtmlText.java:28) 05-16 13:49:12.365: E/AndroidRuntime(678): at com.hyt.android.LoginActivity$2.onClick(LoginActivity.java:51) 05-16 13:49:12.365: E/AndroidRuntime(678): at android.view.View.performClick(View.java:3480) 05-16 13:49:12.365: E/AndroidRuntime(678): at android.view.View$PerformClick.run(View.java:13983) 05-16 13:49:12.365: E/AndroidRuntime(678): at android.os.Handler.handleCallback(Handler.java:605) 05-16 13:49:12.365: E/AndroidRuntime(678): at android.os.Handler.dispatchMessage(Handler.java:92) 05-16 13:49:12.365: E/AndroidRuntime(678): at android.os.Looper.loop(Looper.java:137) 05-16 13:49:12.365: E/AndroidRuntime(678): at android.app.ActivityThread.main(ActivityThread.java:4340) 05-16 13:49:12.365: E/AndroidRuntime(678): at java.lang.reflect.Method.invokeNative(Native Method) 05-16 13:49:12.365: E/AndroidRuntime(678): at java.lang.reflect.Method.invoke(Method.java:511) 05-16 13:49:12.365: E/AndroidRuntime(678): at com.android.internal.os.ZygoteInit$MethodAndArgsCaller.run(ZygoteInit.java:784) 05-16 13:49:12.365: E/AndroidRuntime(678): at com.android.internal.os.ZygoteInit.main(ZygoteInit.java:551) 05-16 13:49:12.365: E/AndroidRuntime(678): at dalvik.system.NativeStart.main(Native Method) 这个爬虫单独拿出来是可以运行的,当放到安卓项目中就报错了
Java_爬虫,如何抓取Js动态生成数据的页面?
<div class="iteye-blog-content-contain" style="font-size: 14px;"> <p> </p> <p> </p> <p> </p> <p>很多网站是用js或Jquery 生成数据的,到后台获取到数据以后,用 document.write()或者("#id").html="" 的方式 写到页面中,这个时候用浏览器查看源码是看不到数据的。<br><br>HttpClient是不行的,看网上说HtmlUnit,说  可以获取后台js加载完后的完整页面,但是我按照文章上说的 写了 ,都不好使。</p> <pre name="code" class="java">String url = "http://xinjinqiao.tprtc.com/admin/main/flrpro.do"; try { WebClient webClient = new WebClient(BrowserVersion.FIREFOX_10); //设置webClient的相关参数 webClient.getOptions().setJavaScriptEnabled(true); webClient.getOptions().setCssEnabled(false); webClient.setAjaxController(new NicelyResynchronizingAjaxController()); //webClient.getOptions().setTimeout(50000); webClient.getOptions().setThrowExceptionOnScriptError(false); //模拟浏览器打开一个目标网址 HtmlPage rootPage = webClient.getPage(url); System.out.println("为了获取js执行的数据 线程开始沉睡等待"); Thread.sleep(3000);//主要是这个线程的等待 因为js加载也是需要时间的 System.out.println("线程结束沉睡"); String html = rootPage.asText(); System.out.println(html); } catch (Exception e) { } </pre> <p> </p> <p>其实这段代码不好使。<br><br><br>求解答,其中典型的就是这个链接的页面,怎么能在java程序中获取其中的数据?<br><br>http://xinjinqiao.tprtc.com/admin/main/flrpro.do</p> <p> </p> <p> </p> </div>
htmlunit 模拟登陆招商银行的问题
模拟登陆银行的时候 他的文本框是控件形式的如何处理呢? htmlunit有加载控件的方法吗?
JAVA使用htmlunit中的activeX功能,但是jacob报错 Can't find moniker,如何解决?
htmlunit开启activeX ``` webClient.getOptions().setActiveXNative(true); ``` 会报错: ``` com.jacob.com.ComFailException: Can't find moniker at com.jacob.com.Dispatch.createInstanceNative(Native Method) at com.jacob.com.Dispatch.<init>(Dispatch.java:99) at com.jacob.activeX.ActiveXComponent.<init>(ActiveXComponent.java:58) ``` 需要用到jacob.jar 项目目前导入1.19,JDK1.8,64位WIN10。 尝试过网上的更换32位JDK已及1.7JDK以及各个版本的jacob。 IE中的activeX能够正常使用,并且官网htmlunit官网示例中 ``` final ActiveXComponent activeXComponent = new ActiveXComponent("InternetExplorer.Application"); final boolean busy = activeXComponent.getProperty("Busy").getBoolean(); System.out.println(busy); ``` 也无问题。 但是在java代码中就是会报错Can't find moniker,网上也没查出个所以然来。 1. 初步判断跟htmlunit无关(错误信息是jacob初始化的时候的错误) 2. 跟jacob也无关(因为并不是所有的clsid在初始化时都会报错) 怀疑是dll的问题,但是个人并不懂dll,不清楚在什么情况下会导致jacob报错Can't find moniker。也尝试过Regsvr32注册,失败了。VC,VB的运行库也都有。也弄了个32位的Win10实验,也失败。反正网上各种都可能性的言论都试过了。 如果是因为dll编写的原因导致的,麻烦有大佬能告知一下是什么情况下会导致这个问题。 真心求教怎么解决这问题。。。脑壳痛啊
求教问题 htmlunit报错
使用htmlunit的webclient 后报错Exception in thread "main" Exception: java.lang.OutOfMemoryError thrown from the UncaughtExceptionHandler in thread "main"
求助 htmlunit报错问题 很奇葩的错 .................求解决
这几天都在做网络爬虫 遇到个很棘手的网站 JS代码太多 对于我这种普通爬虫简直是个噩梦 于是多方打听 发现了有个htmlunit 这个包 于是就导入了他 写了几行代码运行了一下 错误如下 : 这地方错的 ![图片说明](https://img-ask.csdn.net/upload/201507/22/1437494462_472924.png) 错误的提示: ![图片说明](https://img-ask.csdn.net/upload/201507/22/1437494462_190273.png) 无法找到已声明的字段类..........然后顺到这个路径 我找到了 他是为什么错的 不知道找的对不对? ![图片说明](https://img-ask.csdn.net/upload/201507/22/1437494481_836000.png) sslcontext 和sslContext单词没对上.............. 请问这问题怎么解决 ????谢谢了
java htmlunit 抓取联通 通话详单,内容无法解析
&lt;dl class=&quot;score_text_dl&quot;&gt; &lt;dt&gt;总记录数:&lt;/dt&gt; &lt;dd&gt;{$T.totalRecord}条&lt;/dd&gt; &lt;/dl&gt; &lt;dl class=&quot;score_text_dl&quot;&gt; &lt;dt&gt;固话号码:&lt;/dt&gt; &lt;dd&gt;{$T.userInfo.productId}&lt;/dd&gt; &lt;/dl&gt; &lt;dl class=&quot;score_text_dl&quot;&gt; &lt;dt&gt;费用合计:&lt;/dt&gt; &lt;dd&gt;{$T.alltotalfee}&lt;/dd&gt; &lt;/dl&gt; &lt;dl class=&quot;score_text_dl&quot;&gt; &lt;dt&gt;查询周期:&lt;/dt&gt; &lt;dd&gt;{$T.queryDateScope}&lt;/dd&gt; &lt;/dl&gt; {#/if} </textarea> <!-- 通话详单列表填充 --> <textarea id="callDetailTemplate" style="display:none;"> &lt;div class=&quot;score_table&quot;&gt; &lt;div class=&quot;space-10&quot;&gt;&lt;/div&gt; &lt;div class=&quot;tcbl&quot; id=&quot;callDetailContent&quot;&gt;&lt;!--start tc46--&gt; &lt;table width=&quot;100%&quot; class=&quot;package_tab sortable&quot; border=&quot;1&quot; autosortcol=&quot;0&quot;&gt; &lt;thead&gt; &lt;tr class=&quot;package_tab_th3&quot; &gt; &lt;th width=&quot;12%&quot; class=&quot;sorttable_sorted&quot;&gt;起始时间 &lt;ul class=&quot;click_top&quot;&gt; &lt;li class=&quot;top_img1 on&quot;&gt;&lt;/li&gt; &lt;li class=&quot;top_img2&quot;&gt;&lt;/li&gt; &lt;/ul&gt; &lt;/th&gt; &lt;th width=&quot;12%&quot;&gt;通话时长 &lt;ul class=&quot;click_top&quot;&gt; &lt;li class=&quot;top_img1&quot;&gt;&lt;/li&gt; &lt;li class=&quot;top_img2&quot;&gt;&lt;/li&gt; &lt;/ul&gt; &lt;/th&gt; &lt;th width=&quot;12%&quot;&gt;呼叫类型 &lt;ul class=&quot;click_top&quot;&gt; &lt;li class=&quot;top_img1&quot;&gt;&lt;/li
请教大神 模拟登陆中国移动,获取余额
使用 HtmlUnit好一点 还是 httpclient 实现好一点? 还有这个复杂吗、
htmlunit是否支持axios
我使用htmlunit模拟浏览器测试时发现没有拿到异步的数据,查看前端代码,发现使用的不是传统的ajax技术,而是axios,网上也没有相关的问题,那么htmlunit究竟支不支持axios,如果支持的话,htmlunit该如何设置。
Java爬虫在爬取动态生成数据的网页时怎样效率最高?
大佬们好,我目前刚刚开始研究Java爬虫。在尝试爬取通过Javascript生成数据的网页时,我使用了HTMLUnit去模拟JS的各种操作,但是即便使用了多线程,也觉得效率很一般。希望各位大佬提供一个最高效的爬虫方法。感谢!
相见恨晚的超实用网站
搞学习 知乎:www.zhihu.com 简答题:http://www.jiandati.com/ 网易公开课:https://open.163.com/ted/ 网易云课堂:https://study.163.com/ 中国大学MOOC:www.icourse163.org 网易云课堂:study.163.com 哔哩哔哩弹幕网:www.bilibili.com 我要自学网:www.51zxw
爬虫福利二 之 妹子图网MM批量下载
爬虫福利一:27报网MM批量下载    点击 看了本文,相信大家对爬虫一定会产生强烈的兴趣,激励自己去学习爬虫,在这里提前祝:大家学有所成! 目标网站:妹子图网 环境:Python3.x 相关第三方模块:requests、beautifulsoup4 Re:各位在测试时只需要将代码里的变量 path 指定为你当前系统要保存的路径,使用 python xxx.py 或IDE运行即可。
字节跳动视频编解码面经
引言 本文主要是记录一下面试字节跳动的经历。 三四月份投了字节跳动的实习(图形图像岗位),然后hr打电话过来问了一下会不会opengl,c++,shador,当时只会一点c++,其他两个都不会,也就直接被拒了。 七月初内推了字节跳动的提前批,因为内推没有具体的岗位,hr又打电话问要不要考虑一下图形图像岗,我说实习投过这个岗位不合适,不会opengl和shador,然后hr就说秋招更看重基础。我当时
开源一个功能完整的SpringBoot项目框架
福利来了,给大家带来一个福利。 最近想了解一下有关Spring Boot的开源项目,看了很多开源的框架,大多是一些demo或者是一个未成形的项目,基本功能都不完整,尤其是用户权限和菜单方面几乎没有完整的。 想到我之前做的框架,里面通用模块有:用户模块,权限模块,菜单模块,功能模块也齐全了,每一个功能都是完整的。 打算把这个框架分享出来,供大家使用和学习。 为什么用框架? 框架可以学习整体
源码阅读(19):Java中主要的Map结构——HashMap容器(下1)
(接上文《源码阅读(18):Java中主要的Map结构——HashMap容器(中)》) 3.4.4、HashMap添加K-V键值对(红黑树方式) 上文我们介绍了在HashMap中table数组的某个索引位上,基于单向链表添加新的K-V键值对对象(HashMap.Node&lt;K, V&gt;类的实例),但是我们同时知道在某些的场景下,HashMap中table数据的某个索引位上,数据是按照红黑树
c++制作的植物大战僵尸,开源,一代二代结合游戏
    此游戏全部由本人自己制作完成。游戏大部分的素材来源于原版游戏素材,少部分搜集于网络,以及自己制作。 此游戏为同人游戏而且仅供学习交流使用,任何人未经授权,不得对本游戏进行更改、盗用等,否则后果自负。 目前有六种僵尸和六种植物,植物和僵尸的动画都是本人做的。qq:2117610943 开源代码下载 提取码:3vzm 点击下载--&gt; 11月28日 新增四种植物 统一植物画风,全部修
Java学习的正确打开方式
在博主认为,对于入门级学习java的最佳学习方法莫过于视频+博客+书籍+总结,前三者博主将淋漓尽致地挥毫于这篇博客文章中,至于总结在于个人,实际上越到后面你会发现学习的最好方式就是阅读参考官方文档其次就是国内的书籍,博客次之,这又是一个层次了,这里暂时不提后面再谈。博主将为各位入门java保驾护航,各位只管冲鸭!!!上天是公平的,只要不辜负时间,时间自然不会辜负你。 何谓学习?博主所理解的学习,它
程序员必须掌握的核心算法有哪些?
由于我之前一直强调数据结构以及算法学习的重要性,所以就有一些读者经常问我,数据结构与算法应该要学习到哪个程度呢?,说实话,这个问题我不知道要怎么回答你,主要取决于你想学习到哪些程度,不过针对这个问题,我稍微总结一下我学过的算法知识点,以及我觉得值得学习的算法。这些算法与数据结构的学习大多数是零散的,并没有一本把他们全部覆盖的书籍。下面是我觉得值得学习的一些算法以及数据结构,当然,我也会整理一些看过
Python——画一棵漂亮的樱花树(不同种樱花+玫瑰+圣诞树喔)
最近翻到一篇知乎,上面有不少用Python(大多是turtle库)绘制的树图,感觉很漂亮,我整理了一下,挑了一些我觉得不错的代码分享给大家(这些我都测试过,确实可以生成喔~) one 樱花树 动态生成樱花 效果图(这个是动态的): 实现代码 import turtle as T import random import time # 画樱花的躯干(60,t) def Tree(branch
linux系列之常用运维命令整理笔录
本博客记录工作中需要的linux运维命令,大学时候开始接触linux,会一些基本操作,可是都没有整理起来,加上是做开发,不做运维,有些命令忘记了,所以现在整理成博客,当然vi,文件操作等就不介绍了,慢慢积累一些其它拓展的命令,博客不定时更新 顺便拉下票,我在参加csdn博客之星竞选,欢迎投票支持,每个QQ或者微信每天都可以投5票,扫二维码即可,http://m234140.nofollow.ax.
Python 基础(一):入门必备知识
目录1 标识符2 关键字3 引号4 编码5 输入输出6 缩进7 多行8 注释9 数据类型10 运算符10.1 常用运算符10.2 运算符优先级 1 标识符 标识符是编程时使用的名字,用于给变量、函数、语句块等命名,Python 中标识符由字母、数字、下划线组成,不能以数字开头,区分大小写。 以下划线开头的标识符有特殊含义,单下划线开头的标识符,如:_xxx ,表示不能直接访问的类属性,需通过类提供
深度学习图像算法在内容安全领域的应用
互联网给人们生活带来便利的同时也隐含了大量不良信息,防范互联网平台有害内容传播引起了多方面的高度关注。本次演讲从技术层面分享网易易盾在内容安全领域的算法实践经验,包括深度学习图
程序员接私活怎样防止做完了不给钱?
首先跟大家说明一点,我们做 IT 类的外包开发,是非标品开发,所以很有可能在开发过程中会有这样那样的需求修改,而这种需求修改很容易造成扯皮,进而影响到费用支付,甚至出现做完了项目收不到钱的情况。 那么,怎么保证自己的薪酬安全呢? 我们在开工前,一定要做好一些证据方面的准备(也就是“讨薪”的理论依据),这其中最重要的就是需求文档和验收标准。一定要让需求方提供这两个文档资料作为开发的基础。之后开发
网页实现一个简单的音乐播放器(大佬别看。(⊙﹏⊙))
今天闲着无事,就想写点东西。然后听了下歌,就打算写个播放器。 于是乎用h5 audio的加上js简单的播放器完工了。 欢迎 改进 留言。 演示地点跳到演示地点 html代码如下`&lt;!DOCTYPE html&gt; &lt;html&gt; &lt;head&gt; &lt;title&gt;music&lt;/title&gt; &lt;meta charset="utf-8"&gt
Python十大装B语法
Python 是一种代表简单思想的语言,其语法相对简单,很容易上手。不过,如果就此小视 Python 语法的精妙和深邃,那就大错特错了。本文精心筛选了最能展现 Python 语法之精妙的十个知识点,并附上详细的实例代码。如能在实战中融会贯通、灵活使用,必将使代码更为精炼、高效,同时也会极大提升代码B格,使之看上去更老练,读起来更优雅。 1. for - else 什么?不是 if 和 else 才
数据库优化 - SQL优化
前面一篇文章从实例的角度进行数据库优化,通过配置一些参数让数据库性能达到最优。但是一些“不好”的SQL也会导致数据库查询变慢,影响业务流程。本文从SQL角度进行数据库优化,提升SQL运行效率。 判断问题SQL 判断SQL是否有问题时可以通过两个表象进行判断: 系统级别表象 CPU消耗严重 IO等待严重 页面响应时间过长
2019年11月中国大陆编程语言排行榜
2019年11月2日,我统计了某招聘网站,获得有效程序员招聘数据9万条。针对招聘信息,提取编程语言关键字,并统计如下: 编程语言比例 rank pl_ percentage 1 java 33.62% 2 c/c++ 16.42% 3 c_sharp 12.82% 4 javascript 12.31% 5 python 7.93% 6 go 7.25% 7
通俗易懂地给女朋友讲:线程池的内部原理
餐厅的约会 餐盘在灯光的照耀下格外晶莹洁白,女朋友拿起红酒杯轻轻地抿了一小口,对我说:“经常听你说线程池,到底线程池到底是个什么原理?”我楞了一下,心里想女朋友今天是怎么了,怎么突然问出这么专业的问题,但做为一个专业人士在女朋友面前也不能露怯啊,想了一下便说:“我先给你讲讲我前同事老王的故事吧!” 大龄程序员老王 老王是一个已经北漂十多年的程序员,岁数大了,加班加不动了,升迁也无望,于是拿着手里
经典算法(5)杨辉三角
写在前面: 我是 扬帆向海,这个昵称来源于我的名字以及女朋友的名字。我热爱技术、热爱开源、热爱编程。技术是开源的、知识是共享的。 这博客是对自己学习的一点点总结及记录,如果您对 Java、算法 感兴趣,可以关注我的动态,我们一起学习。 用知识改变命运,让我们的家人过上更好的生活。 目录一、杨辉三角的介绍二、杨辉三角的算法思想三、代码实现1.第一种写法2.第二种写法 一、杨辉三角的介绍 百度
腾讯算法面试题:64匹马8个跑道需要多少轮才能选出最快的四匹?
昨天,有网友私信我,说去阿里面试,彻底的被打击到了。问了为什么网上大量使用ThreadLocal的源码都会加上private static?他被难住了,因为他从来都没有考虑过这个问题。无独有偶,今天笔者又发现有网友吐槽了一道腾讯的面试题,我们一起来看看。 腾讯算法面试题:64匹马8个跑道需要多少轮才能选出最快的四匹? 在互联网职场论坛,一名程序员发帖求助到。二面腾讯,其中一个算法题:64匹
面试官:你连RESTful都不知道我怎么敢要你?
面试官:了解RESTful吗? 我:听说过。 面试官:那什么是RESTful? 我:就是用起来很规范,挺好的 面试官:是RESTful挺好的,还是自我感觉挺好的 我:都挺好的。 面试官:… 把门关上。 我:… 要干嘛?先关上再说。 面试官:我说出去把门关上。 我:what ?,夺门而去 文章目录01 前言02 RESTful的来源03 RESTful6大原则1. C-S架构2. 无状态3.统一的接
为啥国人偏爱Mybatis,而老外喜欢Hibernate/JPA呢?
关于SQL和ORM的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行了一番讨论,感触还是有一些,于是就有了今天这篇文。 声明:本文不会下关于Mybatis和JPA两个持久层框架哪个更好这样的结论。只是摆事实,讲道理,所以,请各位看官勿喷。 一、事件起因 关于Mybatis和JPA孰优孰劣的问题,争论已经很多年了。一直也没有结论,毕竟每个人的喜好和习惯是大不相同的。我也看
项目中的if else太多了,该怎么重构?
介绍 最近跟着公司的大佬开发了一款IM系统,类似QQ和微信哈,就是聊天软件。我们有一部分业务逻辑是这样的 if (msgType = "文本") { // dosomething } else if(msgType = "图片") { // doshomething } else if(msgType = "视频") { // doshomething } else { // doshom...
致 Python 初学者
欢迎来到“Python进阶”专栏!来到这里的每一位同学,应该大致上学习了很多 Python 的基础知识,正在努力成长的过程中。在此期间,一定遇到了很多的困惑,对未来的学习方向感到迷茫。我非常理解你们所面临的处境。我从2007年开始接触 python 这门编程语言,从2009年开始单一使用 python 应对所有的开发工作,直至今天。回顾自己的学习过程,也曾经遇到过无数的困难,也曾经迷茫过、困惑过。开办这个专栏,正是为了帮助像我当年一样困惑的 Python 初学者走出困境、快速成长。希望我的经验能真正帮到你
Python 编程实用技巧
Python是一门很灵活的语言,也有很多实用的方法,有时候实现一个功能可以用多种方法实现,我这里总结了一些常用的方法,并会持续更新。
“狗屁不通文章生成器”登顶GitHub热榜,分分钟写出万字形式主义大作
一、垃圾文字生成器介绍 最近在浏览GitHub的时候,发现了这样一个骨骼清奇的雷人项目,而且热度还特别高。 项目中文名:狗屁不通文章生成器 项目英文名:BullshitGenerator 根据作者的介绍,他是偶尔需要一些中文文字用于GUI开发时测试文本渲染,因此开发了这个废话生成器。但由于生成的废话实在是太过富于哲理,所以最近已经被小伙伴们给玩坏了。 他的文风可能是这样的: 你发现,
程序员:我终于知道post和get的区别
IT界知名的程序员曾说:对于那些月薪三万以下,自称IT工程师的码农们,其实我们从来没有把他们归为我们IT工程师的队伍。他们虽然总是以IT工程师自居,但只是他们一厢情愿罢了。 此话一出,不知激起了多少(码农)程序员的愤怒,却又无可奈何,于是码农问程序员。 码农:你知道get和post请求到底有什么区别? 程序员:你看这篇就知道了。 码农:你月薪三万了? 程序员:嗯。 码农:你是怎么做到的? 程序员:
"狗屁不通文章生成器"登顶GitHub热榜,分分钟写出万字形式主义大作
前言 GitHub 被誉为全球最大的同性交友网站,……,陪伴我们已经走过 10+ 年时间,它托管了大量的软件代码,同时也承载了程序员无尽的欢乐。 上周给大家分享了一篇10个让你笑的合不拢嘴的Github项目,而且还拿了7万+个Star哦,有兴趣的朋友,可以看看, 印象最深刻的是 “ 呼吸不止,码字不停 ”: 老实交代,你是不是经常准备写个技术博客,打开word后瞬间灵感便秘,码不出字? 有什么
推荐几款比较实用的工具,网站
1.盘百度PanDownload 这个云盘工具是免费的,可以进行资源搜索,提速(偶尔会抽风????) 不要去某站买付费的???? PanDownload下载地址 2.BeJSON 这是一款拥有各种在线工具的网站,推荐它的主要原因是网站简洁,功能齐全,广告相比其他广告好太多了 bejson网站 3.二维码美化 这个网站的二维码美化很好看,网站界面也很...
《程序人生》系列-这个程序员只用了20行代码就拿了冠军
你知道的越多,你不知道的越多 点赞再看,养成习惯GitHub上已经开源https://github.com/JavaFamily,有一线大厂面试点脑图,欢迎Star和完善 前言 这一期不算《吊打面试官》系列的,所有没前言我直接开始。 絮叨 本来应该是没有这期的,看过我上期的小伙伴应该是知道的嘛,双十一比较忙嘛,要值班又要去帮忙拍摄年会的视频素材,还得搞个程序员一天的Vlog,还要写BU
相关热词 c# plc s1200 c#里氏转换原则 c# 主界面 c# do loop c#存为组套 模板 c# 停掉协程 c# rgb 读取图片 c# 图片颜色调整 最快 c#多张图片上传 c#密封类与密封方法
立即提问