抓取网页里的链接地址

图片说明

我试图抓取上图的链接可是返回以下错误

Traceback (most recent call last):
File "/Users/euro3/Library/Preferences/PyCharmCE2018.1/scratches/scratch_7.py", line 65, in
add_index_url(url,num,file_object)
File "/Users/euro3/Library/Preferences/PyCharmCE2018.1/scratches/scratch_7.py", line 51, in add_index_url
write_url=get_download_url(html)
File "/Users/euro3/Library/Preferences/PyCharmCE2018.1/scratches/scratch_7.py", line 14, in get_download_url
url_a=td.find('source')
AttributeError: 'NoneType' object has no attribute 'find'

下面是我运行的代码:

import sys
import urllib2
import os
import chardet
from bs4 import BeautifulSoup
import time
reload(sys)
sys.setdefaultencoding("utf-8")

def get_download_url(broken_html):
    soup=BeautifulSoup(broken_html,'html.parser')
    fixed_html=soup.prettify()
    td=soup.find('video',attrs={'id':'player_html5_api'})
    url_a=td.find('source')
    url_a=url_a['src']
    return url_a

def get_title(broken_html):
    soup=BeautifulSoup(broken_html,'html.parser')
    fixed_html=soup.prettify()
    title=soup.find('h1')
    title=title.string
    return title

def url_open(url):
    req=urllib2.Request(url)
    req.add_header('User-Agent','Mozilla/5.0')
    response=urllib2.urlopen(url)
    html=response.read()
    return html

def add_index_url(url,num,file_object):
    for i in range(1,num):
        new_url=url+str(i)
        print("----------------------start scraping page"+str(i)+"---------------------")
        html=url_open(new_url)
        time.sleep(1)
        soup=BeautifulSoup(html,'html.parser')
        fixed_html=soup.prettify()
        a_urls=soup.find_all('div',attrs={'class':'pic'})
        host="http://zhs.lxxlxx.com"
        for a_url in a_urls:
            a_url=a_url.find('a')
            a_url=a_url.get('href')
            a_url=host+a_url
            print(a_url)
            html=url_open(a_url)
            #html=unicode(html,'GBK').encode("utf-8")
            html=html.decode('utf-8')
            write_title=get_title(html)
            write_url=get_download_url(html)
            file_object.write(write_title+"\n")
            file_object.write(write_url+"\n")

if __name__=='__main__':
    url="http://zhs.lxxlxx.com/new/"
    filename="down_load_url.txt"
    num=int(raw_input("please input the page num you want to download:"))
    num=num+1
    if os.path.exists(filename):
        file_object=open(filename,'w+')
    else:
        os.mknod(filename)
        file_object=open(filename,'w+')
    add_index_url(url,num,file_object)
    print("----------------------scraping finish--------------------------")
    file_object.close()

有谁可以帮忙修改一下,本人自学python中所以不是很明白哪里出错

2个回答

有可能是soup没有查到video标签,然后返回了None给td,建议你在执行soup.find后判断返回值有没有数据

修改下个函数,然后在打印结果里查看是否能找到td的结果,然后再查看td的结果是否和有source结果

def get_download_url(broken_html):
    soup=BeautifulSoup(broken_html,'html.parser')
        print (soup)
    fixed_html=soup.prettify()
    td=soup.find('video',attrs={'id':'player_html5_api'})
        print (td)
    url_a=td.find('source')
    url_a=url_a['src']
    return url_a

Csdn user default icon
上传中...
上传图片
插入图片
抄袭、复制答案,以达到刷声望分或其他目的的行为,在CSDN问答是严格禁止的,一经发现立刻封号。是时候展现真正的技术了!
其他相关推荐
python抓取网页中的链接地址
# coding:utf-8 import re import requests # 获取网页内容 r = requests.get('http://www.163.com') data = r.text # 利用正则查找所有连接 link_list =re.findall(r"(? for url in link_list:     print url
Java抓取网页图片链接地址
用来抓取网页上的 图片的超链接 你也可以适当修改 用来抓取其他连接
链接地址
xxx
抓取网页
public static String getHtmlByUrl(String url) throws IOException { URL htmlUrl = new URL(url); BufferedReader reader = new BufferedReader(new InputStreamReader(htmlUrl.openStream())); Stri...
如果批量改excel里插入图片的链接地址
如果批量改excel里插入图片的链接地址
swf图片里的字体链接地址怎么设置?
我想问如下的flashrnhttp://file.auraj4002.cafe24.com/web/nnin/category.swfrn这个地址里是一个flash图片,就是一个菜单,菜单里有好几个文字,点击每个文字就进入相关的页面。rnrn比如: dressrn teern pantsrn 。。。rnrn当我点击dress的时候进入一个指定的地址上,这个地址怎么设定?rnrn就是我想要的是当我点击某个字(dress或,tee或pants的时候,可以进入某个页面,这些页面的地址是我设定的,但我不知道页面上怎么写上这些地址,在哪里写)
如何获取iframe里src的链接地址?
写了一个抓取的页面用 HttpWebRequest request = (HttpWebRequest)WebRequest.Create(url);返回字符串后。想用正则匹配里面的Iframe里src的链接地址。 该如何获取呢?谢谢rnrn public static string GetRegValue(string RegexString, string RemoteStr)rn rn string MatchVale = "";rn Regex r = new Regex(RegexString);rn Match m = r.Match(RemoteStr);rn if (m.Success)rn rn MatchVale = m.Value;rn rn return MatchVale;rn
windows7无损分区(文件里有链接地址)
该软件集合了四大工具包: (1)Acronis Partition Expert (2)Acronis OS Selector (3)Acronis Recovery Expert (4)Acronis Disk Editor
贴个"批量获取网页里的链接地址"
<%rnrn' SqlDataBase = "../database/zz.mdb" '数据库路径rn' SqlProvider = "Microsoft.Jet.OLEDB.4.0" '驱动程序[ Microsoft.Jet.OLEDB.4.0 Microsoft.ACE.OLEDB.12.0 ]rn' Connstr="Provider="&SqlProvider&";Data Source="&Server.MapPath(SqlDataBase)rnrn'Set Conn=Server.CreateObject("ADODB.Connection")rn'Conn.open ConnStrrn'Set Rs = Server.CreateObject("ADODB.Recordset")rn'================================================rn '函数名:GetHTTPPagern '作 用:获取HTTP页rn '参 数:url ----远程URLrn '返回值:远程HTML代码rn'这段是别人写的,rn'================================================rn Public Function GetRemoteData(ByVal URL, ByVal Cset)rn If Len(Cset) < 2 Then Cset = "GB2312"rn rn Dim strHeaderrn Dim lrn rn On Error Resume Nextrn rn Dim Retrievalrn Dim ObjStreamrn Set ObjStream = CreateObject("ADODB.Stream")rn ObjStream.Type = 1rn ObjStream.Mode = 3rn ObjStream.Openrn Set Retrieval = CreateObject("MSXML2.XMLHTTP")rn With Retrievalrn .Open "GET", URL, Falsern .setRequestHeader "Referer", URLrn .sendrn If .readyState <> 4 Then Exit Functionrn If .Status > 300 Then Exit Functionrn '--获取目标网站文件头rn strHeader = .getResponseHeader("Content-Type")rn strHeader = UCase(strHeader)rn ObjStream.Write (.responseBody)rn End Withrn Set Retrieval = Nothingrn rn If Len(strHeader) > 0 Thenrn '--获取目标文件编码rn l = InStrRev(strHeader, "CHARSET=", -1, 1)rn If l > 0 Thenrn Cset = Right(strHeader, Len(strHeader) - l - 7)rn Elsern Cset = Csetrn End Ifrn End Ifrnrn ObjStream.Position = 0rn ObjStream.Type = 2rn ObjStream.Charset = Trim(Cset)rn GetRemoteData = ObjStream.ReadTextrn ObjStream.Closern Set ObjStream = Nothingrn Exit Functionrn End Functionrn'================================================rn '函数名:CutFixedrn '作 用:截取固定的字符串rn '参 数:strHTML ----原字符串rn ' start ------ 开始字符串rn ' last ------ 结束字符串rn '================================================rn Public Function CutFixed(ByVal strHTML, ByVal start, ByVal last)rn Dim srn Dim Matchrn Dim strPatternrn Dim strContentrn Dim t, lrnrn t = Len(start): l = Len(last)rn If t = 0 Or l = 0 Then Exit Functionrnrn strPattern = "(" & CorrectPattern(start) & ")(.+?)(" & CorrectPattern(last) & ")"rnrn On Error Resume Nextrnrn Dim rern Set re = New RegExprn re.IgnoreCase = Falsern re.Global = Falsern re.Pattern = strPatternrnrn Set s = re.Execute(strHTML)rn For Each Match In srn strContent = Match.Valuern Nextrnrn Set s = Nothingrn Set re = Nothingrn CutFixed = Mid(strContent, t + 1, Len(strContent) - l - t)rn Exit Functionrn End Functionrnrn Private Function CorrectPattern(ByVal str)rn str = Replace(str, "\", "\\")rn str = Replace(str, "~", "\~")rn str = Replace(str, "!", "\!")rn str = Replace(str, "@", "\@")rn str = Replace(str, "#", "\#")rn str = Replace(str, "%", "\%")rn str = Replace(str, "^", "\^")rn str = Replace(str, "&", "\&")rn str = Replace(str, "*", "\*")rn str = Replace(str, "(", "\(")rn str = Replace(str, ")", "\)")rn str = Replace(str, "-", "\-")rn str = Replace(str, "+", "\+")rn str = Replace(str, "[", "\[")rn str = Replace(str, "]", "\]")rn str = Replace(str, "<", "\<")rn str = Replace(str, ">", "\>")rn str = Replace(str, ".", "\.")rn str = Replace(str, "/", "\/")rn str = Replace(str, "?", "\?")rn str = Replace(str, "=", "\=")rn str = Replace(str, "|", "\|")rn str = Replace(str, "$", "\$")rn CorrectPattern = strrn End Functionrnrn'写入数据开始rnrnSub vnumstr(valplugin)rnsql="Select * from zz where add_url='"&valplugin&"'"rnSet Rs = Server.CreateObject("ADODB.Recordset")rnRs.Open sql, Conn, 1, 3rn If rs.bof or rs.eof Then rn Rs.AddNewrn rs("add_url")=valpluginrn rs("add_createtime1")=Now()rn rs.updatern End ifrnrn rs.closern Set rs=NothingrnEnd Subrnrn'写入数据结束rnSet re = New RegExprngets=trim(request("gets"))rnrnhomes=split(gets,"/")rnhomesn=ubound(homes)rn'response.write homesnrnfor i=0 to homesn-1rnhomesn=homes(2)&"/"&homes(i)rnNextrnrnstrContent = LCase(replace(GetRemoteData(gets, "GB2312"),"""",""))rnsfs=split(strContent,"")rnvalpluginN=InStr(valplugin," ")rnIf valpluginN>0 thenrnvalpluginvv=Split(valplugin," ")rnvalplugin=valpluginvv(0)rnEnd IfrnvalpluginJ=InStr(valplugin,"javascript:")rnIf valpluginJ>0 thenrnvalpluginv=Split(valplugin,"javascript:")rnvalplugin=valpluginv(0)rnEnd ifrnif left(valplugin,4)<>"http"then rn if left(valplugin,1)="/" thenrn valplugin="http://"&homes(2)&valpluginrn elseif left(valplugin,3)="../" thenrn valplugin="http://"&homes(2)&replace(valplugin,"../","/")rn elsern valplugin="http://"&homes(2)&"/"&valpluginrn end IfrnElsernvalplugin=valpluginrnrnend if rn'Call vnumstr(valplugin)rnresponse.write valplugin&" "rnNextrn%>rnrnrn写得不好,还会出现好多问题,欢迎测试后修正,并把OK的也贴上来,给我一份,谢谢rnrn
如何 在控件的超级链接地址里 打开帮助文档
我在一控件的超级链接地址里写 D:\ceerp\ceerp.chm,但打开时提示说 该文件可能有 病毒,每次打开都会,请问如何解决哦,谢谢!rnrn
怎么在代码里通过链接地址下载文件
我在C#代码里用这句代码,想下载一个文件,为什么在执行时,弹出的窗口一闪就自动关闭了?我把window.open()里的地址单独拿出在IE上键入回车是可以下载文件的.请问怎么解决这个问题,谢谢.rnrnrnPage.RegisterStartupScript("onclick"," ");
怎样手动修改asp.net里面的链接地址~~
比如我有个自定义控件,上面有些超连接,我怎么样才能手动修改这个超连接的名字和地址啊?
批量修改多个flash里面的链接地址
as2.0的rn因为有100多个fla文件 之前是在不同多重文件夹下 由于使用的loadMovieNumrn多重路径下就会出错rn现在批量修改里面的fla文件元件的链接地址 请问有没有批量修改的办法?rn补充一下 这个要批量修改的链接地址的是个按钮 名字都叫button60
用python获取里面的a标签的链接地址
rnrn```rn rnrnrnrnrnrnrnrnrnrnrn rn 建设单位项目办理rn rn rn rn rn rnrn rnrnrnrnrnrnrn rn rn rnrnrn rnrn rn 请输入查询号rn rn rnrnrnrn rn rn 建设单位rn 项目名称rn 发文号rn 立案号rn 详情rn rnrn rn 中铁十六局集团有限公司rn 关于中铁十六局集团有限公司朝阳区青年路10号院项目2#住宅楼建设工程规划许可证延期的申请rn 2017规(朝)延字0001号rn 2017分延字0001rn 详情 rnrnrn rn 北京博达顺源天然气有限公司rn 压缩天然气(CNG)加气母站rn 2017规函复市政字0002号rn 2017函市政字0001rn 详情 rnrnrn rn 北京市平谷区教育委员会rn北京市平谷区大华山镇大华山村经济合作社rn 教学楼、风雨操场及食堂rn 2017规(平)乡临建字0001号rn 2017分乡建字0001rn 详情 rnrnrn rn 李甫全rn 翻改建住房(灰瓦1)rn 2017规(西)条居字0001号rn 2017分条居字0001rn 详情 rnrnrn rn 北京市花木有限公司rn 上水工程rn 2017规建市政否字0025号rn 2017市政建字0001rn 详情 rnrnrn rn 北京地铁十六号线投资有限责任公司rn 北京地铁十六号线工程 区间工程 月坛南街站、阜外大街~月坛南街区间rn 2017规延市政字0004号rn 2017延市政字0001rn 详情 rnrnrn rn 北京恒城投资发展集团有限公司rn 人才公租房项目rn rn 2017分复字0001rn 详情 rnrnrn rn 北京房地集团有限公司rn 和平街十四区简易住宅楼改造项目rn 2017规(朝)选字0002号rn 2017分选字0001rn 详情 rnrnrn rn 北京市环亚创业生物工程技术有限责任公司rn 工业用房rn rn 2017分监字0001rn 详情 rnrnrn rn 北京公共交通控股(集团)有限公司rn rn 2017规竣市政字0001号rn 2017监市政字0001rn 详情 rnrnrnrnrnrnrnrnrnrnrnrn rn rn rn rn rnrn rn rn rn rn 第一页rn rn rn rn rn rn 1rn rn rn rn rn rn rn rn 2rn rn rn rn rn rn rn 3rn rn rn rn rn rn rn 4rn rn rn rn rn rn rn 5rn rn rn rn rn 下一页rn rn rn 最后一页rn rn      共9634页 96334条rn rn rn rn rn rn rn rn 第rn rn 页rn rn rn rn rnrn rn rn rn rn rnrnrn rn rn rnrnrnrnrn```rnrn
vb 如何抓取网页form里的表格数据
vb 如何抓取网页form里的表格数据??rn如 rn 123 rn rn 如何抓取数据“123”呢?请教各位大侠了,先谢过。
htmlparse抓取网页里面的想要信息
基于htmlpaser的大数据采集分析工具rnrn用HTMLPASER 写插件,完成相关字段抓取,入库等。rn例子页面rnhttp://dr.eju.cn/member/1-page-1.html 全国城市都抓取rnrn数据库:表结构 rn/*rnNavicat MySQL Data TransferrnrnSource Server : localhostrnSource Server Version : 50532rnSource Host : localhost:3306rnSource Database : ejurnrnTarget Server Type : MYSQLrnTarget Server Version : 50532rnFile Encoding : 65001rnrnDate: 2015-01-07 20:41:57rn*/rnrnSET FOREIGN_KEY_CHECKS=0;rnrn-- ----------------------------rn-- Table structure for designerrn-- ----------------------------rnDROP TABLE IF EXISTS `designer`;rnCREATE TABLE `designer` (rn `id` int(11) DEFAULT NULL,rn `name` varchar(100) DEFAULT NULL,rn `jianjie` varchar(1000) DEFAULT NULL,rn `website` varchar(500) DEFAULT NULL,rn `tupian` int(11) DEFAULT NULL,rn `fangwen` int(11) DEFAULT NULL,rn `xiangmu` int(11) DEFAULT NULL,rn `chengshi` varchar(50) DEFAULT NULLrn) ENGINE=MyISAM DEFAULT CHARSET=gbk;rnrn-- ----------------------------rn-- Records of designerrn-- ----------------------------rn这个题目,抓取到设计师的姓名简介等相关信息,我抓取到几个文件,最接近的是rn2.室内设计师大全-中国室内设计师网-中国室内设计师联盟rn加载中..rn我的易居rn用户名:rn密 码:rn新浪微博rn图库检索rn商场 酒店 客厅 卧室 厨房rn展会 酒吧 别墅 银行 餐厅rn首页rn找设计师rn家庭装修rn工程装修rn设计日志rn装饰建材rn装修咨询rn装修图库rn装修论坛rn设计日志rn北京-北京雷雨明rn毕业于中央美术学院 十余年室内设计工作经...rnhttp://leiyu26.eju.cnrn图片:1160 访问:50595 项目:45rn北京-北京于海峰rn艺林公社是以各大知名艺术院校美术系(央美...rnhttp://ylgongshe.eju.cnrn图片:715 访问:11140 项目:14rn北京-北京周树金rn设计源于生活, 设计服务生活, 只有真正...rnhttp://zhoushujin.eju.cnrn图片:411 访问:46677 项目:68rn北京-北京李龙rn酒吧、KTV、夜总会等娱乐场所...rnhttp://clubled.eju.cnrn图片:371 访问:29659 项目:24rn北京-北京王栋rnMuse . Center 空 间 设 ...rnhttp://wangdong.eju.cnrn图片:363 访问:24764 项目:43rn北京-北京国安欧派雕塑厂rn我们的联系电话13810506109(王...rnhttp://gaoupai.eju.cnrn图片:300 访问:14304 项目:18rn北京-北京苗东坡rn毕业于山东艺术学院,工作经历五年...rnhttp://han-yang.eju.cnrn图片:285 访问:39690 项目:33rn北京-北京侯飞rn...rnhttp://jifang11867.eju.cnrn图片:218 访问:11123 项目:5rn北京-北京尹舍rn设计师不是单方面的体现自我设计。而是要把...rnhttp://yinshe.eju.cnrn图片:212 访问:10367 项目:12rn北京-北京锐图rn锐图效果图工作室 QQ :2869092...rnhttp://ruitusheji.eju.cnrn图片:208 访问:4805 项目:8rn北京-北京刘晓全rn自信阳光,给你不一样的家~...rnhttp://liuxiaoquan.eju.cnrn图片:193 访问:12411 项目:16rn北京-北京杜仲钰rn过去只是过去,并不代表什么 自此愿做对社...rnhttp://ysyyyy.eju.cnrn图片:177 访问:7240 项目:8rn上一页1 2 3 4 5 6 7 8 9 10 11 下一页rn快速检索rn所在地区rn北京 安徽 福建 甘肃 广东 广西 河南 黑龙江 湖北 湖南 吉林 江苏 江西 辽宁 内蒙古 宁夏 青海 山东 山西 陕西 上海 四川 天津 西藏 新疆 云南 浙江 重庆 海南 河北 贵州 香港 澳门 台湾rn会员服务:会员注册 | 会员登陆 | 申请推荐会员 | 圈子rn装修图库:客厅 | 卧室 | 卫生间 | 别墅 | 复式 | 实景图rn新手上路:如何发布作品 | 如果在作品中标注 | 我的作品显示在项目展示中rnrn我只想的到关于设计师具体信息部分,有人会吗,听说使用正则表达式过滤,求大神帮做rn最终结果是把设计师的信息保存到数据库,城市,作者,简介,图片,浏览次数等等吧,求大神帮忙
正则抓取网页input里面的值
想写调正则匹配下面html里面 input的值rn[code=html]rn rnrnrn[/code]rn请问c#正则源码应该怎么写
抓取网页(内容部分是写在js里的)
抓取网页(内容部分是写在js里的),html部分可以抓取到,js里的内容抓不到
常用链接地址
多路复用epoll: https://www.zybuluo.com/phper/note/595507 java的四种线程池的使用: http://www.cnblogs.com/SKILL0825/p/5971539.html https另一种理解: http://showme.codes/2017-02-20/understand-https/ volatitle关键字
链接地址问题
http://localhost:2669/Web/productDetailHtml/aaaa.htmlrn我有个静态html的文件 放在productDetailHtml文件夹中,点浏览 地址栏会跳出上面那个地址,有什么办法可以去掉地址栏显示的那个文件夹:(productDetailHtml)rn只让地址显示http://localhost:2669/Web/aaaa.html
GridView 链接地址
gridview数据绑定后,比如说有如下一个表,标题下的数据是个链接,这链接的语句该怎么写,写哪里?rn最好用Asp.net的语句编写,谢谢!rn在线等结果rnrnrnrnrn编号 标题rn001 Asp.netrn002 Javascript
系统资源链接地址
twm000的XP系统永久链接地址, 绝对的经典好东东哟.
复制链接地址
引用jquery-zclip-master插件 copy     $(function(){             $("#copy").zclip({                 path: 'jquery-zclip-master/ZeroClipboard.swf',                 copy: function(){          
下载链接地址
网上最全的matlab下载链接地址。希望可以帮到大家
资料链接地址
兼容性查看:https://www.caniuse.com/
加密链接地址
我不想让人了解我的网站结构,不只用何方法使访问者不能轻易读懂此地址
支付宝接口的链接地址
https://openhome.alipay.com/doc/docIndex.htm
链接地址问题。
链接地址如此:rnfile:\\10.210.1.36\software\微软产品\Project 2002 Standard\setup.exernrn但是通过此种方式:下载打开链接,因为中间有空格,在地址栏只显示为file:\\10.210.1.36\software\微软产品\Project,rnrn因为这是内部网络,所以要求不使用http和ftp的方式。请问大家有没有解决这个空格的方法。使用过Server.UrlEncode编码,好像不行.
查看链接地址
1.在页面随便点一个没有内容的地方,摁F12 2.摁F12会出现一个框,鼠标点击那个框左上角的按钮,这个按钮是选择你要查看的标签。 3.点按钮之后选择你要查看的视频 4.选择后,下面的框会对应到视频的标签。 5.然后一级级展开,找到url,复制,然后把url解密即可0
隐藏状态栏的链接地址
隐藏状态栏中的链接地址,绝对好用,这样当连接别人就不会知道你是要连接到哪里了
链接地址的问题
href='Movie.aspx?Catalog=<%# DataBinder.Eval(Container.DataItem,"Catalog") %> &ProductID=<%# DataBinder.Eval(Container.DataItem,"ID")%> 'rnrn这句话里我想把Movie换成数据库中catalog对应的记录,不知道可行么?对应会转到movie.aspx study.aspx等页面。。。rn
隐藏文件的链接地址
隐藏文件的链接地址 去掉a标签的href属性,直接在a标签中加onclick=”location.href=’userList’”这样文件链接的地址就不直接显示了
Spring链接地址
Spring介绍 Spring-IOC实现【01-XML配置方式】 Spring-IOC实现【02-其他实现方式】 Spring之AOP详解 Java代理模式 Spring之事务管理
关于链接地址
链接地址0x08048000 On 386 systems, the text base address is 0x08048000, which permits a reasonably large stack below the text while still staying above address 0x08000000, permitting most programs to use ...
链接地址拼接
我现在想实现类似这样的效果 http://www.hao123.com?url=www.baidu.com (这个链接不行的) rnhao123中显现百度的某个页面该怎么做??(不是直接跳转过去,而是在hao123中的框架内显是百度的某个页面)
文章链接地址
Netty使用初步: http://www.kafka0102.com/2010/06/161.html Netty实现原理浅析: http://www.kafka0102.com/2010/06/167.html eucalyptus源码阅读-结构 http://hi.baidu.com/juacm/blog/item/b7cc1d1badc31ac5a78669f9.html...
链接地址,求救~~
问下:我们连接地址是http://www.baidu.com网页,rn但是在地址栏上显示是www.hao123.com,怎么弄??rn 例如::动作片 rn
不错的链接地址
Mongo JEE http://angelozerr.wordpress.com/ Hibernate 所有缓存机制详解 http://www.blogjava.net/tbwshc/articles/380013.html Redis学习资料 http://www.iteye.com/topic/1119434 AngulaJs学习教程: ht
抓取网页PageExtractor
抓取一个url下的所有子链接,再递归的获取子链接的子链接网页
Heritrix抓取网页
先下得完整开发包,我版本为1.10.0 设置heritrix.properties中的用户名、密码 heritrix.cmdline.admin = admin:fushizhe  运行主类org/archive/crawler/Heritrix.java 使用设置的用户名登录,创建一个job,with defaults 设置抓取网站  继续Modules   ...
相关热词 c# login 居中 c# 考试软件 c# 自然语言分析 c# 分段读取文件 c# 泛型反射 c#打断点 c# 时间转多少秒 c# 线程函数加参数 c# modbus 读取 c#查询集合表