獨(dú)品網(wǎng)頁批量采集是一款指定區(qū)域指定屬性采集網(wǎng)頁內(nèi)容的軟件,可自定義過濾條件采集方式,速度快,精確度高,網(wǎng)頁資源批量采集神器。支持循環(huán)地址,按標(biāo)題保存、任務(wù)引用(延伸式多層過濾篩選分工)、自定義函數(shù)(強(qiáng)大的過濾接口,實(shí)現(xiàn)更多的可能)。自帶網(wǎng)頁分析工具、函數(shù)編輯工具,界面簡潔,操作簡單、功能強(qiáng)大,是你網(wǎng)路資源收集的得力助手。
用處:
采集discuz、phpwind等論壇博客貼內(nèi)大圖、貼內(nèi)文章、貼內(nèi)鏈接,可限定版塊或排除版塊,還可以指定發(fā)帖作者、帖子內(nèi)容等。
采集小說文章、軟件鏈接、視頻音樂,可全站查找、按搜索關(guān)鍵字查找等。
使用:
簡單型:添加任務(wù)>填寫網(wǎng)址>分析頁面>填寫命令>采集下載
詳細(xì)型:新建數(shù)據(jù)>添加任務(wù)>填寫網(wǎng)址>分析頁面>得到采集命令>填寫過濾函數(shù)>設(shè)置參數(shù)>選擇保存路徑>采集>下載
功能:
1、鏈接地址:可以是單個(gè)地址也可以循環(huán)地址,還可以是其他任務(wù)采集到的所有鏈接地址。 如http://bbs.dupinsoft.com/thread-[1-360]-1-1.html 包括360個(gè)頁面
2、采集命令:命令分為兩部分,前一部分為指定區(qū)域,后一部分指定內(nèi)容,如:<div class=t_f><img src=>(獨(dú)品論壇貼內(nèi)圖片)、<div class=top><text>(區(qū)域內(nèi)文本)
3、鏈接過濾、采集過濾:均使用函數(shù)過濾,自帶常用過濾函數(shù)find、notfind、findin、notfindin,使用:find(<title><text>,貼圖鑒賞)、notfind(value,image/face)
4、執(zhí)行參數(shù):涉及到采集完成后自動(dòng)下載、按網(wǎng)頁標(biāo)題保存、文件重復(fù)時(shí)跳過、是否保留到IE緩存等
提示:
采集命名可以幫你限定區(qū)域指定目標(biāo),精確到屬性,函數(shù)過濾可以幫你過濾篩選,加工到你想要的結(jié)果,采集命令和函數(shù)過濾是軟件的兩個(gè)強(qiáng)大支撐模塊,善用web工具分析采集命令和編寫修改過濾函數(shù)可以幫你實(shí)現(xiàn)更多的不可能,讓軟件變得萬能,采集網(wǎng)頁得心應(yīng)手。
使用方法
第一步:打開軟件點(diǎn)擊紅色框內(nèi)的“添加”按鈕創(chuàng)建任務(wù)
第二步:選中任務(wù)條目,填寫“任務(wù)名稱”和“鏈接地址”,然后點(diǎn)擊采集命令右邊的按鈕進(jìn)入網(wǎng)頁分析窗口
第三步:打開網(wǎng)頁后按住“ALT鍵”移動(dòng)鼠標(biāo)到你需要采集的圖片或文字上,紅色區(qū)域會(huì)顯示當(dāng)前目標(biāo)元素的詳細(xì)信息,按"F6"擴(kuò)大選區(qū)
第四步:分析目標(biāo)元素,根據(jù)所需的屬性值提取標(biāo)簽和屬性名稱,這里src屬性得到的是縮略圖,zoomfile得到的是大圖,所以目標(biāo)組采集命令填寫
第五步:按“F6鍵”擴(kuò)大選區(qū)直到網(wǎng)頁內(nèi)需要采集的內(nèi)容都在紅色邊框內(nèi)部,然后分析當(dāng)前元素的屬性,這里得到標(biāo)簽為div,關(guān)鍵屬性取class=t_f,得到的區(qū)域命令為
第六步:將得到的完整采集命令
填入地址欄右邊框內(nèi)的點(diǎn)擊查看結(jié)果,這里取得了所有大圖的地址,若得不到想要的結(jié)果需重新分析采集命。
第七步:完善任務(wù)信息,填寫采集命令、執(zhí)行參數(shù)、保存路徑等,若想采集完后自動(dòng)下載添加down參數(shù),以網(wǎng)頁標(biāo)題保存添加titile參數(shù),點(diǎn)擊“采集”按鈕采集信息,點(diǎn)擊“下載”按鈕下載采集內(nèi)容
- PC官方版
- 安卓官方手機(jī)版
- IOS官方手機(jī)版