織夢(mèng)采集俠是一款非常好用的采集工具,能夠?yàn)楦魑徽鹃L(zhǎng)們進(jìn)行網(wǎng)站數(shù)據(jù)的采集,用來實(shí)時(shí)更新網(wǎng)站的數(shù)據(jù),有需要的歡迎下載使用。
專門針對(duì)織夢(mèng)后臺(tái)操作系統(tǒng)的采集工具
使用說明:
采集版分UTF8和GBK兩個(gè)版本,根據(jù)自己使用的dedecms版本來選擇!
因文件是用mac系統(tǒng)打包的,會(huì)自帶_MACOSX、.DS_Store文件,不影響使用,有強(qiáng)迫癥的可以刪除。覆蓋破解文件的時(shí)候不用管這些文件。
1,【您自行去采集俠官方下載最新v2.8版本(網(wǎng)址:http://www.caijixia.net/ 如果官網(wǎng)不能打開就用我備份好的,解壓后有個(gè)采集俠官方插件文件夾,自行選擇安裝對(duì)應(yīng)的版本),然后安裝到您的織夢(mèng)后臺(tái),如果之前安裝過2.7版本,請(qǐng)先刪除!】
2,注意安裝的時(shí)候版本千萬不要選錯(cuò)了,UTF8就裝UTF8,GBK就用GBK的不要混用!
3,【覆蓋破解文件】(共三個(gè)文件CaiJiXia、include和Plugins)
Plugins : 直接覆蓋到網(wǎng)站的根目錄
include : 直接覆蓋到網(wǎng)站的根目錄
CaiJiXia: 網(wǎng)站默認(rèn)后臺(tái)是dede,如果你沒有修改后臺(tái)目錄的話那就是覆蓋 /dede/apps/下面,如果后臺(tái)訪問路徑被修改過的話,那就把dede換成你修改的名稱。例:dede已修改成test, 那就覆蓋/test/apps/目錄下
4,【破解程序使用對(duì)域名無限制】
5, 【覆蓋后需要清理下瀏覽器緩存, 推薦使用谷歌或者火狐瀏覽器,不要用IE內(nèi)核瀏覽器,清理緩存有時(shí)清的不干凈】
6, PHP版本必須5.3+
使用方法:
1、設(shè)置定向采集
1)、登錄您網(wǎng)站后臺(tái),模塊->采集俠->采集任務(wù),如果您的網(wǎng)站還沒有添加欄目,你需要先到織夢(mèng)的欄目管理里先添加欄目,如果已經(jīng)添加了欄目,你可能可以看到如下界面
2)、在彈出的頁面里選擇定向采集,如圖所示
3)、點(diǎn)擊添加采集規(guī)則,這就是添加定向采集規(guī)則的頁面了,這里我們要詳細(xì)說下
2、設(shè)置 目標(biāo)頁面編碼
打開您要采集的網(wǎng)頁,點(diǎn)擊鼠標(biāo)右鍵,點(diǎn)擊查看網(wǎng)站源碼,搜索charset,查看charset后面緊跟的是utf-8還是gb2312,如圖所示即為utf-8
3、設(shè)置 列表網(wǎng)址
列表網(wǎng)址就是您要采集的網(wǎng)站的欄目列表地址
如果只是單純采集列表頁的第一頁,直接輸入該列表URL就行,如我要采集站長(zhǎng)之家的優(yōu)化欄目的第一頁,那列表URL就輸入:http://www.chinaz.com/web/seo/,即可。采集第一頁的內(nèi)容的好處就是可以不用采集老舊的新聞,而且有新更新也可以及時(shí)采集到,如果需要采集該欄目的所有內(nèi)容,那也可以通過設(shè)置通配符的方式,匹配所有列表URL規(guī)則。
- PC官方版
- 安卓官方手機(jī)版
- IOS官方手機(jī)版