喜歡看小說的用戶很多的都是需要把小說下載到自己的手機(jī)上面,但是很多的網(wǎng)站不支持一鍵下載,可以使用善肯網(wǎng)頁TXT采集器,自動(dòng)采集以及下載!
善肯網(wǎng)頁TXT采集器介紹
喜歡下載到本地慢慢看,但是很多小說網(wǎng)站不支持下載,或者下載有限制【非VIP小說】,也在論壇里面找過一些采集器,但是個(gè)人覺得不太好用,輸入正則表達(dá)式后,會(huì)出來章節(jié),但是點(diǎn)擊下載卻并不能把文本下載下來,我做好這個(gè)軟件后也繼續(xù)測試過,同樣的正則表達(dá)式,那些軟件確實(shí)匹配不出內(nèi)容,所以下載失敗。也有可能是那些軟件有些我不知道的規(guī)則,但是結(jié)果就是并不能完成我想要的下載。甚至不知道是規(guī)則的問題還是軟件的問題又或者是網(wǎng)站設(shè)置原因……
善肯網(wǎng)頁TXT采集器使用教程
關(guān)于規(guī)則設(shè)置
1、輸入網(wǎng)址后,可以實(shí)時(shí)預(yù)覽(不論有有沒規(guī)則,有規(guī)則就是匹配規(guī)則后的內(nèi)容,沒有就是源代碼,目前測試,并非所有網(wǎng)頁都能獲取其內(nèi)容,具體大家可以自己去實(shí)驗(yàn),能獲取源代碼的就是可以匹配出內(nèi)容的)
2、目錄頁和內(nèi)容頁分別匹配不同的規(guī)則:
目錄頁:
文本名稱規(guī)則
作者名稱規(guī)則
章節(jié)規(guī)則(此處需有兩個(gè)()一處匹配章節(jié)路徑,一個(gè)匹配章節(jié)名稱)
內(nèi)容頁:
內(nèi)容規(guī)則
3、關(guān)于替換:
通用替換(非正則):所有規(guī)則都會(huì)自動(dòng)加上通用替換(有共性的替換規(guī)則)
定制替換(非正則):單個(gè)網(wǎng)站的特有替換規(guī)則
正則替換:暫未開發(fā),請(qǐng)求打賞支持開發(fā)~~。
想換行可用內(nèi)容與\n進(jìn)行替換,\n是替換數(shù)據(jù)不是原數(shù)據(jù)。
可以根據(jù)自己的需求增刪,。(原數(shù)據(jù)和替換數(shù)據(jù)必填,一個(gè)空格都行,否則會(huì)拋異常)
刪除:選中一行,按DELETE鍵刪除
4、關(guān)于規(guī)則保存:
保存都是以文件名來的,不同的名稱則為不同的規(guī)則,最終保存為xml形式。
5、關(guān)于地址解析
解析地址1:測試未刪,以后會(huì)加功能,暫留著
解析地址2:推薦使用
6、理論上,只要是目錄頁指向內(nèi)容頁的形式都可以抓取【能獲取源代碼的情況下】。具體請(qǐng)大家自己去實(shí)驗(yàn)。
關(guān)于文件
1、commonrule.xml 文件存放的是通用替換規(guī)則,
2、rule文件夾下存放的是以網(wǎng)站為單位的規(guī)則。
如果需要直接拷貝單條規(guī)則放到rule文件夾下就可以使用規(guī)則了,前提是xml文件格式是對(duì)的,
3、其他
暫時(shí)還沒想到你們可能還會(huì)出現(xiàn)什么問題。如果遇到問題歡迎反饋。
最后附上常用匹配全部內(nèi)容的表達(dá)式:
(.*?) ([\w\W]*?) ([\s\S]*?)
- PC官方版
- 安卓官方手機(jī)版
- IOS官方手機(jī)版