網(wǎng)絡(luò)信息時(shí)代,天天上網(wǎng),經(jīng)常會(huì)遇到喜歡的文章,或者是小說(shuō)等,小則一兩頁(yè),多則幾十頁(yè),甚至上百頁(yè)、上千頁(yè),這么多文字,要復(fù)制下載就顯得非常的麻煩,本來(lái)要頻繁的在記事本和網(wǎng)頁(yè)瀏覽器上切換就已經(jīng)夠難過(guò)的了,現(xiàn)在還面臨著要同時(shí)做這種枯燥的機(jī)械的動(dòng)作幾十次、幾百次的問(wèn)題,到底有沒(méi)有更簡(jiǎn)單、高效、省力的辦法呢?
網(wǎng)頁(yè)文本采集大師是一款專門(mén)用于批量采集、復(fù)制或者說(shuō)是下載網(wǎng)絡(luò)上的文章或者是小說(shuō),甚至是整個(gè)網(wǎng)站文字內(nèi)容的工具,不管是靜態(tài)的網(wǎng)站,還是動(dòng)態(tài)的網(wǎng)站,只要有文字,它都能夠獲取,只要輸入簡(jiǎn)單的幾條信息,就可自動(dòng)批量為你下載復(fù)制網(wǎng)絡(luò)文章了,可謂是輕松快捷。
除了抓取網(wǎng)上的文章,你還可以用它來(lái)抓取一些特殊的信息,比如抓取百度詞典上的信息,或者你也可以用它抓取一些網(wǎng)頁(yè)上的鏈接地址。
另外本軟件還具有很多其它的功能,比如文本段落重排、文本合并、文件批量改名等功能,非常實(shí)用,要知道時(shí)間就是生命,可以讓電腦為你工作的事,你千萬(wàn)不要自己去做,快下載用用看吧,希望你會(huì)喜歡上她。
使用幫助
1、關(guān)于網(wǎng)頁(yè)網(wǎng)址的獲取
要采集文章,首先要知道該文章所在的網(wǎng)址,本軟件就是通過(guò)各種方法獲取的網(wǎng)址和幾個(gè)采集的關(guān)鍵字去獲取網(wǎng)上的文章的,因此在采集文章前,你先要提供文章所在的網(wǎng)址,這個(gè)網(wǎng)址你可以預(yù)先用記事本,按一行一個(gè)地址收集保存后,用本軟件導(dǎo)入
如果你正在上網(wǎng),看到一篇小說(shuō)不錯(cuò),而且你已經(jīng)打開(kāi)了該小說(shuō)的目錄頁(yè),那么,你在打開(kāi)本軟件后,使用“復(fù)制已打開(kāi)瀏覽器中的鏈接”功能也可一次性收集到這些地址,你再刪除一些不需要的后,選定這些地址,即可導(dǎo)入網(wǎng)址列表。
當(dāng)然通常的做法,就是在軟件中輸入文章目錄頁(yè)地址,文章正文網(wǎng)址鏈接關(guān)鍵字后,讓軟件收集這些地址。
2、關(guān)于網(wǎng)頁(yè)文本的采集
有了文章的地址,我們?cè)诖蜷_(kāi)這些文章后,一般這些文章的前后都會(huì)有大量網(wǎng)站上的相關(guān)信息,比如廣告等,所以還得分離出我們需要的正文,所以就要設(shè)置正文的起始和結(jié)束關(guān)鍵字,這個(gè)關(guān)鍵字是指正文開(kāi)始前出現(xiàn)的,而且在該頁(yè)面上是唯一的文字串,但是這個(gè)文字串又是在每篇文章前都有的,你輸入一段即可,結(jié)束關(guān)鍵字也一樣,輸入了起始和結(jié)束關(guān)鍵字,就可獲取文章了,你可以先打開(kāi)一個(gè)網(wǎng)址試試的。
如果這個(gè)網(wǎng)址打開(kāi)后,整個(gè)頁(yè)面很干凈,沒(méi)有其它任何不需要的文字的話,這些關(guān)鍵字就不用設(shè)置了。
3、關(guān)于文章標(biāo)題關(guān)鍵字
這是為了獲取文章標(biāo)題,也是為了保存文件所用的,很多時(shí)候,我們獲取的文章,它的首行就是這一篇文章的標(biāo)題,而且每一個(gè)網(wǎng)址后打開(kāi)都不一樣,那么我們就可不用輸入起始和結(jié)束關(guān)鍵字,軟件將會(huì)自動(dòng)以第一行為標(biāo)題保存文件。
如果目錄頁(yè)獲取的網(wǎng)址都是以
http://abc.sy520.com/bbs/read.asp?url=1234
http://abc.sy520.com/bbs/read.asp?url=1235
http://abc.sy520.com/bbs/read.asp?url=1236
形式出現(xiàn)的,而且標(biāo)題起始和結(jié)束關(guān)鍵字都設(shè)為空的話,程序?qū)?huì)自動(dòng)以
1234.txt
1235.txt
1236.txt
格式保存文件的。
4、其它功能介紹
①獲取已打開(kāi)IE瀏覽器所訪問(wèn)的網(wǎng)頁(yè)地址,這個(gè)地址將會(huì)顯示在軟件文章目錄頁(yè)地址輸入框中。
②抓取已打開(kāi)IE內(nèi)核瀏覽器中的文字,這個(gè)功能也很好用哦,如果你用IE內(nèi)核瀏覽器打開(kāi)了20頁(yè)頁(yè)面,而且這些頁(yè)面顯示的文字都想要復(fù)制來(lái),就可使用本功能了,你不用一頁(yè)頁(yè)去復(fù)制,一鍵全部下載。
③抓取已打開(kāi)IE內(nèi)核瀏覽器中的鏈接,用這個(gè)功能可快速抓取網(wǎng)址,我們修改后,選定這些地址就可導(dǎo)入鏈接地址下載列表了。
④請(qǐng)你記住,在本軟件中,網(wǎng)址列表、文件列表都有右鍵快捷菜單的,里面還有很多菜單上沒(méi)顯示的功能哦。
⑤還有就是你用鼠標(biāo)點(diǎn)擊狀態(tài)欄第一欄和第二欄,程序會(huì)切換顯示界面哦,看你需要了。
- PC官方版
- 安卓官方手機(jī)版
- IOS官方手機(jī)版