軟件主要實現批量上傳音頻文件(當前版本僅支持mp3,后續(xù)版本可能添加多種格式,可用格式工廠進行mp3格式轉換)進行語音轉文字的功能,依托于百度AI,語音識別正確率還是相當不錯的。這款獨立版的軟件去除了原先的黑框,修復了很多bug,KEY的申請教程也寫詳細了,希望各位能舒心使用,當然肯定還有一些bug,各位及時反饋即可。
批量萬能音頻轉文字軟件使用方法
我們嚴格按照如下步驟來進行操作:
1、KEY的申請
軟件上方的APIKEY和SECRETKEY需要去百度AI網頁的語音識別板塊上申請,完全免費的申請。
如下,打開短語音識別網頁:https://ai.baidu.com/tech/speech/asr,點擊立即使用。
百度賬號登錄,進入如下界面,按照箭頭先都領取了。
然后創(chuàng)建應用,按照箭頭指示隨便寫即可:
然后查看應用詳情里,就能看到APIKEY和SECRETKEY了,復制到軟件中即可。
2、選擇識別語種
軟件一共可選:極速版普通話、免費版普通話、免費版英文、免費版粵語、免費版四川話這幾種,其中第一個極速版普通話正確率最高。
3、選擇音頻轉換
點擊按鈕可批量選擇多個mp3音頻,然后自動進行轉換,識別完成后自動保存識別結果到軟件目錄的音頻轉換結果文件夾中
如下測試轉換20多分鐘的岳云鵬相聲,正確率確實不錯了。
批量萬能音頻轉文字軟件更新日志
修復部分mp3文件閃退bug。
支持更多音頻格式轉換,目前支持音頻格式:*.mp3;*.wav;*.m4a;*.aac;*.wma;*.flac
- PC官方版
- 安卓官方手機版
- IOS官方手機版