東坡下載:內(nèi)容最豐富最安全的下載站!

幫助|文件類型庫|最新更新|下載分類|排行榜

編程相關(guān)破解相關(guān)編程工具反編譯安裝制作程序源碼軟件補丁數(shù)據(jù)庫Visual Studiovc++visualbasicdreamweaver

首頁編程開發(fā)編程相關(guān) → 智能語音識別軟件(CMU Sphinx) 最新開源版【中文】

智能語音識別軟件(CMU Sphinx)

智能語音識別軟件(CMU Sphinx)最新開源版【中文】

  • 大。237KB
  • 語言:英文
  • 平臺:WinAll
  • 更新:2016-03-14 14:45
  • 等級:
  • 類型:編程相關(guān)
  • 網(wǎng)站:http://californiadebtcollectionlawyers.com
  • 授權(quán):免費軟件
  • 廠商:
  • 產(chǎn)地:國外軟件
好用好玩 50%(0)
坑爹 坑爹 50%(0)
軟件介紹軟件截圖相關(guān)軟件軟件教程網(wǎng)友評論下載地址

相關(guān)推薦: CMU Sphinx CMU Sphinx 中文

    CMU Sphinx 是一款開源、免費的智能語音識別軟件。它可以用于多種不同的場合。語音轉(zhuǎn)錄、字幕、語言翻譯、聲音搜索和語言學(xué)習(xí)等等,也因為它是開源的,它允許研究人員和開發(fā)人員建立語音識別系統(tǒng)。歡迎免費下載!

    CMU Sphinx有哪些功能

    語音識別

    音頻轉(zhuǎn)錄

    標題對齊

    IVR

    文字轉(zhuǎn)語音

    CMU Sphinx怎么用

    建立語言模型

    有幾種類型的模型描述語言識別——關(guān)鍵字列表,語法和統(tǒng)計語言模型,語音的統(tǒng)計語言模型。 你可以選擇任何解碼方式根據(jù)您的需求,你甚至可以在運行時模式之間切換。

    關(guān)鍵字列表

    Pocketsphinx支持關(guān)鍵字定位模式,您可以指定要查找關(guān)鍵字列表。 這種模式的優(yōu)點是,你可以指定一個閾值為每個關(guān)鍵字,關(guān)鍵字可以連續(xù)語音中發(fā)現(xiàn)。 所有其他模式將試圖從語法檢測的話即使你使用的話,沒有語法。 關(guān)鍵字列表看起來像這樣:

    oh mighty computer /1e-40/

    hello world /1e-30/

    other phrase /1e-20/

    閾值必須指定每一個短語。 等較短的短語可以使用較小的閾值1 e 1,必須更大更長時間閾值。 假警報閾值必須調(diào)整平衡,錯過了檢測,調(diào)整閾值的最佳方法是使用一個預(yù)先錄制的音頻文件。

    最好的精度最好有短語3 - 4音節(jié)。 太短的短語很容易混淆。

    關(guān)鍵字列表支持pocketsphinx,而不是sphinx4。

    語法

    語法描述非常簡單類型的命令和控制的語言,和他們通常是手寫或自動生成的代碼。 語法通常沒有詞序列的概率,但一些元素可能重。 語法可以創(chuàng)建JSGF格式和通常有擴展。 克或.jsgf。

    語法允許精確指定可能的輸入,例如,某些詞可能只重復(fù)兩到三次。 然而,這種嚴格可能是有害的,如果用戶不小心跳過的話語法要求。 在這種情況下整個識別將會失敗。 因此最好使語法更放松,而不是短語的袋子單詞列表允許任意的順序。 避免與許多非常復(fù)雜的語法規(guī)則和情況下,它只是減緩識別器,可以使用簡單的規(guī)則。 在過去的語法需要大量的努力調(diào)整,正確分配變異等等。 大的VXML咨詢行業(yè)。

    語言模型

    統(tǒng)計語言模型描述更復(fù)雜的語言。 它們包含概率的詞和詞的組合。 這些概率估計的樣本數(shù)據(jù),并自動有一些靈活性。 例如,每個詞匯的組合是可能的,雖然這樣的組合的概率可能有所不同。 例如,如果你創(chuàng)建統(tǒng)計語言模型從一個單詞列表,它將仍然允許解碼詞組合盡管它可能不是你的意圖。 總的來說,統(tǒng)計語言模型推薦自由輸入,用戶可以說任何一個自然語言和他們需要工程工作比語法,你只是列出可能的句子。 例如,您可能數(shù)字列表“二十”和“三十三”和統(tǒng)計語言模型將允許“三十”有一定概率。

    總的來說,現(xiàn)代語音識別接口往往更自然,避免指揮控制的上一代風(fēng)格。 因此大多數(shù)界面設(shè)計師喜歡自然語言識別與統(tǒng)計語言模型比傳統(tǒng)的VXML語法。

    設(shè)計主題的VUI接口你可能感興趣的書如下: 最好是一個很好的機比壞人:語音識別和其他外來用戶界面由布魯斯Balentine Jetsonian時代的《暮光之城》

    有很多方法可以建立統(tǒng)計語言模型。 當您的數(shù)據(jù)集很大,有使用CMU語言建模工具包。 小模型時,您可以使用一個在線快速web服務(wù)。 當你需要特定的選項或者你只是想用你最喜歡的工具包構(gòu)建ARPA模型,您可以使用它。

    語言模型可以存儲和加載在三個不同的格式文本 ARPA 格式,二進制格式本和二進制DMP格式。 ARPA格式需要更多空間,可以編輯它。 ARPA文件 .lm 擴展。 二進制格式需要大大減少空間和更快的加載。 二進制文件 .lm.bin 擴展。 也可以在格式之間進行轉(zhuǎn)換。 DMP格式是過時的,不推薦。

    建立一個語法

    語法通常是手工編寫JSGF格式:

    #JSGF V1.0;

    /**

    * JSGF Grammar for Hello World example

    */

    grammar hello;

    public <greet> = (good morning | hello) ( bhiksha | evandro | paul | philip | rita | will );

    PC官方
    安卓官方手機版
    IOS官方手機版

    智能語音識別軟件(CMU Sphinx)截圖

    下載地址

    智能語音識別軟件(CMU Sphinx) 最新開源版【中文】

    熱門評論
    最新評論
    發(fā)表評論 查看所有評論(0)
    昵稱:
    表情: 高興 可 汗 我不要 害羞 好 下下下 送花 屎 親親
    字數(shù): 0/500 (您的評論需要經(jīng)過審核才能顯示)

    編輯推薦

    本類軟件必備

    編程UltraEditvc++6.0Notepad++編譯VBILSpyHopper數(shù)據(jù)MySQLoracleaccess設(shè)計DreamweaverfireworksFlash

    報錯

    請簡要描述您遇到的錯誤,我們將盡快予以修正。

    轉(zhuǎn)帖到論壇
    輪壇轉(zhuǎn)帖HTML方式

    輪壇轉(zhuǎn)帖UBB方式