語音聽寫把語音(≤60秒)轉換成對應的文字信息,讓機器能夠“聽懂”人類語言,相當于給機器安裝上“耳朵”,使其具備“能聽”的功能;
語音聽寫產品優勢:
超過98%的準確率
訊飛開放平臺擁有*的語音識別技術,核心技術達到*水平,語音識別準確率已經超過98%,在業界遙遙*。
支持多種語種和方言
支持中文、英文兩個語種的識別,同時,我們還提供粵語、河南話、四川話等方言的識別。
方便快捷的信息溝通
語音輸入速度達180字/分,識別結果響應時間低于200ms——系統運行效率讓信息溝通變得無比順暢。
個性的語音識別
基于用戶語音特征,建立個性化的詞條語言模型,調整識別參數,持續優化識別效果,提高用戶的個性化詞條識別準確率。
中文標點智能預測
語音聽寫使用超大規模的語言模型,對識別結果語句智能預測其對話語境,提供智能斷句和標點符號的預測。
支持垂直領域和應用級聽寫
基于大量垂直領域語料,我們不斷對模型進行訓練,目前提供三個垂直領域的聽寫模型:商旅、視頻和音樂。、
應用場景
社交聊天
使用社交應用聊天時,將用戶的語音信息(≤60秒),轉成文字信息
語音輸入法
使用輸入法輸入時,將語音信息轉成文字信息,提升用戶閱讀體驗
游戲娛樂
將游戲娛樂中的音頻文件轉成文字消息,大大提升用戶體驗
人機交互
人機交互時,將雙方的語音信息轉成文字信息,提升交互體驗