語音辨識

輕鬆將語音轉換為文字來進行自然的溝通交流

簡介

AICS 的語音辨識 API 採用了領先業界的深度學習神經網絡模組,提供快速與高度準確的語音辨識服務,讓用戶使用語音輸入轉換成文字訊息的工作更加容易。這套 API 系統可應用於包括語音控制、社群通訊語音轉文字和人機對話等系統,您可以快速及簡便的透過此 API 開發您的應用。除此之外,此 API 是 100% 由 AICS 開發的語音辨識服務,您不必擔心隱私與資訊安全的疑慮,同時我們將持續精進語音辨識技術,讓辨識內容將更為準確。

特色

高準確性

AICS 語音辨識 API 是基於深度學習神經網絡技術;隨著資料的增加與演算法的進步,我們的準確度也日益提升。

串流語音轉寫

API 可以辨識正在說話的聲音,並馬上轉換成文字內容。在串流的過程中,不需等語句講完,即可進行辨識並取得結果。

即時反應

此系統即時的反應時間小於 200 毫秒,使用此系統將可使溝通更為流暢。

模型選擇

基於大量垂直領域語料庫,我們將繼續訓練各種模型,目前提供英語、中文、和中英雙語模型等,可以幫您找到最適合應用的模型。

應用場景

語音搜尋

簡短的要求如聲控或語音搜尋。

通訊軟體語音輸入轉文字

當使用通訊軟體時,轉換使用者的語音輸入成為文字。

人機對話

當與機器互動時,可藉由將語音輸入轉換為文字以取得更多資訊並優化互動體驗。

醫療

將醫生、護士或其他醫療報告錄音或即時口述轉寫成文字。

歡迎了解更多