靈云語音合成:追求高度自然、真實的語音合成效果
發(fā)布于:2021-11-16 17:41 瀏覽:
近日,捷通華聲推出搭載最新引擎的靈云語音合成技術,聲線細膩、情感豐富、語速真實。得益于核心引擎的深度學習化與高音質聲碼器,最新靈云語音合成技術的合成效果得到全面提升。


升級后的語音合成技術在各項指標上都達到了歷史新高。測評人員給出的MOS值達4.5分,屬行業(yè)領先。
注:MOS(Mean Opinion Score),平均主觀意見分。在國際標準中,統(tǒng)一使用MOS值來評價系統(tǒng)接收到的話音質量。(滿分5分)
合成速度方面,靈云語音合成技術同樣毫不遜色。從實際體驗來說,用戶幾乎感受不到任何等待時間,語音合成從點擊“播放”開始即刻完成。
為了在各個專業(yè)領域都能夠有良好穩(wěn)定的語音合成表現(xiàn),滿足不同行業(yè)的特殊需求,靈云語音合成針對特定詞匯和語句進行個性化定制,通過用戶詞表、定制錄音以及調整判斷規(guī)則等方法,提高讀音、讀法和韻律的準確性。經過十多年不同行業(yè)的實踐經驗,捷通華聲積累了大量的專業(yè)領域詞庫、預選音庫,可為金融證券、天氣預報、體育賽事、公交汽運、航空、稅務、POI、排隊叫號等眾多領域提供更專業(yè)的語音合成播報,客戶能夠快速、輕松定制與自己產品屬性、形象相匹配的聲音,為產品賦能。


針對手機app、智能手表、智能機器人等產品,開發(fā)者可通過從云端調用能力的方式,搭建輕量化終端。

b.基于windows系統(tǒng)的靈云語音合成軟件
車站、醫(yī)院、廣播站的語音播報,可以直接使用安裝在電腦上的靈云語音合成軟件,一鍵播放。

c.私有化部署的靈云語音合成能力平臺
在客服中心、呼叫中心等場景,用電話機器人來服務海量用戶,需要高并發(fā)的語音合成能力。捷通華聲提供可私有云部署的語音合成能力平臺,與客戶IVR系統(tǒng)對接,提供穩(wěn)定高效的語音合成服務。


音色方面,除了提供男聲、女聲、童聲等基礎音色庫外,還有更多個性化、飽含情感的音色,包括柔美動聽、干凈利落、甜美可愛、純真自然、成熟穩(wěn)重、熱情洋溢、措辭嚴厲等等,可為各種應用場景提供合適的聲音,全面滿足企業(yè)個性化需求。例如,銀行的智能客服需要溫柔動聽的聲音,從而給客戶良好的服務體驗,而金融行業(yè)的欠款催收場景,則需要選擇相對嚴厲的聲音,起到警示和催促的作用。
自從2001年在國內率先推出面向市場的語音合成技術以來,捷通華聲已廣泛服務金融、電信、能源、交通、教育、司法、公安、醫(yī)療、互聯(lián)網等各領域,并出口美國、法國、西班牙、日本、韓國、新加坡等國家。捷通華聲愿攜手更多產業(yè)伙伴,為軟件開發(fā)商、系統(tǒng)集成商、解決方案供應商等合作伙伴提供優(yōu)質的產品和全面的技術支持,讓更多的企業(yè)及個人享受到智能語音合成為生活帶來的便利體驗。