語音合成
語音合成服務(wù),通過先進(jìn)的深度學(xué)習(xí)技術(shù),將文本轉(zhuǎn)換成自然流暢的語音。目前有多種音色可供選擇,并提供調(diào)節(jié)語速、語調(diào)、音量等功能。適用于智能客服、語音交互、文學(xué)有聲閱讀和無障礙播報(bào)等場景。
如有任何需求或疑問,請直接聯(lián)系:nls_support@service.aliyun.com。
如有任何需求或疑問,請直接聯(lián)系:nls_support@service.aliyun.com。
產(chǎn)品優(yōu)勢
技術(shù)領(lǐng)先
技術(shù)上兼顧了多級韻律停頓,達(dá)到自然的合成韻律目的,綜合利用聲學(xué)參數(shù)和語言學(xué)參數(shù),建立基于深度學(xué)習(xí)的多重自動預(yù)測模型。
多領(lǐng)域覆蓋
在智能家居、車載、導(dǎo)航、金融、銀行、保險(xiǎn)、證券、運(yùn)營商、物流、房地產(chǎn)、教育等眾多領(lǐng)域積累了大量的詞庫,讓阿里語音合成技術(shù)對各領(lǐng)域、各行業(yè)的詞匯發(fā)音更準(zhǔn)確。
聽感自然
使用海量的音頻數(shù)據(jù)訓(xùn)練合成數(shù)據(jù),合成音真實(shí)飽滿、抑揚(yáng)頓挫、富有表現(xiàn)力,MOS評分達(dá)到業(yè)內(nèi)頂級水準(zhǔn)。
深度定制
可根據(jù)用戶需求定制音庫,滿足用戶的個(gè)性化應(yīng)用需求,提供標(biāo)準(zhǔn)男女聲,溫柔甜美女聲等多風(fēng)格的選擇,支持標(biāo)記語言(SSML)方式的合成方式,音量、語速、音高等參數(shù)也支持動態(tài)調(diào)整。
適用場景
智能客服
提供多行業(yè)多場景的智能客服語音合成能力。提高解答效率,提升客戶滿意度,降低呼叫中心人工成本。
智能設(shè)備
為智能家居、音箱、車載和可穿戴設(shè)備等賦予一個(gè)最有溫度的聲音。
文學(xué)有聲閱讀
讓富有感染力的聲音給你講故事、讀小說和播新聞,滿足“懶人”的閱讀需求。
無障礙播報(bào)
無論是健全人還是殘疾人,無論是年輕人還是老年人,將文字轉(zhuǎn)成流暢動聽的自然語言聲音。
更多產(chǎn)品與服務(wù)
錄音文件識別
對用戶上傳的錄音文件進(jìn)行識別,上傳完之后24小時(shí)內(nèi)完成識別并返回識別文本?捎糜诤艚兄行恼Z音質(zhì)檢、庭審數(shù)據(jù)庫錄入、會議記錄總結(jié)、醫(yī)院病歷錄入等場景。
了解更多
實(shí)時(shí)語音識別
對不限時(shí)長的音頻流做實(shí)時(shí)識別,達(dá)到“邊說邊出文字”的效果,內(nèi)置智能斷句,可提供每句話開始結(jié)束時(shí)間?捎糜谝曨l實(shí)時(shí)直播字幕、實(shí)時(shí)會議記錄、實(shí)時(shí)法庭庭審記錄、智能語音助手等場景。
了解更多
一句話識別
對時(shí)長較短(一分鐘以內(nèi))的語音進(jìn)行識別,適用于較短的語音交互場景,如語音搜索、語音指令、語音短消息等,可集成在各類App、智能家電、智能助手等產(chǎn)品中。
了解更多
語言模型自學(xué)習(xí)工具
用戶可以自行上傳數(shù)據(jù),對阿里的語音技術(shù)進(jìn)行深度定制,從而提升特定業(yè)務(wù)領(lǐng)域的識別準(zhǔn)確度。目前僅支持上傳文本數(shù)據(jù)對語言模型進(jìn)行定制,未來會推出上傳音頻數(shù)據(jù)對聲學(xué)模型進(jìn)行定制。
了解更多
合作方