clone-voice(CV聲音克隆工具)是一個強大的聲音模擬工具,它能夠精準(zhǔn)捕捉并復(fù)制任何人類音色特征,并基于此將文本內(nèi)容轉(zhuǎn)化為相應(yīng)音色的語音輸出,甚至能夠?qū)崿F(xiàn)不同人聲之間的相互轉(zhuǎn)換。對于那些在聲音創(chuàng)作上有特殊需求,如需要合成多種音色、進行音頻制作或者個性化定制聲音的用戶來說,Clone-Voice無疑是一個理想的選擇。
軟件說明
Clone-Voice是一款利用網(wǎng)頁界面技術(shù)進行聲音克隆的尖端工具。它能夠使用任何人類音色,將一段文字合成為使用該音色說話的聲音,或者將一個聲音使用該音色轉(zhuǎn)換為另一個聲音。此工具支持包括中文、英語、日語、韓語、法語、德語和意大利語在內(nèi)的 16 種語言。它提供了文字到語音和聲音到聲音轉(zhuǎn)換的功能,以易用性、多語言支持和在線錄制聲音的靈活性而著稱。目前,該產(chǎn)品免費使用。
該技術(shù)廣泛應(yīng)用于聲音合成領(lǐng)域,為用戶提供無與倫比的聲音再造能力。無論是為視頻項目配音、制作播客節(jié)目,還是創(chuàng)造具有獨特個性的聲音元素,Clone-Voice都能發(fā)揮重要作用,極大地豐富了聲音藝術(shù)的表現(xiàn)形式和應(yīng)用范圍。
使用說明
使用非常簡單,沒有N卡GPU也可以使用,下載預(yù)編譯版本,雙擊 app.exe 打開一個web界面,鼠標(biāo)點點就能用。
支持中、英、日、韓、法、德、意等16種語言,可在線從麥克風(fēng)錄制聲音。
為保證合成效果,建議錄制時長5秒到20秒,發(fā)音清晰準(zhǔn)確,不要存在背景噪聲。
英文效果很棒,中文效果還湊合。
window預(yù)編譯版使用方法(其他系統(tǒng)可源碼部署)
下載預(yù)編譯版主文件和模型
下載后解壓到某處,比如 E:/clone-voice 下
雙擊 app.exe ,等待自動打開web窗口,請仔細閱讀cmd窗口的文字提示,如有錯誤,均會在此顯示
模型下載后解壓到軟件目錄下的 tts 文件夾內(nèi),解壓后效果如圖
轉(zhuǎn)換操作步驟
選擇【文字->聲音】按鈕,在文本框中輸入文字、或點擊導(dǎo)入srt字幕文件,然后點擊“立即開始”。
選擇【聲音->聲音】按鈕,點擊或拖拽要轉(zhuǎn)換的音頻文件(mp3/wav/flac),然后從“要使用的聲音文件”下拉框中選擇要克隆的音色,如果沒有滿意的,也可以點擊“本地上傳”按鈕,選擇已錄制好的5-20s的wav/mp3/flac聲音文件。或者點擊“開始錄制”按鈕,在線錄制你自己的聲音5-20s,錄制完成點擊使用。然后點擊“立即開始”按鈕
如果機器擁有N卡GPU,并正確配置了CUDA環(huán)境,將自動使用CUDA加速
實際應(yīng)用
Clone-Voice的實際應(yīng)用多種多樣:
內(nèi)容創(chuàng)作:對于視頻配音和播客,Clone-Voice可以節(jié)省時間、精力和金錢,同時允許即時修改。
音頻編輯:簡化錯誤情況下的音頻記錄修改。
提高可及性:將書面內(nèi)容轉(zhuǎn)換為音頻格式,增加視覺障礙聽眾或偏好音頻的用戶的可及性。
個性化:為企業(yè)或創(chuàng)作者提供在與客戶或粉絲互動中加入個性化內(nèi)容的機會。
功能說明
AI聲音克隆的關(guān)鍵功能
自然之聲:AI克隆的聲音聽起來自然,能模仿口音和情緒。
多種語言可供選擇:提供用數(shù)百種語言克隆聲音的選項,不僅限于英語。
改變設(shè)置的能力:允許更改音調(diào)和速度等設(shè)置以更接近原聲。
更新說明
增加語音速度調(diào)節(jié)選項,0.1-2.0
split_sentences參數(shù)默認改為 False,以取得更好合成效果
增加 .env 代理設(shè)置