pyVideoTrans視頻翻譯配音是一款開(kāi)源免費(fèi)視頻音頻翻譯軟件,基于ChatTTS的UI軟件,ChatTTS 可用于大型語(yǔ)言模型助手的對(duì)話(huà)任務(wù)、對(duì)話(huà)語(yǔ)音生成、視頻介紹、教育和培訓(xùn)內(nèi)容的語(yǔ)音合成等。通過(guò)大量和多樣化的數(shù)據(jù)集訓(xùn)練,ChatTTS確保了合成語(yǔ)音的自然度。
軟件說(shuō)明
Pyvideotrans是一款卓著的智能化視頻處理系統(tǒng),專(zhuān)精于視頻翻譯與配音藝術(shù),以其卓越的技術(shù)實(shí)力實(shí)現(xiàn)對(duì)原始視頻中音頻信息的精準(zhǔn)捕捉、智能翻譯,以及與背景音樂(lè)等多元原視頻元素的無(wú)縫融合,從而匠心獨(dú)運(yùn)地創(chuàng)造出搭載全新語(yǔ)言配音與字幕的再創(chuàng)作視頻作品。
語(yǔ)音識(shí)別:借力先進(jìn)且高效的離線(xiàn)模型,諸如Whisper(由OpenAI研發(fā))或同類(lèi)高速迭代版本,該系統(tǒng)能以極高精度將視頻中的言語(yǔ)聲波瞬時(shí)解碼為可視化的文字劇本。
多源翻譯:廣泛兼容各類(lèi)在線(xiàn)及離線(xiàn)翻譯服務(wù)資源,涵蓋國(guó)際科技巨頭如Microsoft、Google、Baidu、Tencent的翻譯平臺(tái),新興AI力量如ChatGPT、Azure、Gemini、DeepL乃至DeepLX等,乃至特設(shè)的離線(xiàn)翻譯解決方案。此多元化策略確保了翻譯質(zhì)量的權(quán)威性、全面性和時(shí)效性,滿(mǎn)足不同場(chǎng)景下的精準(zhǔn)翻譯需求。
文本轉(zhuǎn)語(yǔ)音(TTS):整合業(yè)界領(lǐng)先的文本到語(yǔ)音轉(zhuǎn)換技術(shù)矩陣,囊括Microsoft Edge TTS、Openai TTS-1、Elevenlabs TTS等翹楚,并獨(dú)具開(kāi)放性,支持用戶(hù)根據(jù)個(gè)性化需求對(duì)接其他TTS API接口,甚至接納如GPT-SoVITS這類(lèi)前沿的克隆人聲模型。
多語(yǔ)言支持:跨越地理文化的邊界,該系統(tǒng)深度涵蓋了全球主流及眾多特色語(yǔ)系,無(wú)論是東方的漢語(yǔ)簡(jiǎn)繁體、韓語(yǔ)、日語(yǔ),西方的英語(yǔ)、俄語(yǔ)、法語(yǔ)、德語(yǔ)、意大利語(yǔ)、西班牙語(yǔ)、葡萄牙語(yǔ),還是南亞的越南語(yǔ)、泰語(yǔ),中東的阿拉伯語(yǔ),歐亞交界的土耳其語(yǔ),東歐的匈牙利語(yǔ),南亞次大陸的印度語(yǔ)等,均在支持之列。
ChatTTS是一個(gè)為對(duì)話(huà)場(chǎng)景優(yōu)化的文本到語(yǔ)音轉(zhuǎn)換工具,它專(zhuān)門(mén)設(shè)計(jì)用于處理大型語(yǔ)言模型(LLM)助手的對(duì)話(huà)任務(wù),以及對(duì)話(huà)式音頻和視頻介紹等應(yīng)用。這個(gè)工具支持中文和英文,通過(guò)大約10萬(wàn)小時(shí)的中英文數(shù)據(jù)訓(xùn)練,ChatTTS 在語(yǔ)音合成方面展現(xiàn)出高質(zhì)量和自然度。
備用下載:https://pan.baidu.com/share/init?surl=uj5hiRE6lZ0lLhhWRZl6-A&pwd=h496
軟件特色
一鍵實(shí)現(xiàn)語(yǔ)音識(shí)別->字幕翻譯->配音 = 帶字幕和配音的新視頻
自動(dòng)視頻翻譯
集成faster-whisper模型/并支持自定義huggingface模型
同時(shí)集成批量語(yǔ)音轉(zhuǎn)字幕、批量字幕翻譯、批量配音小工具
多種配音和翻譯渠道
配音:edgeTTS|AzureTTS|OpenAiTTS|Elevenlabs|clone-voice|GPT-SoVITS
翻譯:Google|ChatGPT|DeepL|Gemini|Mircosoft|百度|騰訊|本地模型
可完全離線(xiàn)
翻譯渠道替換為本地模型,配音渠道替換為clone-voice,即可實(shí)現(xiàn)完全本地離線(xiàn)視頻翻譯
免費(fèi)+開(kāi)源
代碼GitHub公開(kāi)可審查,免費(fèi)無(wú)功能限制,無(wú)隱藏收費(fèi)
開(kāi)源協(xié)議GPL-v3
主要功能
視頻翻譯
PyVideoTrans支持將視頻中的語(yǔ)音識(shí)別為文字,并使用先進(jìn)的機(jī)器翻譯技術(shù)將其翻譯成目標(biāo)語(yǔ)言。用戶(hù)只需選擇原始視頻和目標(biāo)語(yǔ)言,即可快速獲得翻譯后的視頻。
配音功能
對(duì)于已翻譯的視頻,PyVideoTrans還提供配音服務(wù)。用戶(hù)可以選擇不同的配音類(lèi)型和角色,為視頻添加生動(dòng)的聲音效果,使觀(guān)眾更容易理解和接受。
音視頻識(shí)別文字
PyVideoTrans還具備音視頻識(shí)別文字功能,可以將視頻或音頻中的語(yǔ)音識(shí)別為文字,并導(dǎo)出為SRT字幕格式,方便用戶(hù)后期編輯和分享。
更新說(shuō)明
修復(fù) ChatTTS 支持
修復(fù) Google 翻譯
提高AzureTTS默認(rèn)音頻質(zhì)量