推 reing0213: 我用有道翻譯,至少知道大概劇情,細翻不行 11/29 15:00
推 BraveCattle: 推 11/29 15:09
推 n1m5w8tsarp: 目前語音辨識跟翻譯都做得好的大概就是ChatGPT,用 11/29 18:41
→ n1m5w8tsarp: 虛擬音效軟體搭配電腦版App就可以翻,只是時間軸那 11/29 18:41
推 Kroner: 葉黃素推薦 11/30 01:42→ n1m5w8tsarp: 些還是要自己來 11/29 18:41
推 clv: 我直接用剪映 可以雙語選日本與中文 11/29 20:39
推 asdasd02tw: Large很吃顯卡啊 起碼要有個12g顯存吧 如果只要辨識英 11/30 01:42
推 Chricey: 苦瓜胜肽什麼時候吃 11/30 01:42→ asdasd02tw: 文可以用distil whisper 這是優化過的模型 如果要辨識 11/30 01:42
→ asdasd02tw: 日文就得用原版whisper模型 或是要找有人專門改進針對 11/30 01:42
→ asdasd02tw: 日文的 不過那種通常性能要更高才能跑了 11/30 01:42
推 Kroner: 苦瓜胜肽的功效 12/01 23:54用whisper desktop純粹是省麻煩,不用設定一堆..
如果你可以給我步驟跟不用調的程式碼我可以試試..
不然一堆git 下下來都不能直接跑,debug 的時間都足夠自己找文件念了.
※ 編輯: youngglasses (150.117.243.27 臺灣), 11/30/2024 02:41:35
推 Subliminal: 科技果然要靠色色驅動 11/30 08:45
推 kinwangsm: 想請問desktop好像會產生沒說話的時段會文字重複問題 12/01 23:53
→ kinwangsm: 想問一下原po有遇到過嗎? 12/01 23:54
會,很常發生.
我推測原因是因為whisper 判斷語句的頻率問題,
如果有大段的時間沒有文字, 他們沒有清掉上段語句,也就是斷句的判斷..
所以空白時間上一句話字幕會一直留著
whisper 還有一個討厭的問題,
就是模型很不穩定.
一段語音或是電影..
你很有可能重複丟三四次, 出來結果次次不一樣.
有那種完全失敗的,從開頭就錯到尾的
也有那種正確5,6成的,
也有那種正確率9成以上的.
都同一個餵進去的資料.
我覺得是顯卡跟ram 不夠大的問題..
※ 編輯: youngglasses (150.117.243.27 臺灣), 12/06/2024 22:25:39