作者kyo55966 (kyo)
看板japanavgirls
標題Re: [討論] 翻譯字幕 AI模型 中文
時間Wed Dec 4 23:00:16 2024
原文恕刪
生成效果:
https://i.imgur.com/IHAsiFU.jpeg
以下記錄一下個人學習心得XD:
1.先使用WhisperDesktop
將影音檔案自動生出字幕檔案
這個估狗就找的到 完全免費開源
我用模型ggml-large-v2測試比較穩定
V3速度極慢可能記憶體不太夠
等5090出了再買來跑看看
2.生出的字幕檔案大小差異很大
其中約60%~90%是狀聲詞 懂得都懂
將這個檔案直接丟Subtitle Translator
翻譯一部片會吃掉1塊多鎂
客家人無法忍受大量的翻譯贅字
我就請出微軟免費送的Copilot問問
從寫腳本到如何創建執行檔講的很仔細
程式小白幾次抽插以後也弄出兩個小工具
(1)將與前一句相同的字幕刪除
https://i.imgur.com/Xd6viFE.jpeg
https://i.imgur.com/TCc07mj.jpeg
(2)將最多重複的字幕統計出來詢問是否刪除
這個Copilot問很多次都寫不成功
後來改問chatGPT好幾次才成功
https://i.imgur.com/3JxzHMK.jpeg
好了
現在字幕檔成功從166瘦身到17kB
翻譯一片只要0.13鎂
https://i.imgur.com/EmpTlpb.jpeg
3.我想網路上應該有更方便現成的軟體可以處理字幕問題
我只是很驚訝AI的成長速度
忍不住想記錄自己的學習過程
也推薦給感興趣的
但沒摸過相關程式的人玩玩
將腳本貼到AV版可能太哈扣
AI真問不出來再留言吧...
參考資料:
YOUTUBE上的
WhisperDesktop相關
Subtitle Translator相關
如何購買和使用OpenAI ChatGPT API
--
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.252.192.94 (臺灣)
※ 文章網址: https://www.ptt.cc/bbs/japanavgirls/M.1733324418.A.00A.html
推 eeee5566: 真的猛 一些專有瑟瑟名詞翻得出來嗎 需要校稿嗎 12/05 09:31
推 Carrarese: 專業 12/05 10:21
→ chchang0820: 你片片的來源是? 12/05 11:21
→ chchang0820: 所以說番號呢? 12/05 11:22
推 fudick: 這就是專業 12/05 11:36
推 iverboy: 猛 12/05 11:43
→ kyo55966: IPZ-514 珍藏多年了 12/05 13:37
推 ailio: 疑問是,都用AI寫程式了,怎不直接讓AI翻譯? 12/05 15:35
→ kyo55966: 瘦身後的文件也許免費流量就夠了,但免費ai比較難瑟瑟? 12/05 15:55
→ kyo55966: copilot翻幾句就跳拒絕回答 12/05 15:55
推 Chricey: 苦瓜胜肽 12/05 15:55 推 kane5945: 請問WhisperDesktop只能翻譯六分鐘嗎?該如何翻譯整部影 12/05 19:31
→ kane5945: 片呢?謝謝 12/05 19:31
→ kyo55966: 我都沒在whisper中翻譯,效果不好,只拿來生字幕檔,但 12/05 19:51
→ kyo55966: 是也常常出錯,20分鐘以後的字幕都是ㄚㄚㄚㄚㄚ….之類 12/05 19:51
→ kyo55966: 的 12/05 19:51
→ hidexjapan: Whisper可以翻全部啊,但是Large的VRam 至少要12GB起 12/05 20:15
推 Kroner: 苦瓜胜肽 12/05 20:15 → hidexjapan: 跳,而且輸出時間大概1:2吧,是有看到16GB MAC MINI 12/05 20:15
→ hidexjapan: WHISPER跑起來快很多 12/05 20:15
→ thomaschion: 你說得這些只是AI的皮毛功能而已,接觸了半年,才發 12/06 14:25
→ thomaschion: 覺以前真的小看了AI 12/06 14:25
推 joey6504: Whisper時間軸的問題還是很頭痛,如果軸能夠跟剪映一樣 12/06 17:42
→ joey6504: 就好了,剪映提取的日文語句沒whisper順 12/06 17:42
推 Kroner: 益生菌 12/06 17:42