原文章在Medium上:Effortless YouTube Transcriptions: Combining yt-dlp and Whisper

Whisper

Whisper 是OpenAI在2021年推出的翻譯模型,在2022年釋出開源版本。

Whisper is a general-purpose speech recognition model. It is trained on a large dataset of diverse audio and is also a multitasking model that can perform multilingual speech recognition, speech translation, and language identification.

因為強大的翻譯能力,我們可以拿來做影片的逐字稿。

素材

需要翻譯用的素材當然就需要音檔,如果沒有音檔需要從YouTube上下載,可以使用yt-dlp來下載。 記得選擇format的時候可以挑選音檔即可,可以加快下載時間。

使用

安裝以及使用上相當簡相當,但需要注意的是如果沒有GPU,速度上會慢上許多,此時就會建議使用Google Colab來執行。
文末會提供一個Colab來執行。

安裝

pip install -U openai-whisper 即可安裝
安裝完後,可以到Whisper查看要使用哪個模型。\
目前官方提供的模型有

  • tiny
  • tiny.en
  • base
  • base.en
  • small
  • small.en
  • medium
  • medium.en
  • large

en結尾的是針對英文加強模型,也是只能使用在英文上,使用較小的模型即可達到不錯的效果。

使用

transccribe
1
2
3
4
5
6

import whisper

model = whisper.load_model("large") # 選擇你的模型名稱
result = model.transcribe("path/to/your/file")

1
2
3
4
5
6
7
model.transcribe(name, verbose=verbose, word_timestamps=time_stamp, task=task)
在Transcribe底下,可以帶verbose, word_timestamps和task參數。
- verbose: 會顯示目前已經完成的逐字稿
- word_timestamps: 會顯示每個字的時間戳記
- task 可以帶入`translate`,把非英文的語音轉成英文,但這項功能會導致timestamp無法正確顯示


Colab

底下是簡易的Colab執行筆記本,選擇好需要翻譯的影片網址,然後一路執行即可。

Colab

本文專案來源

簡介

這篇文將帶過如何快速使用Yt-dlp來下載Youtube上影片或是直播內容,避免閱讀繁瑣的說明書

安裝

不論你是任何作業系統,我都建議使用Python搭配pip作為環境使用。
本文將在MacOS底下操作,如有遇到任何問題,可以參照官方手冊。

創造你的環境,不論使用conde env或是virtualenv,確保使用Python3.8+

conda create --name yt-dlp python=3.11
接著pip install yt-dlp yt-dlp

完成安裝後,yt-dlp --version 確認當前版本。


Read more »

tl;dr

前陣子,被一位學長問到,為什麼要看Vtuber而不看真人呢?
這真是個好問題!身為理組我們應當理性分析各種原因與利弊,我當下回答不出來,想了一下,我猜想是比起明星更沒距離感吧!

自媒體的興起

直播文化我最有印象的是在大約十年前,twitch還沒興起時,當時主流實況都在justin.tv,雜談,表演,唱歌等等都在上面,遊戲實況則會在twitch,當時中文圈最著名莫過於LNG,好多當時流行語都是從當中出來的,更別說往後的打lol有禮貌運動等等,在我高中時真的是無人不知無人不曉。
可惜過沒多久,justin.tv就被併入twitch底下,現在想起來,確實justin就有如沒有管制的場所,不時會有一些很色情奇怪的實況出現。


然而在日本,這種文化的流行就必須從niconico說起,也是在約莫10幾年前,niconico就已經是紅遍一方的平台,在我印象裡當時Youtube還沒有那麼多的受眾,當然niconico最大的問題在於演算法、雲端資源等等在當時都不夠充足,可以說是與justin差不多的混沌。


Read more »

一個月前拿到後端工程師的職位,在準備Canonical的時候得知了Hacktoberfest,於是今年想要也參加這項活動! If you’re seeking for an English version, here is the article on Medium

TL;DR

不要往下看了!直接去官網點選參加,對開源社群貢獻出你最好的PR👊

Hacktoberfest

當我在準備Canonical面試的時候,發現到去衡量一位工程師的程度?或積極程度不單單是看contributions的圖,對於開源專案的PR,MR知道多少也是很重要,尤其是對於像是Canonical這種開源相關的公司。

The ocntributions diagram of my on GitHub

開源專案對於整個社群有著相當的重要性,試想我們在寫程式的時候,第一行是否都從import 一些常用的套件開始,但有想過這些寫好的Library從哪裡來呢?他們大部分都是開源專案在GitHub或GitLab上,任何人可以看到裡面的程式碼,並且做出改善,增強,修復錯誤,這些都是做出好的PR。

Read more »

TL;DR

申請英國天文所失敗,結束研究助理後,很幸運的一個月內就找到一份工作,到現在也到職快一個月,這篇會分享在AI科技蓬勃發展的時代,我所看到找工作需要的能力👊

Previously on Tyler

距離前一篇Django + Docker -> Deployment with Nginx, Gunicorn and PostgreSQL也有兩個多月的時間,上一篇Django算是離開學術的分手文技術文👍,在接下來一個月內投了大概30份工作,回覆率在10%也就是大約3間有近到面試,有interview總共4間,而只有一間拿到offer,因為太想要離開家裡,所以一拿到offer就趕緊接受了😂

Read more »

前言

想像天文事件都是一瞬間發生的,像是Blackhole merger, Supernova, flare events and so on. 這些事件的紀錄都是很難能可貴的資料,若是要完整紀錄更是稀有,我們只能在接到通知後盡量去做follow-up observation。此時若有個系統可以接收並且立刻發送到各個天文台,那麼這些難能可貴的現象我們就可以進一步了解。

TOM就是為了處理這些目標與觀測的平台,藉由Python知名的Django框架來做處理。這篇文章目標涵蓋從寫HTML的模板開始,藉由Django架設測試用伺服器,接著利用Docker把整個打包起來放到伺服器上運行。

Read more »

在上一篇Github.io個人網站架設中提到在config裡面設定的部分,在Github對於權限更改,廢除使用username以及password的方式,而改使用token作為驗證方式。

在github裡面的settings,使用Personal token來產生一組金鑰,接著在config裡面改用環境變數帶入金鑰。
接著更改你的環境變數,如果是使用bash則在.bashrc裡新增export HEXO="TOKEN"

1
2
3
4
5
6
7
8
# Deployment
## Docs: https://hexo.io/docs/one-command-deployment
deploy:
type: git
repo: https://github.com/Tylerastro/Tylerastro.github.io
branch: main
github-token: $HEXO

然而我想提出的是如果是Apple用戶,很大機率使用Keychain的服務作為金鑰儲存,如果以上方法失敗,可以到Keychain手動更改github的密碼,挑選kind為internet的密碼做更改,就可以成功更新金鑰密碼了。

前言

看了一下距離上篇文已經超過半年的時間了😱,今天想要稍微記錄一下這段時間忙些什麼,以及為什麼文章停滯。
現在草稿裡面有10篇文章待產,但有7篇會直接死亡,剩下1篇會合併到這裡另外1篇技術文章關於Django整個架設網站過程會在寫完後發布。這篇文章大概是拖時間的元兇😅

What is Tlog?

人家有Vlog用影像記錄生活,用文字不就是Tlog😏
Tlog形式會像是雜談,聊聊近期發生的事情,算是一個抒發心情的管道ᶘ ᵒᴥᵒᶅ

Recap

從2022去年6月結束當兵後,一直到12月都在忙申請國外研究所的文件,邊做研究邊處理申請然後配著Hololive ^_-
大概是在10月左右,因長期居家工作沒什麼機會跟人講話,才會開始看Vtuber,需要有人的聲音的感覺。看來人還是群居的生物XD

在12月結束申請後,後面就是一路拼研究跟觀測網站架設,過年前後算是產量高峰,從壓力較大的申請跳轉到全力寫程式對我還是比較輕鬆的部分,這段期間把宿主星系的SED fitting跑完,也把網站大架構寫起來,雖然還是沒什麼人可以對話,不過對於看到成果還是有開心的部分。

Read more »

前言

WFH邁入第三個月,由於在家裡時間變長許多,漫漫長夜變成了追劇夜晚,在每天工作之餘看看一些胃痛番來讓自己放鬆一下!?
總之SOP,CV等申請還在進行中,但看完的當下,這些情感我想要先記錄下來。

86 不存在的戰區

86總長度為23集,是我可以接受的長度範圍,由於沒看過原著,原作部分就會參考YT上講解,以免個人立場偏頗。
整體劇情節奏明快,日常中依然推著劇情,不會有無謂的鏡頭,從動畫上可以感受出原作應該是相當著重於文本的內容,因為在武器、交戰等動作場面上經費可以看得出來沒下重本🥲,戰鬥場面可以算是沒有重點,背景設定我也很難感受到邏輯,但如果撇開這些,單看主角群的心境表現,的確是一部好的作品。

雖然不像以往的作品,有那麼一幕是破防,將我打至潰堤,但從第一集到最後一集,在內心畫面的呈現上都是可以打動我的淚腺的。

Read more »

Shell 是什麼

一台電腦的組成到運行可以想像成有硬體組成(Hardware),核心(Kernel),以及殼層(Shell)。
那麼使用者所接觸到的就是殼層這部分,這一圈可能有CLI(command-line interface)或GUI(Graphical user interface),就如同我們所使用的terminal或者任何圖形化介面等。

而Shell script就是我們透過殼層與內核溝通的語言,藉由殼層翻譯給內核,內核再去驅動我們硬體做出相對應指令。

那為什麼我們要了解這項語言呢?
主要是我們很多自動化動作可以藉由Shell script來達成,簡單的就是開機時,系統內的Shell初始電腦硬碟,開始調用CPU以及Memory輸出畫面到我們螢幕上。

Read more »
0%