whisper

Posted on 2024-08-10 In Notes Word count in article: 1.1k Reading time ≈ 1 mins.

原文章在Medium上：Effortless YouTube Transcriptions: Combining yt-dlp and Whisper

Whisper

Whisper 是OpenAI在2021年推出的翻譯模型，在2022年釋出開源版本。

Whisper is a general-purpose speech recognition model. It is trained on a large dataset of diverse audio and is also a multitasking model that can perform multilingual speech recognition, speech translation, and language identification.

因為強大的翻譯能力，我們可以拿來做影片的逐字稿。

素材

需要翻譯用的素材當然就需要音檔，如果沒有音檔需要從YouTube上下載，可以使用yt-dlp來下載。記得選擇format的時候可以挑選音檔即可，可以加快下載時間。

使用

安裝以及使用上相當簡相當，但需要注意的是如果沒有GPU，速度上會慢上許多，此時就會建議使用Google Colab來執行。
文末會提供一個Colab來執行。

安裝

pip install -U openai-whisper 即可安裝
安裝完後，可以到Whisper查看要使用哪個模型。\
目前官方提供的模型有

tiny
tiny.en
base
base.en
small
small.en
medium
medium.en
large

en結尾的是針對英文加強模型，也是只能使用在英文上，使用較小的模型即可達到不錯的效果。

使用

transccribe


import whisper

model = whisper.load_model("large") # 選擇你的模型名稱
result = model.transcribe("path/to/your/file")

model.transcribe(name, verbose=verbose, word_timestamps=time_stamp, task=task)
在Transcribe底下，可以帶verbose, word_timestamps和task參數。
- verbose: 會顯示目前已經完成的逐字稿
- word_timestamps: 會顯示每個字的時間戳記
- task 可以帶入`translate`，把非英文的語音轉成英文，但這項功能會導致timestamp無法正確顯示

Colab

底下是簡易的Colab執行筆記本，選擇好需要翻譯的影片網址，然後一路執行即可。

Colab

Yt-dlp 存擋不再錯過

Posted on 2024-02-28 In Notes Word count in article: 1.5k Reading time ≈ 1 mins.

本文專案來源

簡介

這篇文將帶過如何快速使用Yt-dlp來下載Youtube上影片或是直播內容，避免閱讀繁瑣的說明書

安裝

不論你是任何作業系統，我都建議使用Python搭配pip作為環境使用。
本文將在MacOS底下操作，如有遇到任何問題，可以參照官方手冊。

創造你的環境，不論使用conde env或是virtualenv，確保使用Python3.8+

conda create --name yt-dlp python=3.11
接著pip install yt-dlp yt-dlp

完成安裝後，yt-dlp --version 確認當前版本。

Vtuber的定位——淺談、反思、我推文化

Posted on 2023-10-07 Edited on 2023-10-08 In Life Word count in article: 3.9k Reading time ≈ 4 mins.

tl;dr

前陣子，被一位學長問到，為什麼要看Vtuber而不看真人呢？
這真是個好問題！身為理組我們應當理性分析各種原因與利弊，我當下回答不出來，想了一下，我猜想是比起明星更沒距離感吧！

自媒體的興起

直播文化我最有印象的是在大約十年前，twitch還沒興起時，當時主流實況都在justin.tv，雜談，表演，唱歌等等都在上面，遊戲實況則會在twitch，當時中文圈最著名莫過於LNG，好多當時流行語都是從當中出來的，更別說往後的打lol有禮貌運動等等，在我高中時真的是無人不知無人不曉。
可惜過沒多久，justin.tv就被併入twitch底下，現在想起來，確實justin就有如沒有管制的場所，不時會有一些很色情奇怪的實況出現。

然而在日本，這種文化的流行就必須從niconico說起，也是在約莫10幾年前，niconico就已經是紅遍一方的平台，在我印象裡當時Youtube還沒有那麼多的受眾，當然niconico最大的問題在於演算法、雲端資源等等在當時都不夠充足，可以說是與justin差不多的混沌。

Hacktoberfest 2023 - from a junior engineer perspective

Posted on 2023-09-30 In Notes Word count in article: 1.3k Reading time ≈ 1 mins.

一個月前拿到後端工程師的職位，在準備Canonical的時候得知了Hacktoberfest，於是今年想要也參加這項活動! If you’re seeking for an English version, here is the article on Medium

TL;DR

不要往下看了！直接去官網點選參加，對開源社群貢獻出你最好的PR👊

Hacktoberfest

當我在準備Canonical面試的時候，發現到去衡量一位工程師的程度？或積極程度不單單是看contributions的圖，對於開源專案的PR,MR知道多少也是很重要，尤其是對於像是Canonical這種開源相關的公司。

The ocntributions diagram of my on GitHub

開源專案對於整個社群有著相當的重要性，試想我們在寫程式的時候，第一行是否都從import 一些常用的套件開始，但有想過這些寫好的Library從哪裡來呢？他們大部分都是開源專案在GitHub或GitLab上，任何人可以看到裡面的程式碼，並且做出改善，增強，修復錯誤，這些都是做出好的PR。

Tlog#2 天文碩士轉職後端工程師

Posted on 2023-09-20 Edited on 2023-09-24 In Life Word count in article: 1.3k Reading time ≈ 1 mins.

TL;DR

申請英國天文所失敗，結束研究助理後，很幸運的一個月內就找到一份工作，到現在也到職快一個月，這篇會分享在AI科技蓬勃發展的時代，我所看到找工作需要的能力👊

Previously on Tyler

距離前一篇Django + Docker -> Deployment with Nginx, Gunicorn and PostgreSQL也有兩個多月的時間，上一篇Django算是離開學術的~~分手文~~技術文👍，在接下來一個月內投了大概30份工作，回覆率在10%也就是大約3間有近到面試，有interview總共4間，而只有一間拿到offer，因為太想要離開家裡，所以一拿到offer就趕緊接受了😂

Django + Docker -> Deployment with Nginx, Gunicorn and PostgreSQL

Posted on 2023-07-03 In Notes Word count in article: 24k Reading time ≈ 22 mins.

前言

想像天文事件都是一瞬間發生的，像是Blackhole merger, Supernova, flare events and so on. 這些事件的紀錄都是很難能可貴的資料，若是要完整紀錄更是稀有，我們只能在接到通知後盡量去做follow-up observation。此時若有個系統可以接收並且立刻發送到各個天文台，那麼這些難能可貴的現象我們就可以進一步了解。

TOM就是為了處理這些目標與觀測的平台，藉由Python知名的Django框架來做處理。這篇文章目標涵蓋從寫HTML的模板開始，藉由Django架設測試用伺服器，接著利用Docker把整個打包起來放到伺服器上運行。

Hexo token update

Posted on 2023-04-02 Edited on 2023-07-11 In Notes Word count in article: 497 Reading time ≈ 1 mins.

在上一篇Github.io個人網站架設中提到在config裡面設定的部分，在Github對於權限更改，廢除使用username以及password的方式，而改使用token作為驗證方式。

在github裡面的settings，使用Personal token來產生一組金鑰，接著在config裡面改用環境變數帶入金鑰。
接著更改你的環境變數，如果是使用bash則在.bashrc裡新增export HEXO="TOKEN"

# Deployment
## Docs: https://hexo.io/docs/one-command-deployment
deploy:
  type: git
  repo: https://github.com/Tylerastro/Tylerastro.github.io
  branch: main
  github-token: $HEXO

然而我想提出的是如果是Apple用戶，很大機率使用Keychain的服務作為金鑰儲存，如果以上方法失敗，可以到Keychain手動更改github的密碼，挑選kind為internet的密碼做更改，就可以成功更新金鑰密碼了。

Tlog#1

Posted on 2023-04-02 In Life Word count in article: 1.3k Reading time ≈ 1 mins.

前言

看了一下距離上篇文已經超過半年的時間了😱，今天想要稍微記錄一下這段時間忙些什麼，以及為什麼文章停滯。
現在草稿裡面有10篇文章待產，但有7篇會直接死亡，剩下1篇會合併到這裡另外1篇技術文章關於Django整個架設網站過程會在寫完後發布。這篇文章大概是拖時間的元兇😅

What is Tlog?

人家有Vlog用影像記錄生活，用文字不就是Tlog😏
Tlog形式會像是雜談，聊聊近期發生的事情，算是一個抒發心情的管道ᶘ ᵒᴥᵒᶅ

Recap

從2022去年6月結束當兵後，一直到12月都在忙申請國外研究所的文件，邊做研究邊處理申請然後配著Hololive ^_-
大概是在10月左右，因長期居家工作沒什麼機會跟人講話，才會開始看Vtuber，需要有人的聲音的感覺。看來人還是群居的生物XD

在12月結束申請後，後面就是一路拼研究跟觀測網站架設，過年前後算是產量高峰，從壓力較大的申請跳轉到全力寫程式對我還是比較輕鬆的部分，這段期間把宿主星系的SED fitting跑完，也把網站大架構寫起來，雖然還是沒什麼人可以對話，不過對於看到成果還是有開心的部分。

致陪伴我青春的動畫 86 不存在的戰區

Posted on 2022-08-18 Edited on 2022-08-23 In Life Word count in article: 3.2k Reading time ≈ 3 mins.

前言

WFH邁入第三個月，由於在家裡時間變長許多，漫漫長夜變成了追劇夜晚，在每天工作之餘看看一些胃痛番來讓自己放鬆一下!?
總之SOP,CV等申請還在進行中，但看完的當下，這些情感我想要先記錄下來。

86 不存在的戰區

86總長度為23集，是我可以接受的長度範圍，由於沒看過原著，原作部分就會參考YT上講解，以免個人立場偏頗。
整體劇情節奏明快，日常中依然推著劇情，不會有無謂的鏡頭，從動畫上可以感受出原作應該是相當著重於文本的內容，因為在武器、交戰等動作場面上經費可以看得出來沒下重本🥲，戰鬥場面可以算是沒有重點，背景設定我也很難感受到邏輯，但如果撇開這些，單看主角群的心境表現，的確是一部好的作品。

雖然不像以往的作品，有那麼一幕是破防，將我打至潰堤，但從第一集到最後一集，在內心畫面的呈現上都是可以打動我的淚腺的。

Shell Script Basics

Posted on 2022-07-11 In Notes Word count in article: 5.2k Reading time ≈ 5 mins.

Shell 是什麼

一台電腦的組成到運行可以想像成有硬體組成(Hardware)，核心(Kernel)，以及殼層(Shell)。
那麼使用者所接觸到的就是殼層這部分，這一圈可能有CLI(command-line interface)或GUI(Graphical user interface)，就如同我們所使用的terminal或者任何圖形化介面等。

而Shell script就是我們透過殼層與內核溝通的語言，藉由殼層翻譯給內核，內核再去驅動我們硬體做出相對應指令。

那為什麼我們要了解這項語言呢？
主要是我們很多自動化動作可以藉由Shell script來達成，簡單的就是開機時，系統內的Shell初始電腦硬碟，開始調用CPU以及Memory輸出畫面到我們螢幕上。