動画からの文字起こしの忘備録

mac zsh
    #file1からfile2に変換する
    ffmpeg -i file1 file2
  
Google Colaboratoryに移動し、whisperのインストール

Google Colaboratory
  
    !pip install git+https://github.com/openai/whisper.git
import whisper

インストール完了後、ファイルのアップロードを行う。
サイドバーのファイルアイコンを押し、contentを右クリックしてアップロードを選択してファイルをアップロードする。

Google Colaboratory

  
  model = whisper.load_model("large")
     result = model.transcribe("アップロードfile.拡張子")
   print(result["text"])





モードは、以下から選択出来ます。

個人的には、mediumが一番好き。


コメント

このブログの人気の投稿

FFmpegで画像のピクセルサイズを指定して、変換する方法 忘備録

画像生成AI Stable Diffusionを使って画像出力する。その1