投稿

Upscaylを使って、画像のアップスケーリングを行う

イメージ
先日、猫の写真を撮ったんですけど.... トリミングしてしまったため、こんな感じに、画像がかなり荒くなっているのがわかると思います。 そこで、画像のアップスケーリングを用いてどれくらい綺麗にすることができるのか試してみようと思います。 とりあえずUpscaylのインストールを行います。 対応しているプラットフォームは mac linux windows なので、PCがあればいいですね。 以下のURLからダウンロードします。 https://www.upscayl.org   今回は、インストール方法を省きます。 わからない場合は、コメントで対応します。 アプリを起動すると、以下のような画面が出てきます。 使い方は、簡単で 画面左にあるステップを踏んでいけばいいです。 step1 select image  ここで、元の画像を選択します。 step2 select upscaling type ここで画像処理のモードを選択します。 step3 set output folder アップスケーリングした画像を出力する場所を選択します。 step4 upscayl アップスケーリングを実行します。 元の画像 REAL-ESRGAN ULTRASHARP 元の写真と、アップスケーリングした写真を比較するとかなり鮮明になっていると思います。 REAL-ESRGANとULTRASHARPを比較してみると、REAL-ESRGANの方が自然な感じがあるので猫などの動物や風景などはREAL-ESRGANでアップスケーリングした方が良さそうです。 備考 アップスケーリングの強さを通常の4から16に強化することもできます

ChatGPTとMermaidを使って、フロー図などを書く方法

イメージ
主に、以下のリンクを使います。 Mermaidページ ChatGPT Mermaidでエラーが出た時のために、基本的なMermaid構文を紹介しているブログを紹介しておきます。(このサイト主が書いたものではないです。) Mermaid記法に入門しよう フロー図などを作成するための情報を書き出します。 //例 ユーザーネームがMekannの時は処理1を行い、ユーザーネームがMekann以外のときは処理2を行う。 ChatGPTを用いて、 以下の文章をカナ数字を英数字に直し、Mermaid記法(flowchart LR)で記述してください。 ユーザーネームがMekannの時は処理1を行い、ユーザーネームがMekann以外のときは処理2を行う。 //出力結果 flowchart LR Start((開始)) -- > Input(UserName) cond1{UserNameがMekannか} -- >| Yes | Proc1[処理1] cond1 -- >| No | Proc2[処理2] Proc1 -- > End((終了)) Proc2 -- > End Input -- > cond1 Mermaidに移動して、 画面左側の/codeを選択して、ChatGPTの出力結果を貼り付けます。 作成した図は、Actionsから好きなファイル形式でダウンロードできます。

画像生成AI Stable Diffusionを使って画像出力する。その3 自分好みの女の子を作成しよう

今回で、3回目になります。ただの風景画像を生成しても面白みがないので自分の癖にくる女の子の画像を自分で作っていきましょう。 具体的な画像出力方法は、以前書いた その1 を参考にしてください。 また、今回は基本的なコードの解説は行わない予定です。 その2 を参考にしてください。 今回は、実際に出力に関わるところのコードのみを取り扱おうと思います。 いきなりですが、実際に使用したコードを載せます。 prompt = """ (((girl))), ((sky)), (short hair), (gray hair), arrange one's hair, illustration, Night view, Marble floor, documents, files, ((((illustration)))), ((((illustration)))), ((((illustration)))), ((((illustration)))), ((((illustration)))), ((((illustration)))), ((((illustration)))), ((((illustration)))), ((((illustration)))), ((((illustration)))), ((((illustration)))), ((((illustration)))), lens flare, film Reflection, colorful refraction, light diffusion, cute, chair, interview, Unreal Engine, Realistic,photorealisti

画像生成AI Stable Diffusionを使って画像出力する。その2  コード解説編

画像生成AI Stable Diffusionを使って画像出力する。その1 で、使用したコードの解説です。まだ、上の記事を見ていない場合は先に見てください。 from diffusers import StableDiffusionPipeline , DPMSolverMultistepScheduler import torch from diffusers import StableDiffusionPipeline # 利用したいAIモデル # Stable Diffusionにはさまざまな派生モデルがあります model_id = "gsdf/Counterfeit-V2.5" # パイプラインの作成 pipeline = StableDiffusionPipeline.from_pretrained ( model_id , torch_dtype=torch.float16 ) # GPUを使うように変更 pipeline = pipeline.to ( "cuda" ) このコードは、Stable Diffusionと呼ばれる派生モデルを使用して、画像の生成や修復などのタスクを行うためのパイプラインを作成するためのものです。Stable Diffusionは、画像生成や修復において高品質な結果を提供するためのモデルです。 上記のコードでは、diffusersというモジュールから StableDiffusionPipelineとDPMSolverMultistepSchedulerというクラスをインポートしています。 torchモジュールもインポートされています。 import torchについて 画像生成のときの計算の精度をfloat32からfloat16に落とすことで、画像生成の速度を高速にすることができる。公式も使用を推奨している方法で、実際に生成した画像を見比べたときに大きな差がないです。 使い方 パイプラインの作成に torch_dtype=torch.float16 を追加する。 次に、利用したいAIモデルの識別子をmodel_idに指定します。この例では、"gsdf/Counterfeit-V2.5"というモデルを使用しますが、実際には他の派生モデルを選択するこ

Stable Diffusionで出力したイラスト集

イメージ
 

画像生成AI Stable Diffusionを使って画像出力する。その1

イメージ
今回の目標:取り敢えず画像を出力できるようになる。 Google Colab にアクセスする。 新規ノートを作成する。 右上の「接続」をクリック。接続されたら、 左上の「編集」内の「ノートブックの設定」を選択 ハードウェア アクセレータの項目をGPUに設定し「T4」に設定。保存を押す。 #有料ではあるが、 より高性能なGPUも選択できる。 すると、接続が一旦切れるので、再接続するのを確認する。 再生マークが実行、その隣にコードを打ち込む。     !nvidia-smi  実行して、GPUが使用されるようになっているか確認する。実行出来たら◯ 右上の「+コード」をクリックして新しい欄を追加。以下を記述。     !pip install --upgrade diffusers accelerate transformers 実行。 右上の「+コード」をクリックして新しい欄を追加。以下を記述。 from diffusers import StableDiffusionPipeline , DPMSolverMultistepScheduler import torch from diffusers import StableDiffusionPipeline # 利用したいAIモデル # Stable Diffusionにはさまざまな派生モデルがあります model_id = "gsdf/Counterfeit-V2.5" # パイプラインの作成 pipeline = StableDiffusionPipeline.from_pretrained ( model_id , torch_dtype=torch.float16 ) # GPUを使うように変更 pipeline = pipeline.to ( "cuda" ) 実行。 右上の「+コード」をクリックして新しい欄を追加。以下を記述。 prompt = """Unreal Engine, Realistic,photorealistic, 4k,8k,16k, elaborate, hyper quality, villa, glo