ブログ
-
動画生成編-01. Stable Video Diffusionで画像を動画化
Stability AIはあの有名なStable Diffusionを世に送り出した話題のAI企業が今度は動画生成AIを世に送り出しました。 Stable Video Diffusionをブラウザから操作できるwebuiを作ってくれた方がGitに設定も載せてくれているので、早速img2videoを試しました... -
画像生成編-02. Kritaで雑な落書きから画像生成
画像生成はプロンプトを用いる方法や、Controlnetという手法で特定のポーズを指定して生成するのが主でした。ところが新しいAIツールが誕生してきています。 オープンソースのグラフィックツールkritaにStableDiffusionのプラグインを開発した人が現れまし... -
画像生成編-01. LCMで高速画像生成
画像生成に高速化の波が来ています。 通常の生成に比べ格段に処理が早いようです。これは試さなければ、、、 ※以前の記事でpinokioを使用してLCMのインストールは実施しましたが、UIが無いようなものだったのでちゃんと使えておらず。。。 Stable Diffusio... -
GPTs編-01・オリジナルチャットAIを作る
chatGPTがアップデートしました。 今回は自分のオリジナルチャットを作れるようになったと。 感想としてはNonプログラマーである自分がお手軽にこれをできるようになるとは革命だなと感じています。 GPTsのオリジナルのチャットという部分がわかりにくいの... -
AIツール導入編-01・pinokioでお手軽AIツール導入
pinokioをご存知ですか? 嘘をついて鼻が長くなっちゃう彼のことではなく、各種AIツールをお手軽に導入できるツールが出てきたみたいです。 これの何が面白いってTOP画面のわりと見えるところに思いっきりモザイクかかったピ◯キオが出てくるところです。そ... -
音声認識編-02・Whisper.cppを使ってMacで文字起こし
/ ジャーン \ 普段はWindowsで作業しがちなのですが、出先で使う用にMacも持っています。うちのWindows機はデスクトップなので性能はいいのですがどこでもは使えないのがネックです。。。 また、打ち合わせをしたりするときにはマイクもスピーカーも備え... -
音声認識編-01・Whisperで文字起こし
会議の時とかに議事録を取らなければいけないこと無いですか? あとから見返すために非常に有用なのですが、議事録を取っていると会議の内容がぜんぜん頭に入ってこないし、ちょっと遅れてしまうと訳わかんなくなってその後取る気が失せちゃうんですよね。... -
フォトグラメトリー編-04・3Dモデル生成の軽量化検証
前回は3Dの生成を力技で突破しましたが、生成の際にほぼ18時間もかかってしまいました。ちょっと普通に使うには重すぎるし、3D gaussian splattingの利点である高速に生成できるという部分が潰れてしまっています。実行時にあまり考えずに生成をしてしまっ... -
フォトグラメトリー編-03・3D Gaussian Splattingをちゃんと作る
3D Gaussian SplattingをJetson AGX Orin上で動作させることができました。 次はいよいよちゃんとしたものを作っていこうと思います。 前回は画像数枚からデータを取り出して作ったため、ちょっと動かすだけでガビガビになってしまいました。なので今度は... -
フォトグラメトリー編-02・3D Gaussian Splattingの環境構築
前回colmapというソフトを動かせるようになりました。今回はそのcolmapを活用して画像から3Dモデルの生成を行う "3D Gaussian Splatting for Real-Time Radiance Field Rendering" というソフトを試していきたいと思います。 いくつか参考にさせて頂いたペ...