- analysis
- animation
- audio
- generative
- meeting
- motion
- object_detection
- searchsystem
- semantic_segmentation
- vision3d
- Analysis
- ptlflow
- opticalflowを代表とした画像内の動きを推論できるAIモデルのNotebook
- face detection
- ptlflow
- Animation
- anime_rad_nerf
- 顔の映像と音声を合成する.アニメ映像でできるように改変
- RAD_NeRF
- 顔の映像と音声を合成する。3Dの推論を入れてるので精度が高い
- anime_rad_nerf
- Audio
- audiolm
- 音楽を生成できるやつ
- DeforumStableDiffusion
- 音楽生成が可能(BGMより)、動画との組み合わせも可能
- Denoise
- 雑音除去の性能が高いやつ
- riffusion
- 音楽生成が可能(BGMより)、fine-tuningコードあり
- valle
- 誰かの声真似ができる
- audiolm
- Generative
- img2prompt
- 画像からその画像の意味を抽出可能
- stable diffusion v2 finetune
- stable diffusion v2のdreambooth finetuningのやつ
- stable diffusion image inpaint
- stable diffusionのinpaintingのdreambooth finetuningのやつ
- stable diffusion v1.5 inpaint
- stable diffusion v2 inpaint
- img2prompt
- Meeting
- meeting recognition
- whisper + pyannoteで話者識別、書き起こし、音声類似度判定で、誰が喋ったかまで可能
- meeting recognition
- Motion
- alphapose3d
- 3d 姿勢推定ライブラリの実行
- motiondiffusion
- textからアクションを生成可能(ToDo: unityで使えるように連携記事)
- motion diffusion unity
- text2unityのためのipynb
- alphapose3d
- ObjectDetection
- visionTransformer
- vision transformerで物体検出、自分用にfine-tuningする手順
- cutler
- 教師なしでマスク検出が可能、detectron2には大きく依存だが、ここのdetectionをfine-tuningすれば自分用にカスタマイズ可能かも
- visionTransformer
- SearchSystem
- SemeanticSegmentation
- unetdeeplab
- unet + deeplabv3でsemantic segmentationを自分用でfinetuningする手順
- unetdeeplab
- Vision3d
- App