视频处理 - 小众AI

AI开源软件 > 视频处理

Deep-Live-Cam 是开源的AI实时换脸工具，用户仅需一张图片即可在视频中实现实时人脸交换。支持 CPU、NVIDIA CUDA、Apple Silicon、Core ML 等多种硬件平台，确保视频处理的流畅性。

一个音频驱动的视觉合成系统，可以根据输入的音频和图像生成肖像动画。它可以让静态的肖像图像，根据音频中的声音变化动起来，就像真人说话一样。

MoneyPrinterTurbo是一款基于AI大模型的开源软件，旨在通过一键操作帮助用户自动生成高清短视频。只需提供一个视频主题或关键词，就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐，然后合成一个高清的短视频。

Moondream开源项目是一个拥有 16 亿参数的视觉AI模型，它采用了 SigLIP、Phi-1.5 技术和 LLaVa 训练数据集，能够在任何平台运行。它致力于通过深度学习和计算机视觉技术实现“看图说话”的神奇功能。

ScreenPipe是一款开箱即用、可离线的桌面 AI 应用。它可以录制屏幕内容、捕获截图和音频，并将数据存储至本地数据库，结合 LLMs 的能力，实现自动记录、上下文感知的 AI 助手，支持中文 OCR、集成 Ollama 和 Llama 等功能。

Ultralytics YOLO11是一个前沿的、最先进的（SOTA）模型，建立在之前YOLO版本的成功基础上，并引入了新的特性和改进，以进一步提升性能和灵活性。YOLO11旨在实现快速、准确和易用，使其成为各种目标检测、跟踪、实例分割、图像分类和姿态估计任务的首选。

V-Express是腾讯AI Lab开发的一款针对人像视频生成的开源软件。它旨在通过条件性丢弃（Conditional Dropout）技术，实现渐进式训练，以改善使用单一图像生成人像视频时的控制信号平衡问题。