AI开源
AI实验室
AI期刊
关于
更多...
小众AI
AI开源
AI实验室
AI期刊
关于
Ai应用
C++
Golang
Java
Javascript
Jupyter
Python
Rust
Typescript
内容检测
图像处理
文档处理
智能助手
智能搜索
模型工具
行业应用
视频处理
语言处理
辅助编程
音频处理
AI开源软件
Ai应用
C++
Golang
Java
Javascript
Jupyter
Python
Rust
Typescript
内容检测
图像处理
文档处理
智能助手
智能搜索
模型工具
行业应用
视频处理
语言处理
辅助编程
音频处理
AI开源软件
>
视频处理
Hallo - 音频驱动的肖像动画生成
一个音频驱动的视觉合成系统,可以根据输入的音频和图像生成肖像动画。它可以让静态的肖像图像,根据音频中的声音变化动起来,就像真人说话一样。
MoneyPrinterTurbo - 自动生成高清短视频
MoneyPrinterTurbo是一款基于AI大模型的开源软件,旨在通过一键操作帮助用户自动生成高清短视频。只需提供一个视频 主题 或 关键词 ,就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐,然后合成一个高清的短视频。
Moondream - 小型的视觉语言模型
Moondream开源项目是一个拥有 16 亿参数的视觉AI模型,它采用了 SigLIP、Phi-1.5 技术和 LLaVa 训练数据集,能够在任何平台运行。它致力于通过深度学习和计算机视觉技术实现“看图说话”的神奇功能。
screenpipe - 全天候录制屏幕的 AI 助手
ScreenPipe是一款开箱即用、可离线的桌面 AI 应用。它可以录制屏幕内容、捕获截图和音频,并将数据存储至本地数据库,结合 LLMs 的能力,实现自动记录、上下文感知的 AI 助手,支持中文 OCR、集成 Ollama 和 Llama 等功能。
ultralytics - 先进的对象检测和跟踪模型
Ultralytics YOLO11是一个前沿的、最先进的(SOTA)模型,建立在之前YOLO版本的成功基础上,并引入了新的特性和改进,以进一步提升性能和灵活性。YOLO11旨在实现快速、准确和易用,使其成为各种目标检测、跟踪、实例分割、图像分类和姿态估计任务的首选。
V-Express - 针对人像视频生成的开源软件
V-Express是腾讯AI Lab开发的一款针对人像视频生成的开源软件。它旨在通过条件性丢弃(Conditional Dropout)技术,实现渐进式训练,以改善使用单一图像生成人像视频时的控制信号平衡问题。
««
«
1
2
»
»»