小众AI

AI-Media2Doc
AI-Media2Doc - 视频一键转图文的 AI 工具
AI 视频图文创作助手是一款Web工具, 基于AI大模型, 将视频和音频转化为各种风格的文档, 无需登录注册, 前后端本地部署,以极低的成本体验 AI 视频/音频转风格文档服务。一键将视频和音频转化为小红书/公众号/知识笔记/思维导图/视频字幕等各种风格的文档。
  代码仓

AI 视频图文创作助手是一款Web工具, 基于AI大模型, 将视频和音频转化为各种风格的文档, 无需登录注册, 前后端本地部署,以极低的成本体验 AI 视频/音频转风格文档服务。一键将视频和音频转化为小红书/公众号/知识笔记/思维导图/视频字幕等各种风格的文档。

主要功能

  • ✅ 完全开源:MIT 协议授权,支持本地部署。
  • 🔒 隐私保护:无需登录注册,任务记录保存在本地
  • 💻 前端处理:采用 ffmpeg wasm 技术,无需本地安装 ffmpeg
  • 🎯 多种风格支持:支持小红书/公众号/知识笔记/思维导图/内容总结等多种文档风格支持。
  • 🤖 AI 对话:支持针对视频内容进行 AI 二次问答。
  • 🎬 支持字幕导出: 结果一键导出为字幕文件。
  • 🐳 一键部署:支持 Docker 一键部署。

安装和使用

📦 docker 本地一键部署

1️⃣:镜像构建:

$ make docker-image

2️⃣:请根据 后端部署指引 / 配置项说明 完善根目录下的 variables.env 文件。

3️⃣:修改前端的 evn.development 中的 VITE_API_BASE_URL 为 http://0.0.0.0:8080

4️⃣:运行项目

$ make run

后端本地部署

后端依赖于字节跳动火山引擎高代码 SDK Arkitect 高代码 SDK Arkitect。 在启动后端服务之前, 需要先安装好 Arkitect 的依赖, 并且申请字节 Tos 对象存储服务 以及 对应大模型的 API 调用权限

注意 ⚠️: 请至少保证你本地的 Python 版本为 3.9 及以上, 否则可能会出现依赖无法安装, 项目启动失败等问题。

    1. 安装依赖
pip install -r requirements.txt
    1. 配置环境变量
export ENDPOINT_ID=xxxx
export ARK_API_KEY=xxxx
export TOS_ACCESS_KEY=xxxx
export TOS_SECRET_KEY=xxxx
export TOS_ENDPOINT=xxxx
export TOS_REGION=xxxx
export TOS_BUCKET=xxxx
export AUC_APP_ID=xxxx
export AUC_ACCESS_TOKEN=xxxx
    1. 启动服务
python main.py

前端本地部署

    1. 安装 Node.js

要求 node 版本为 20+, 我本地的 node 版本为 22.0.0

    1. 安装依赖
npm install
    1. 启动服务
npm run dev
  • 浏览器访问

打开浏览器访问 http://localhost:5173/ 即可。


更多...


lobe-chat
Dify 是一个易用的 LLMOps 平台,旨在让更多人可以创建可持续运营的原生 AI 应用。Dify 提供多种类型应用的可视化编排,应用可开箱即用,也能以“后端即服务”的 API 提供服务。
NextChat
NextChat,全称为ChatGPTNextWeb,是一款开源免费的私有ChatGPT网页应用部署工具 。它适合所有人搭建Web聊天机器人,能够支持GPT3、GPT4、GeminiPro等人工智能大模型,已在Github上获得了显著的关注,这表明其在开发者和用户群体中相当受欢迎,并且该项目已被收购,这无疑预示着NextChat巨大的商业价值潜力 。
codex
OpenAI 开源的命令行智能编码助手,旨在通过自然语言交互提升开发效率。它依赖 OpenAI 的 API 服务,仅需配置 OpenAI API Key 即可零门槛上手,支持代码生成、文件操作、版本控制和多模态(截图输入)等功能,适用于个人开发者、团队协作以及 CI/CD 流程。