登录立即注册注册
AI绘图
Stable DiffusionComfyUI人像生成图像工具LoRA训练其他
AI对话
Ollama其他
AI视频
文生视频视频合成
AI语音
TTS语音合成语音克隆
AI工具
Agent开发
AniPortrait
音频驱动的肖像动画合成框架,能够根据音频和静态人脸图片生成逼真的动态视频。
RAGFlow
为各种规模的企业及个人提供一套精简的RAG工作流程,结合大语言模型(LLM)针对用户各类不同的复杂格式数据提供可靠的问答以及有理有据的引用。
Flowise
低代码工具,供开发人员构建定制的LLM编排流程和AI Agent。
FastGPT
开源 AI 知识库构建平台。提供了开箱即用的数据处理、模型调用、RAG 检索、可视化 AI 工作流编排等能力,帮助您轻松构建复杂的 AI 应用。
‌‌‌Dify
提供从 Agent 构建到 AI workflow 编排、RAG 检索、模型管理等能力,轻松构建和运营生成式 AI 原生应用。
Stable Video Diffusion
支持以图像或文本提示作为输入,输出长达4秒的平滑、多帧视频片段。
LivePortrait
将静态照片或图像转换为动态视频。它能够准确、实时地将驱动视频中的表情、姿态迁移到静态或动态人像视频上,生成极具表现力的视频结果‌。
SadTalker
SadTalker能够将一张静态的肖像图片和一段音频融合,通过AI生成一个逼真的说话头像视频,仿佛让一张照片变得“会说话”。
Paints-UNDO
基于AI的绘画过程生成工具,能够自动生成图像的绘画过程视频。
CogVideo
AI 驱动视频生成解决方案,其核心技术依托于前沿的深度学习算法和模型架构。
MockingBird
AI拟声应用,5秒内克隆您的声音并生成任意语音内容。
F5-TTS
支持跨语言语音克隆(比如用英语说话人的声音说中文)、语速控制、零样本语音生成(不需要针对新说话人重新训练)、多种语音类型合成、长文本语音生成等功能。
FishSpeech
文本转语音工具,它通过大量的数据训练,能够生成接近人类水平的语音。
CosyVoice
基于语音量化编码的语音生成大模型,能够深度融合文本理解和语音生成,实现自然流畅的语音生成体验。
GPT-SoVITS
即使没有直接的训练数据,模型仍能生成相似风格的语音。
oobabooga-webui
适用于大型语言模型的Gradio Web UI。
Ollama Open WebUI
用于在本地运行大型语言模型(LLM)的开源Web界面。本应用已对接Ollama。
Ollama
大语言模型服务工具,用于简化在本地运行大语言模型,降低使用大语言模型的门槛
InstantID
一张照片,无需训练,秒级个人写真生成。
PuLID
PuLID能够在单张参考图像的基础上,快速生成具有高度个性化特征的图像和视频。
FaceFusion
AI换脸软件,适用于图片和视频的换脸操作。它提供了简洁的用户界面,使得操作简单易懂,即使是初学者也能轻松上手。
SD-Trainer
Stable Diffusion进行微调训练的WebUI,上传少量图片,可以方便的训练出新的SD模型,生成期望的图片风格。
Fluxgym
专为FLUX Lora模型训练设计的工具,其最大亮点在于极低的硬件要求和简便的使用方法。
Omost
一句话即可AI绘画,自动生成关键词,通过简单文本描述生成逼真图像。
FaceChain
生成保留身份特征的人像,仅需一张照片和10几秒钟,就可以生成不同风格的个人形象。
PhotoMaker
AI 照片编辑和生成工具。无需训练 LoRA,只需上传几张人物照片,即可生成多种风格且逼真的人物图像。
IOPaint
图像修复工具,只需简单涂抹便可以编辑图片,从而实现图像抹除、对象替换等功能。
Fooocus
支持高质量文本到图像转换,简化操作
Stable Diffusion WebUI Forge
Stable Diffusion WebUI
一种基于深度学习的文本到图像生成模型
ComfyUI
ComfyUI是一款基于节点工作流稳定扩散算法的图形界面。