应用中心 - AI应用商店

首页应用中心模型广场 GPU资源帮助中心新闻公告联系我们

登录立即注册注册

Stable DiffusionOllama文生视频ComfyUI语音克隆LoRA训练

AI绘图

Stable DiffusionComfyUI人像生成图像工具LoRA训练其他

AI对话

Ollama其他

AI视频

文生视频视频合成

AI语音

TTS语音合成语音克隆

AI工具

Agent开发

AniPortrait

音频驱动的肖像动画合成框架，能够根据音频和静态人脸图片生成逼真的动态视频。

RAGFlow

为各种规模的企业及个人提供一套精简的RAG工作流程，结合大语言模型（LLM）针对用户各类不同的复杂格式数据提供可靠的问答以及有理有据的引用。

Flowise

低代码工具，供开发人员构建定制的LLM编排流程和AI Agent。

FastGPT

开源 AI 知识库构建平台。提供了开箱即用的数据处理、模型调用、RAG 检索、可视化 AI 工作流编排等能力，帮助您轻松构建复杂的 AI 应用。

‌‌‌Dify

提供从 Agent 构建到 AI workflow 编排、RAG 检索、模型管理等能力，轻松构建和运营生成式 AI 原生应用。

Stable Video Diffusion

支持以图像或文本提示作为输入，输出长达4秒的平滑、多帧视频片段。

LivePortrait

将静态照片或图像转换为动态视频。它能够准确、实时地将驱动视频中的表情、姿态迁移到静态或动态人像视频上，生成极具表现力的视频结果‌。

SadTalker

SadTalker能够将一张静态的肖像图片和一段音频融合，通过AI生成一个逼真的说话头像视频，仿佛让一张照片变得“会说话”。

Paints-UNDO

基于AI的绘画过程生成工具，能够自动生成图像的绘画过程视频。

CogVideo

AI 驱动视频生成解决方案，其核心技术依托于前沿的深度学习算法和模型架构。

MockingBird

AI拟声应用，5秒内克隆您的声音并生成任意语音内容。

F5-TTS

支持跨语言语音克隆(比如用英语说话人的声音说中文)、语速控制、零样本语音生成(不需要针对新说话人重新训练)、多种语音类型合成、长文本语音生成等功能。

FishSpeech

文本转语音工具，它通过大量的数据训练，能够生成接近人类水平的语音。

CosyVoice

基于语音量化编码的语音生成大模型，能够深度融合文本理解和语音生成，实现自然流畅的语音生成体验。

GPT-SoVITS

即使没有直接的训练数据，模型仍能生成相似风格的语音。

oobabooga-webui

适用于大型语言模型的Gradio Web UI。

Ollama Open WebUI

用于在本地运行大型语言模型（LLM）的开源Web界面。本应用已对接Ollama。

Ollama

大语言模型服务工具，用于简化在本地运行大语言模型，降低使用大语言模型的门槛

InstantID

一张照片，无需训练，秒级个人写真生成。

PuLID

PuLID能够在单张参考图像的基础上，快速生成具有高度个性化特征的图像和视频。

FaceFusion

AI换脸软件，适用于图片和视频的换脸操作。它提供了简洁的用户界面，使得操作简单易懂，即使是初学者也能轻松上手。

SD-Trainer

Stable Diffusion进行微调训练的WebUI，上传少量图片，可以方便的训练出新的SD模型，生成期望的图片风格。

Fluxgym

专为FLUX Lora模型训练设计的工具，其最大亮点在于极低的硬件要求和简便的使用方法。

Omost

一句话即可AI绘画，自动生成关键词，通过简单文本描述生成逼真图像。

FaceChain

生成保留身份特征的人像，仅需一张照片和10几秒钟，就可以生成不同风格的个人形象。

PhotoMaker

AI 照片编辑和生成工具。无需训练 LoRA，只需上传几张人物照片，即可生成多种风格且逼真的人物图像。

IOPaint

图像修复工具，只需简单涂抹便可以编辑图片，从而实现图像抹除、对象替换等功能。

Fooocus

支持高质量文本到图像转换，简化操作

Stable Diffusion WebUI Forge

Stable Diffusion WebUI

一种基于深度学习的文本到图像生成模型

ComfyUI

ComfyUI是一款基于节点工作流稳定扩散算法的图形界面。