中文
发现令人惊叹的AI工具和应用
升级版语音合成系统,多语言、实时风格切换和高效推理
6GB低显存快速生成质量稳定的1分钟视频
功能强大、高度模块化的 Stable Diffusion 图形用户界面和后端系统
让文字秒变真实播客,支持多语言、多方言与情感化语音生成
零样本语音克隆逼真,多语言支持,语音参数可控,架构简洁高效
让数字人张嘴说话的智能唇同步神器
自动完成视频翻译、字幕生成与配音
支持普通话、英语、粤语,可高自然度合成语音并实现零样本声音克隆
支持 600+ 语言、语音设计与语音克隆,合成自然且速度极快
零样本语音克隆、自然语言控制音色及多种方言,低延迟的真人类听感体验
支持 23 种语言,跨语言克隆与精细情感控制
超轻量、极速音乐大模型,本地 4GB 显存可运行
工业级零样本语音合成系统,发音可控、效果好
超长篇幅、多角色高拟真对话(如播客、有声书)的文本转语音
升级大模型架构,音质、歌曲完整性、生成速度全面拉满,支持超长时长、多语种创作
支持文本、视频生成高品质逼真音效(仅可用英文提示词),适配各类音视频创作场景
超逼真的零样本声音克隆,精准操控 11 种情感、4 种人类语气词(如笑声/换气)以及 14 种方言
高保真(48kHz)零样本声音克隆与超强的情感呼吸拟真表达
5秒声音,即刻克隆——GPT-SoVITS实现多语言AI语音合成。
能把歌词秒变歌曲,按关键词生成各种风格音乐,还能给清唱加伴奏,玩音乐超简单!
生成多说话人对话的语音合成系统,支持声音克隆和多语言
支持 52 种语言方言,具备极强的歌词识别与上下文理解能力
支持33种语言,兼顾端侧轻量化与专业高精度的开源快思考多语言翻译模型
轻量化音频大模型、多语言情感表达及流式实时生成,真人级自然语音
通过几秒音频克隆声音并生成自然语音
多语言语音识别、情感与音频事件检测,高效精准
支持多语言、实时/离线语音识别,易用高效
实时数字人,高保真、长时稳定的百帧级音画同步生成
开源翻译模型,33 种语言 + 5 种方言互译,精准灵活
零样本歌声合成项目,支持多语言、双模式控制,能零微调生成未知歌手高保真歌声并实现灵活的歌声编辑
一款 AI 客户端应用,可支持多种平台
实时肖像动画技术,将静态肖像转化为支持视频 / 音频驱动的动态三维模型
生成高质量古典音乐,支持按时期、作曲家和乐器生成
基于单张图片生成带深度信息的 3D 全景及场景模型
一站式本地智能助手,支持多平台运行与手机远程操控,能自动化完成办公、创作、信息处理等各类日常任务
基于 OpenClaw 开发的桌面图形化工具,一键安装
实现零件级 3D 物体生成,支持双体积打包处理与多 GPU 推理
一个带有可视化界面的大模型运行工具。
支持 17 种语言,方言与低音量识别精准
高保真歌曲生成、精准歌词识别与结构化创作控制
超轻量TTS工具,CPU即可运行,支持多语种朗读与零样本音色克隆
精准擦掉视频中的物体,生成自然画面
本地视频硬字幕与图片文本水印去除工具,支持无损分辨率处理
超高音色相似度的零样本语音克隆,直接在波形隐空间生成高保真语音
一款集成 RAG 管道、支持多模态交互与工作流编排的企业级开源 AI 助手。
给无声音视频配上贴合、真实的环境声音。
在本地轻松运行、自定义并管理各种大型语言模型
工作流自动化平台,支持无代码 / 代码双模式搭建
安全优先、更可靠高效的工作流自动化工具,支持可视化拖拽操作
跨平台、多模型、带 Agent 与知识库的可扩展 AI 聊天机器人
收录2000+现成n8n自动化工作流的智能搜索库
轻量高效文档解析工具,可将PDF/图片/电子书精准转为Markdown/JSON
零样本声音克隆,情感表达能力
零样本语音克隆与高表现力的情绪、风格和语气编辑
让本地语音转文本和翻译变得简单
支持零样本语音克隆、情感表达与流式推理
从单张图片像素级精准生成带PBR纹理的高保真3D模型
拖拽剪辑的轻量视频编辑器,支持丰富的特效和4K视频导出
可轻松查看音视频文件的技术信息和标签数据的工具
支持多语言互译,可离线使用且数据隐私可控
深度联动微信/钉钉/飞书等聊天软件进行多智能体协同办公的个人 AI 助理
轻量易上手的多端个人AI助手,支持多渠道对接与自定义技能
全自动生成含文案、素材、配音、字幕、配乐的高清短视频