AI工具集

LLaDA 2.0 – 蚂蚁集团开源的离散扩散大语言模型

LLaDA 2.0是什么 LLaDA 2.0 是蚂蚁集团开源的离散扩散大语言模型（dLLM），包含 16B（mini）和 100B（flash）两个版本。打破了扩散模型难以扩展的瓶颈，首次将参数规模扩...

AI工具集 # LLaDA

2个月前

640

Claude-Mem – 开源Claude Code记忆插件，提供长期记忆

Claude-Mem是什么 Claude-Mem 是专为 Claude Code 设计的开源插件，能为 AI 提供长期记忆能力。Claude-Mem通过自动存储和管理会话中的关键信息，包括工具调用、对...

AI工具集 # Claude

2个月前

800

Gemini TTS – 谷歌推出的AI文本转语音模型

Gemini TTS是什么 Gemini TTS 是谷歌推出的先进AI文字转语音技术，最新版本为 Gemini 2.5 Flash 和 Pro 模型。支持多说话人、多语言（24种以上）合成，可生成自然...

AI工具集 # Gemini TTS

2个月前

720

通义百聆 – 阿里通义推出的企业级语音基座大模型

通义百聆是什么通义百聆是阿里通义实验室推出的企业级语音基座大模型，整合 Fun-ASR 语音识别和 Fun-CosyVoice 语音合成两大模型，专为复杂环境下的语音应用设计，通过 Context ...

AI工具集 # 通义百聆

2个月前

610

OpenScreen – 开源的屏幕录制工具，Screen Studio的平替

OpenScreen是什么 OpenScreen 是开源免费的屏幕录制工具，是 Screen Studio 的平替。工具支持 Mac 和 Windows 系统，具备手动缩放、自定义缩放深度、裁剪视频...

AI工具集 # OpenScreen

2个月前

810

LensGo AI – AI内容创作平台，一键生成风格化图像与视频

LensGo AI是什么 LensGo AI 是创新的 AI 创作平台，支持将简单的文字提示、照片或原始视频素材转化为风格化的图像和视频内容。平台通过强大的多模式创作引擎，让用户在浏览器中轻松实现从文...

AI工具集 # LensGo AI

2个月前

700

Mulan – AI视频创作平台，Workflow方式实现视频生成

Mulan是什么 Mulan是创新的 AI 视频创作平台，为用户提供高效、便捷的视频生成体验。借助画布 Workflow 实现视频的批量生成，通过简单替换素材，可快速迭代出风格相似的视频，极大地提升了...

AI工具集 # Mulan

2个月前

750

Genstory – 免费AI故事生成平台，能生成完整的数字绘本

Genstory是什么 Genstory 是基于 Gemini Storybook 技术的免费 AI 故事生成平台，能将用户的简单想法瞬间转化为精美的绘本故事。用户只需输入故事提示，如“勇敢的小女孩拯...

AI工具集 # Genstory

2个月前

730

Paper2Slides – 港大开源论文转为专业幻灯片的AI工具

Paper2Slides是什么 Paper2Slides 是香港大学开源的AI工具，能快速将学术论文、报告和文档转换为专业幻灯片或海报。采用 RAG（检索增强生成）机制，直接从文档本身提取内容，确保生...

AI工具集 # Paper2Slides

2个月前

620

Wan-Move – 阿里联合清华等开源的运动可控视频生成框架

Wan-Move是什么 Wan-Move 是阿里巴巴通义实验室等机构开源的运动可控视频生成框架，通过潜在轨迹引导实现高质量的视频运动控制。核心亮点在于无需对现有图像到视频模型进行架构更改，可实现细粒度...

AI工具集

2个月前

700

标签云