LLaDA 2.0 – 蚂蚁集团开源的离散扩散大语言模型 LLaDA 2.0是什么 LLaDA 2.0 是蚂蚁集团开源的离散扩散大语言模型(dLLM),包含 16B(mini)和 100B(flash)两个版本。打破了扩散模型难以扩展的瓶颈,首次将参数规模扩... AI工具集# LLaDA 2个月前640
Claude-Mem – 开源Claude Code记忆插件,提供长期记忆 Claude-Mem是什么 Claude-Mem 是专为 Claude Code 设计的开源插件,能为 AI 提供长期记忆能力。Claude-Mem通过自动存储和管理会话中的关键信息,包括工具调用、对... AI工具集# Claude 2个月前800
Gemini TTS – 谷歌推出的AI文本转语音模型 Gemini TTS是什么 Gemini TTS 是谷歌推出的先进AI文字转语音技术,最新版本为 Gemini 2.5 Flash 和 Pro 模型。支持多说话人、多语言(24种以上)合成,可生成自然... AI工具集# Gemini TTS 2个月前720
通义百聆 – 阿里通义推出的企业级语音基座大模型 通义百聆是什么 通义百聆是阿里通义实验室推出的企业级语音基座大模型,整合 Fun-ASR 语音识别和 Fun-CosyVoice 语音合成两大模型,专为复杂环境下的语音应用设计,通过 Context ... AI工具集# 通义百聆 2个月前610
OpenScreen – 开源的屏幕录制工具,Screen Studio的平替 OpenScreen是什么 OpenScreen 是开源免费的屏幕录制工具,是 Screen Studio 的平替。工具支持 Mac 和 Windows 系统,具备手动缩放、自定义缩放深度、裁剪视频... AI工具集# OpenScreen 2个月前810
LensGo AI – AI内容创作平台,一键生成风格化图像与视频 LensGo AI是什么 LensGo AI 是创新的 AI 创作平台,支持将简单的文字提示、照片或原始视频素材转化为风格化的图像和视频内容。平台通过强大的多模式创作引擎,让用户在浏览器中轻松实现从文... AI工具集# LensGo AI 2个月前700
Mulan – AI视频创作平台,Workflow方式实现视频生成 Mulan是什么 Mulan是创新的 AI 视频创作平台,为用户提供高效、便捷的视频生成体验。借助画布 Workflow 实现视频的批量生成,通过简单替换素材,可快速迭代出风格相似的视频,极大地提升了... AI工具集# Mulan 2个月前750
Genstory – 免费AI故事生成平台,能生成完整的数字绘本 Genstory是什么 Genstory 是基于 Gemini Storybook 技术的免费 AI 故事生成平台,能将用户的简单想法瞬间转化为精美的绘本故事。用户只需输入故事提示,如“勇敢的小女孩拯... AI工具集# Genstory 2个月前730
Paper2Slides – 港大开源论文转为专业幻灯片的AI工具 Paper2Slides是什么 Paper2Slides 是香港大学开源的AI工具,能快速将学术论文、报告和文档转换为专业幻灯片或海报。采用 RAG(检索增强生成)机制,直接从文档本身提取内容,确保生... AI工具集# Paper2Slides 2个月前620
Wan-Move – 阿里联合清华等开源的运动可控视频生成框架 Wan-Move是什么 Wan-Move 是阿里巴巴通义实验室等机构开源的运动可控视频生成框架,通过潜在轨迹引导实现高质量的视频运动控制。核心亮点在于无需对现有图像到视频模型进行架构更改,可实现细粒度... AI工具集 2个月前700