GlodChain | 第5页

VoxCPM2 – OpenBMB开源的语音合成模型

VoxCPM2是什么 VoxCPM2是OpenBMB开源的2B参数语音合成模型。模型采用无分词器扩散自回归架构，支持30种语言及中文方言，输出48kHz录音室级音质。VoxCPM2首创Voice De...

AI工具集

3周前

580

updream – B 站推出的 AI 视频创作助手

updream是什么 updream是B站官方推出的专业级AI视频创作助手，专为资深UP主打造。核心功能包括AI智能Agent、个性化技能库与自由创作画布，具备长期深度记忆能力，可持续学习创作者风格并...

AI工具集

3周前

670

GLM-5V-Turbo – 智谱AI推出的原生多模态Coding基座模型

GLM-5V-Turbo是什么 GLM-5V-Turbo是智谱AI推出的原生多模态Coding基座模型，专为视觉编程和AI Agent设计。模型从预训练阶段深度融合视觉与文本能力，支持理解图片、视频...

AI工具集

3周前

630

Pada – AI角色聊天平台，支持多模态互动体验

Pada是什么 Pada 是原问小白App 升级后的 AI 角色聊天平台。定位「AI 角色聊天与共创宇宙」，提供丰富的虚拟角色、沉浸式对话及多模态互动体验，主打与 AI 角色的情感陪伴与故事共创。平台...

AI工具集

3周前

680

Qwen3.6-Plus – 阿里通义推出的 Agent 编程模型

Qwen3.6-Plus是什么 Qwen3.6-Plus是阿里通义实验室推出的 Agent 编程模型，主打编码智能体能力跃升。模型默认支持100万token超长上下文，在SWE-bench、Termi...

AI工具集

3周前

580

Gemma 4 – 谷歌开源的多模态大模型系列

Gemma 4是什么 Gemma 4是Google开源的多模态大模型系列，基于Gemini 3架构。模型包含E2B/E4B（手机/树莓派可跑）、26B MoE（仅激活3.8B参数）和31B Dense...

AI工具集 # Gemma

3周前

690

InternSVG – 上海AI Lab推出的统一 SVG 建模套件

InternSVG是什么 InternSVG是上海人工智能实验室等推出的面向统一SVG建模的“数据-评测-模型”综合套件，包含三大组件：超1600万样本的SAgoge数据集、标准化SArena评测基准...

AI工具集 # InternSVG

3周前

720

JoyAI-Image-Edit – 京东开源的指令引导图像编辑模型

JoyAI-Image-Edit是什么 JoyAI-Image-Edit是京东开源的指令引导图像编辑模型，基于JoyAI-Image多模态基础模型构建。模型支持通过自然语言指令实现精确可控的空间操作与...

AI工具集

3周前

820

Wan2.7-Video – 阿里通义推出的 AI 视频创作模型

Wan2.7-Video是什么 Wan2.7-Video是阿里通义实验室推出的AI视频创作大模型，支持文本、图像、视频、音频全模态输入。模型突破传统生成限制，实现”像修图一样修视频”的局部编辑、台词动...

AI工具集

3周前

670

MAI-Transcribe-1 – 微软推出的语音转文字模型

MAI-Transcribe-1是什么 MAI-Transcribe-1是微软Azure AI Foundry推出的企业级语音转文字模型，支持中英日法等25种语言，模型在FLEURS基准测试中全面领先...

AI工具集

3周前

690