VoxCPM2 – OpenBMB开源的语音合成模型
VoxCPM2是什么 VoxCPM2是OpenBMB开源的2B参数语音合成模型。模型采用无分词器扩散自回归架构,支持30种语言及中文方言,输出48kHz录音室级音质。VoxCPM2首创Voice De...
updream – B 站推出的 AI 视频创作助手
updream是什么 updream是B站官方推出的专业级AI视频创作助手,专为资深UP主打造。核心功能包括AI智能Agent、个性化技能库与自由创作画布,具备长期深度记忆能力,可持续学习创作者风格并...
GLM-5V-Turbo – 智谱AI推出的原生多模态Coding基座模型
GLM-5V-Turbo是什么 GLM-5V-Turbo是智谱AI推出的原生多模态Coding基座模型,专为视觉编程和AI Agent设计。模型从预训练阶段深度融合视觉与文本能力,支持理解图片、视频...
Pada – AI角色聊天平台,支持多模态互动体验
Pada是什么 Pada 是原问小白App 升级后的 AI 角色聊天平台。定位「AI 角色聊天与共创宇宙」,提供丰富的虚拟角色、沉浸式对话及多模态互动体验,主打与 AI 角色的情感陪伴与故事共创。平台...
Qwen3.6-Plus – 阿里通义推出的 Agent 编程模型
Qwen3.6-Plus是什么 Qwen3.6-Plus是阿里通义实验室推出的 Agent 编程模型,主打编码智能体能力跃升。模型默认支持100万token超长上下文,在SWE-bench、Termi...
Gemma 4 – 谷歌开源的多模态大模型系列
Gemma 4是什么 Gemma 4是Google开源的多模态大模型系列,基于Gemini 3架构。模型包含E2B/E4B(手机/树莓派可跑)、26B MoE(仅激活3.8B参数)和31B Dense...
InternSVG – 上海AI Lab推出的统一 SVG 建模套件
InternSVG是什么 InternSVG是上海人工智能实验室等推出的面向统一SVG建模的“数据-评测-模型”综合套件,包含三大组件:超1600万样本的SAgoge数据集、标准化SArena评测基准...
JoyAI-Image-Edit – 京东开源的指令引导图像编辑模型
JoyAI-Image-Edit是什么 JoyAI-Image-Edit是京东开源的指令引导图像编辑模型,基于JoyAI-Image多模态基础模型构建。模型支持通过自然语言指令实现精确可控的空间操作与...
Wan2.7-Video – 阿里通义推出的 AI 视频创作模型
Wan2.7-Video是什么 Wan2.7-Video是阿里通义实验室推出的AI视频创作大模型,支持文本、图像、视频、音频全模态输入。模型突破传统生成限制,实现”像修图一样修视频”的局部编辑、台词动...
MAI-Transcribe-1 – 微软推出的语音转文字模型
MAI-Transcribe-1是什么 MAI-Transcribe-1是微软Azure AI Foundry推出的企业级语音转文字模型,支持中英日法等25种语言,模型在FLEURS基准测试中全面领先...