GlodChain

帅气的我简直无法用语言描述!

VoxCPM2 – OpenBMB开源的语音合成模型

VoxCPM2是什么 VoxCPM2是OpenBMB开源的2B参数语音合成模型。模型采用无分词器扩散自回归架构,支持30种语言及中文方言,输出48kHz录音室级音质。VoxCPM2首创Voice De...
3周前
580

updream – B 站推出的 AI 视频创作助手

updream是什么 updream是B站官方推出的专业级AI视频创作助手,专为资深UP主打造。核心功能包括AI智能Agent、个性化技能库与自由创作画布,具备长期深度记忆能力,可持续学习创作者风格并...
3周前
670

GLM-5V-Turbo – 智谱AI推出的原生多模态Coding基座模型

GLM-5V-Turbo是什么 GLM-5V-Turbo是智谱AI推出的原生多模态Coding基座模型,专为视觉编程和AI Agent设计。模型从预训练阶段深度融合视觉与文本能力,支持理解图片、视频...
3周前
630

Pada – AI角色聊天平台,支持多模态互动体验

Pada是什么 Pada 是原问小白App 升级后的 AI 角色聊天平台。定位「AI 角色聊天与共创宇宙」,提供丰富的虚拟角色、沉浸式对话及多模态互动体验,主打与 AI 角色的情感陪伴与故事共创。平台...
3周前
680

Qwen3.6-Plus – 阿里通义推出的 Agent 编程模型

Qwen3.6-Plus是什么 Qwen3.6-Plus是阿里通义实验室推出的 Agent 编程模型,主打编码智能体能力跃升。模型默认支持100万token超长上下文,在SWE-bench、Termi...
3周前
580

Gemma 4 – 谷歌开源的多模态大模型系列

Gemma 4是什么 Gemma 4是Google开源的多模态大模型系列,基于Gemini 3架构。模型包含E2B/E4B(手机/树莓派可跑)、26B MoE(仅激活3.8B参数)和31B Dense...
3周前
690

InternSVG – 上海AI Lab推出的统一 SVG 建模套件

InternSVG是什么 InternSVG是上海人工智能实验室等推出的面向统一SVG建模的“数据-评测-模型”综合套件,包含三大组件:超1600万样本的SAgoge数据集、标准化SArena评测基准...
3周前
720

JoyAI-Image-Edit – 京东开源的指令引导图像编辑模型

JoyAI-Image-Edit是什么 JoyAI-Image-Edit是京东开源的指令引导图像编辑模型,基于JoyAI-Image多模态基础模型构建。模型支持通过自然语言指令实现精确可控的空间操作与...
3周前
820

Wan2.7-Video – 阿里通义推出的 AI 视频创作模型

Wan2.7-Video是什么 Wan2.7-Video是阿里通义实验室推出的AI视频创作大模型,支持文本、图像、视频、音频全模态输入。模型突破传统生成限制,实现”像修图一样修视频”的局部编辑、台词动...
3周前
670

MAI-Transcribe-1 – 微软推出的语音转文字模型

MAI-Transcribe-1是什么 MAI-Transcribe-1是微软Azure AI Foundry推出的企业级语音转文字模型,支持中英日法等25种语言,模型在FLEURS基准测试中全面领先...
3周前
690