GlodChain

帅气的我简直无法用语言描述!

VoxCPM1.5 – 面壁智能开源的端到端语音合成模型

VoxCPM1.5是什么 VoxCPM 1.5 是面壁智能推出的先进的端到端文本到语音(TTS)模型,专注于上下文感知的语音生成和逼真的声音克隆。模型通过端到端扩散自回归架构直接从文本生成连续语音,支...
3周前
500

Qwen3-Omni-Flash – 阿里通义推出的全模态大模型

Qwen3-Omni-Flash是什么 Qwen3-Omni-Flash(Qwen3-Omni-Flash-2025-12-01) 是阿里 Qwen 团队推出的全模态大模型。模型能无缝处理文本、图像...
3周前
680

PosterCopilot – 南大联合LibLib.ai等推出的海报设计模型

PosterCopilot是什么 PosterCopilot 是南京大学联合 LibLib.ai 和中科院自动化所共同推出的专业级海报设计大模型。模型通过独特的三阶段训练策略,赋予模型强大的布局推理和...
3周前
760

Dynal.AI – 专注于LinkedIn内容创作的AI Agent助手

Dynal.AI是什么 Dynal.AI 是专注于LinkedIn内容创作的智能工具,帮助用户高效生成和管理高质量的LinkedIn帖子。通过AI技术,将文字稿、网站链接、视频、PDF文件等素材快速转...
3周前
690

GPT-5.2 – OpenAI最新推出的通用AI模型系列

GPT-5.2是什么 GPT-5.2 是 OpenAI 最新发布的先进人工智能模型系列,专为专业工作和复杂任务设计。模型提供三种版本:GPT-5.2 Instant 适用快速处理日常任务,如信息查询和...
3周前
620

Gemini Deep Research – 谷歌推出的深度研究Agent

Gemini Deep Research是什么 Gemini Deep Research 是谷歌推出的深度研究智能体,基于 Gemini 3 Pro 构建,专为长周期的内容收集与综合任务优化。智能体通...
3周前
720

GWM-1 – Runway推出的首个通用世界模型

GWM-1是什么 GWM-1 是 Runway 推出的首个通用世界模型,基于 Gen-4.5 构建,采用自回归架构逐帧预测视频内容,可实时交互。模型包含三个变体:GWM Worlds 用于实时环境模拟...
3周前
560

DeepSearchQA – 谷歌开源的AI研究Agent测试基准

DeepSearchQA是什么 DeepSearchQA是谷歌开源的新基准测试工具,用于评估Agent在网络研究任务中的全面性和多步查询能力。工具包含17个领域共900个手工设计的“因果链”任务,每一...
3周前
770

Kaleido – 智谱AI开源的多主体视频生成框架

Kaleido是什么 Kaleido 是智谱AI开源的多主体视频生成框架,能解决多主体视频生成中的主体一致性与背景解耦问题。框架通过创新的数据构建管线和 R-RoPE(Reference Rotary...
3周前
890

SCAIL – 智谱AI开源的影视级角色动画生成框架

SCAIL是什么 SCAIL(Studio-grade Character Animation via In-context Learning)是智谱AI推出的面向影视级标准的角色动画生成框架。框架通...
3周前
600