Step-GUI – 阶跃星辰推出的AI Agent系列模型 Step-GUI是什么 Step-GUI 是阶跃星辰推出的AI Agent系列模型,包含云侧模型 Step-GUI 和端侧模型 Step-GUI Edge(原名:Gelab-Zero)。云侧模型擅长复... AI工具集 1个月前870
SAM Audio – Meta开源的音频分割模型 SAM Audio是什么 SAM Audio是Meta开源的音频分割模型,能通过文本、视觉和时间片段等多模态提示,从复杂的音频混合中分离出特定的声音。核心技术是Perception Encoder A... AI工具集# SAM Audio 1个月前720
Gemini 3 Flash – 谷歌推出的最新AI模型,主打高速低成本 Gemini 3 Flash是什么 Gemini 3 Flash 是谷歌推出的高速、低成本的前沿智能模型。模型基于 Gemini 3 开发,性能显著提升,具备强大的推理能力和多模态理解能力。在多项基准... AI工具集# Gemini 1个月前590
Seed1.8 – 字节跳动推出的通用Agent模型 Seed1.8是什么 Seed1.8 是字节跳动推出的通用 Agent 大模型,具备强大的多模态能力,支持图文输入。模型集搜索、代码生成与 GUI 交互能力于一体,可在复杂工作流中高效完成任务。See... AI工具集 1个月前750
SHARP – 苹果开源的3D场景生成AI模型 SHARP是什么 SHARP 是苹果开源的 AI 模型,能在不到 1 秒内将单张 2D 照片转换为逼真的 3D 场景。模型通过 3D 高斯表示技术,用神经网络单次前馈传递,快速预测出场景的 3D 结构... AI工具集# SHARP 1个月前700
TRELLIS.2 – 微软开源的40亿参数3D生成模型 TRELLIS.2是什么 TRELLIS.2是微软开源的40亿参数3D生成模型,专为从单张图片高效生成高保真3D资产设计。核心创新在于采用O-Voxel稀疏体素架构,能处理复杂拓扑结构(如开放表面、非... AI工具集 1个月前620
Laper – AI剧本创作工具,能实时预测台词与动作 Laper是什么 Laper 是 AI 剧本创作工具,能为编剧提供精细化的创作平台。Laper支持多种剧本类型,如电影长片、短片和短视频故事,具备好莱坞标准格式的智能补全功能,可实时预测台词与动作描写... AI工具集# Laper 1个月前540
VTP – MiniMax视频团队开源的视觉生成模型预训练框架 VTP是什么 VTP(Visual Tokenizer Pre-training)是MiniMax视频团队开源的视觉生成模型预训练框架。框架聚焦优化视觉tokenizer,通过融合对比学习、自监督学习... AI工具集# VTP 1个月前590
GPT-5.2-Codex – OpenAI推出的智能体编程模型 GPT-5.2-Codex是什么 GPT-5.2-Codex 是 OpenAI 推出的智能体编程模型,专为复杂软件工程和防御性网络安全设计。模型是 GPT-5.2 的升级版,提升了指令遵循、长语境理解... AI工具集 1个月前570
MegaLLM – AI模型API聚合平台,一个API访问多个主流模型 MegaLLM是什么 MegaLLM 是为开发者提供统一API接口的人工智能平台,可快速接入70多个主流大语言模型(LLMs),如GPT-5、Claude、Gemini、Llama等。通过一个API密... AI工具集# MegaLLM 1个月前520