Paper2Slides – 港大开源论文转为专业幻灯片的AI工具
Paper2Slides是什么 Paper2Slides 是香港大学开源的AI工具,能快速将学术论文、报告和文档转换为专业幻灯片或海报。采用 RAG(检索增强生成)机制,直接从文档本身提取内容,确保生...
Wan-Move – 阿里联合清华等开源的运动可控视频生成框架
Wan-Move是什么 Wan-Move 是阿里巴巴通义实验室等机构开源的运动可控视频生成框架,通过潜在轨迹引导实现高质量的视频运动控制。核心亮点在于无需对现有图像到视频模型进行架构更改,可实现细粒度...
Documentation.AI – AI文档平台,产品变更自动更新文档
Documentation.AI是什么 Documentation.AI 是智能文档平台,专注于创建、更新和优化产品文档而设计。平台通过 AI 助手能实时监测产品变更、用户反馈等,自动更新文档内容,确...
UnityVideo – 快手可灵联合港科大开源的视频生成框架
UnityVideo是什么 UnityVideo 是香港科技大学联合快手可灵团队、清华大学等推出的新型多模态、多任务视频生成框架,能通过整合多种视觉模态(如分割、骨架、深度、光流等)和训练范式,提升视...
LightX2V – 商汤开源的实时视频生成推理框架
LightX2V是什么 LightX2V 是商汤开源的行业首个能实现实时视频生成的推理框架。框架支持多种视频生成任务,如文本到视频(T2V)和图像到视频(I2V),集成多种先进视频生成技术。通过模型优...
Nemotron 3 – 英伟达推出的最新开源AI模型系列
Nemotron 3是什么 Nemotron 3 是英伟达推出的新型开源模型系列,包括 Nano、Super 和 Ultra 三种尺寸。模型采用突破性的混合专家混合(MoE)架构,专为构建高效、准确的...
Disco – Google Labs推出的实验性AI浏览器
Disco是什么 Disco 是 Google 推出的实验性AI浏览器。Disco 核心功能是 GenTabs,用 Gemini 3 模型将用户打开的标签页变成定制化的交互式应用。例如,输入“计划日本...
Banana Slides – 开源AI PPT生成工具,能自然语言修改
Banana Slides是什么 Banana Slides 是开源的 AI 演示文稿生成工具,基于 nano banana pro 模型开发。以极简设计和强大的 AI 功能为亮点,帮助用户快速创建高...
万相2.6 – 阿里通义推出的新一代视频生成系列模型
万相2.6是什么 万相2.6 是阿里通义推出的面向专业影视制作和图像创作的先进视频生成系列模型。模型支持角色扮演功能,可让用户通过上传视频和输入提示词,快速生成具有电影级运镜和叙事的短片。同时,模型具...
Seedance 1.5 Pro – 字节推出的音画同步多模态视频模型
Seedance 1.5 Pro是什么 Seedance 1.5 Pro 是字节跳动 Seed 团队推出的原生音画同步的多模态视频生成模型。模型能根据文本提示生成高质量的视频内容,支持多样人声及音效...