PromptFill – 专为AI绘画设计的开源结构化提示词生成工具
PromptFill是什么 PromptFill是专为AI绘画设计的结构化提示词生成工具,通过可视化填空交互帮助用户快速构建复杂Prompt。解决了传统提示词记忆过载、语法混乱和复用性差的问题,支持S...
Fun-Audio-Chat – 阿里通义开源的端到端语音交互模型
Fun-Audio-Chat是什么 Fun-Audio-Chat是阿里云通义百聆团队开源的新一代端到端语音交互模型,具备语音理解、情感感知和任务执行能力。模型采用双分辨率设计,通过5Hz和25Hz帧率...
MedASR – 谷歌开源的医疗语音识别模型
MedASR是什么 MedASR 是 Google 推出的专注于医学领域的语音识别模型,基于 Conformer 架构,拥有 105M 参数。模型通过大量医学语音数据(约 5000 小时)进行预训练...
TurboDiffusion – 清华大学等推出的视频生成加速框架
TurboDiffusion是什么 TurboDiffusion 是清华大学、生数科技和加州大学伯克利分校联合推出的视频生成加速框架。框架通过 SageAttention、SLA(稀疏线性注意力)和 ...
Seed Prover 1.5 – 字节跳动推出的新一代数学推理模型
Seed Prover 1.5是什么 Seed Prover 1.5 是字节跳动 Seed 团队推出的新一代形式化数学推理模型。模型采用创新的 Agentic Prover 架构,通过大规模强化学习...
opcode – 为Claude Code打造的开源桌面图形界面工具
opcode是什么 opcode 是为Claude Code 打造的开源桌面图形界面工具,支持将复杂的命令行操作转化为直观的可视化体验,极大提升用户体验。通过 opcode,用户能更便捷地管理项目和会...
Replymer – AI产品营销工具,用自然真实的方式推广产品
Replymer是什么 Replymer 是通过真实人类撰写的回复推广产品的工具。工具能帮助品牌在 Reddit、X(Twitter)和 LinkedIn 等社交平台上找到合适的对话场景,用自然、真实...
QuantiPhy – 李飞飞团队推出的VLM物理推理量化评估基准
QuantiPhy是什么 QuantiPhy 是斯坦福大学李飞飞团队推出的首个量化评估视觉 – 语言模型(VLM)物理推理能力的基准。QuantiPhy 通过 3300 多个视频 – 文本实例,要求模...
Aident AI – AI自动化编辑工具,自然语言构建工作流
Aident AI是什么 Aident AI 是AI自动化工具编辑工具,支持通过自然语言描述构建自动化流程,无需复杂编程或图形化操作。用户用日常语言表达需求,Aident AI 能快速生成可运行的自动...
Stickerbox – AI创意贴纸打印机,语音交互生成贴纸
Stickerbox是什么 Stickerbox是专为儿童设计的AI驱动创意贴纸打印机,将孩子的想象力瞬间转化为可触摸的实体艺术品。采用语音交互方式,孩子只需开口描述想法(如“一只骑滑板的恐龙”),设...