小红书发布垂直领域多模态大模型DOTS-LMM,引领社交内容AI新范式
国内领先的社交平台小红书近日正式推出自研多模态大模型DOTS-LMM(Deep Optimization for Text-image Social Large Multi-modal Model),该模型专注于社交平台图文内容的理解与生成,在垂直领域展现出显著的技术优势。
技术突破:
DOTS-LMM采用创新的双塔架构设计,通过跨模态对比学习实现图文特征的深度对齐。模型基于Transformer架构,特别设计了社交场景适配器(Social Adapter),使其能够更好地理解小红书平台特有的"种草"内容和年轻化表达方式。在计算效率方面,模型引入动态token选择机制,推理速度较传统模型提升40%。
核心优势体现在:
-
社交语境理解:针对网络流行语、缩略词等非规范表达具备更强的鲁棒性
-
审美感知能力:建立了包含百万级标注数据的美学评估体系
-
文化适配性:特别优化了对东亚面孔、本土品牌等元素的识别准确率
实测数据显示:
-
在自建的小红书内容理解评测集上,图文匹配准确率达到94.7%
-
用户调研显示AI生成的内容推荐理由接受度提升28%
-
广告CTR(点击通过率)因模型优化提升了12.5%
商业化应用已全面铺开:
√ 内容生态:辅助创作者生成更优质的图文笔记
√ 电商转化:为商品提供智能化的场景化描述
√ 社区治理:日均识别违规内容超50万条
√ 用户体验:实现更精准的个性化内容分发
小红书CTO表示:"DOTS-LMM不是通用模型的简单微调,而是从底层架构开始就为社交内容量身打造。我们累计投入了10万张A100显卡时进行训练,构建了行业最大的社交图文数据集。"
据透露,小红书正在探索模型开放策略,计划分阶段向优质创作者和品牌商家提供AI能力支持。这一举措将重塑社交内容生产模式,也为行业提供了垂直领域大模型研发的新思路。