肉包 – 开源的AI手机自动化助手,豆包手机平替

AI工具集2小时前发布 商道网
55 0 0

肉包是什么

肉包(Roubao)是开源的AI手机自动化助手,作为字节跳动”豆包手机助手”的免费替代方案。肉包基于视觉语言模型(VLM),采用Kotlin原生开发,无需电脑或Root权限,支持通过Shizuku获取系统级控制能力。肉包核心采用”截图-AI分析-执行”循环架构,支持Delegation(委托AI应用)和GUI自动化两种模式,可完成点外卖、发消息、导航等任务。

肉包 – 开源的AI手机自动化助手,豆包手机平替

肉包的主要功能

  • 智能AI Agent:肉包能基于视觉语言模型看懂屏幕内容,通过自然语言指令操作手机,自动规划并执行复杂任务。
  • 精致UI设计:肉包采用精心设计的Material 3界面,支持深色浅色主题自适应,提供流畅动画效果和完整的中英文双语支持。
  • 高度可定制:肉包支持多种视觉语言模型,包括阿里云通义千问、OpenAI GPT-4V、Claude等,支持用户配置自定义API端点和本地模型。
  • 安全保护机制:肉包实现了API Key的AES-256-GCM加密存储,具备敏感页面自动检测停止机制,任务执行全程可视且可随时手动中断。
  • Root模式扩展:肉包支持Root模式扩展,当Shizuku以Root权限运行时可解锁更多系统级操作能力。

肉包的技术原理

  • 双层Agent架构:肉包的核心是双层Agent架构,受Claude Code启发分为Tools层和Skills层。Tools层封装原子能力如应用搜索、DeepLink跳转、剪贴板操作等基础功能;Skills层面向用户意图,将自然语言映射到具体任务,实现从”点外卖”到执行操作的全链路。
  • 循环式自动化流程:肉包采用截图-分析-执行的循环式自动化流程,通过Shizuku调用系统级命令完成屏幕捕获和模拟点击。当接收到用户指令时,SkillManager首先进行意图识别,高置信度任务直接通过DeepLink委托给专业AI应用处理,低置信度或复杂任务则进入标准Agent循环,由Manager规划、Executor决策、Reflector反思直至完成。
  • 原生Android实现:肉包用Kotlin重写MobileAgent框架,完全运行在Android设备本地,无需电脑中转。通过Shizuku获得ADB级别权限,实现截图、点击、滑动等操作的直接执行,避免传统Python方案需要连接电脑的繁琐流程。

肉包的项目地址

  • GitHub仓库:https://github.com/Turbo1123/roubao

肉包的应用场景

  • 日常任务自动化:肉包可帮用户点外卖、查天气、设闹钟、发消息等日常操作,只需说出需求即可自动完成,无需手动翻找应用。
  • 跨应用信息处理:肉包能自动截图识别内容,帮用户将最后一张照片发送到微博、把链接分享到微信、或在不同应用间复制粘贴信息。
  • 娱乐内容获取:肉包可自动打开音乐App播放每日推荐、在B站搜索并播放特定视频、或帮用户刷短视频、看热门内容。
  • 导航出行服务:肉包支持直接唤醒高德地图进行路线搜索、帮用户打车、或查找附近餐厅和商店的位置信息。
© 版权声明

相关文章