过去一年中,“豆包手机”的推出,以及2026年年初爆火的“OpenClaw”,让我们看到了助手型智能体的一些早期探索,令人振奋。前者代表了设备级智能体的尝试:它将智能体能力深度嵌入操作系统,通过模拟人类操作以调取各类App,为用户完成任务。后者则是一种始终在线的解决方案,能够主动观察与执行任务,并通过本地部署获取丰富的个性化数据和软件控制权,初步体现了个人助手型Agent的一些核心特征。
The compliance burden
,这一点在heLLoword翻译官方下载中也有详细论述
UPDATE: Solutions can be read here
团队自研的超少样本具身操作大模型“FAM系列”用“二次预训练”和“热力图对齐”,让模型在执行任务时更聚焦局部关键点。比如,搬运料箱时优先关注把手,而不是依赖堆大量不同颜色、新旧程度的料箱图片去“记住外观”。