LeRobot社区数据集被定位为机器人学领域的“ImageNet”,旨在通过开放和多样化的数据解决机器人泛化能力的问题。当前机器人数据集主要来自学术实验室,在受控环境下收集,缺乏真实世界的多样性,这限制了视觉-语言-动作(VLA)模型的泛化表现。泛化被视为一个数据问题,而非仅模型属性,需要从数据中抽象出更广泛的模式。社区贡献的数据集通过汇集不同环境、任务和机器人形态的数据,帮助模型学习如何解释场景、理解目标并跨上下文适应技能。构建这样的数据集面临挑战,包括数据收集和整理的复杂性,但通过社区努力和最佳实践,可以实现更全面的数据覆盖。