论文阅读：Making Virtual Pancakes — Acquiring and Analyzing Data of Everyday Manipulation Tasks through Interactive Physics-based Simulations

标题：Making Virtual Pancakes — Acquiring and Analyzing Data of Everyday Manipulation Tasks through Interactive Physics-based Simulations

作者：Lars Kunze1 , Andrei Haidu1 , and Michael Beetz2

下载链接：https://ai.uni-bremen.de/papers/kunze12virtualpancakes.pdf

0. 摘要

教机器人日常工作（例如通过指令制作薄煎饼）需要非专业人员可以直观地操作的界面。通过使用数据手套在虚拟环境中执行操纵任务，可以直接从模拟器访问和提取所演示动作的与任务相关的信息。我们将这些模拟的低层数据结构转换为有意义的一阶表示形式（称为时间轴），从而能够选择数据段并在抽象级别上对其进行分析。因此，所提出的系统是一种强大的工具，可用于获取操作动作的示例并对其进行分析，从而可以告知机器人如何执行任务。

1.介绍

在日常工作中，个人机器人助手应完成尚未预先编程的新颖任务。在[6]中，演示了机器人如何通过从Web提取自然语言的逐步描述并将其转换为定义明确的可执行计划来扩展其任务范围。例如，制作薄煎饼的说明如下：1）将薄煎饼混合物倒入锅中； 2）用刮铲翻转薄煎饼； 3）将薄煎饼放在盘子上。

这些说明具有足够的描述性，以供人类理解任务。但是，对于机器人来说，这些说明的规范性很差。即，机器人必须通过其他方式来推断这些动作的适当参数。通过观察执行任务的人员，机器人可以估计一些缺少的参数。例如，当执行倾倒动作时，机器人可以估计诸如容器的高度和角度之类的参数。同样，可以估计该动作的持续时间。可以从从Web或人工跟踪系统中检索到的教学视频中提取此类信息[2]。由于我们的目标是深入了解此类操纵动作的物理效果，因此我们提出了基于基于物理的模拟的虚拟操纵环境。可以使用数据手套和3D位置传感器来操纵此虚拟环境中的对象，其中传感器信息直接转换为模拟手模型的姿势和关节。由于我们对模拟的世界状态有全面的了解，因此我们能够提取与任务相关的对象的各种信息。这些信息包括，例如，对象的位置，方向，线速度和角速度以及其边界框。此外，在每个时间步骤中都会报告对象之间的接触。与基于视觉的系统相比，我们不必处理遮挡和其他典型问题，例如识别透明物体。我们已经设计和实现的虚拟操作框架可以通过记录模拟器的内部状态，用作获取与任务相关的信息的工具。然后将记录的模拟转换为基于间隔的一阶表示形式，称为时间轴，如[5]中所述。通过制定逻辑查询，我们可以从这些时间表中语义地提取与任务相关的信息。例如，我们可以要求将容器拿在手中时的一系列姿势。然后，可以在轨迹数据上应用其他方法，以针对各个方面分析操纵动作。