MITは、いつの日か誰かがプログラムする事がなくても、インタラクティブロボットをトレーニングすることが簡単にできるようになると言います。MITの科学者達は、ロボットを自動化して、人間を観察して新しいタスクを学習できるようにしています。アイデアとしては、いつか家にある家庭用ロボットに、生活風景を見せて学習してもらい、今後、ロボットが人間のために雑用などをするということです。
MITには、ロボットが多くのルールを持つ複雑なタスクを学習できる新しいシステムがあります。テストの1つのタスクで、ディナーテーブルをセットするという設定があります。チームが開発したシステムは、「不確実な仕様の計画」と呼ばれます。 MITは、このシステムにより、ロボットが人間のようなスキルを持ち、最終目標に到達するための多くの曖昧で潜在的に矛盾する要件を比較検討できると述べています。
MITは、ロボットは常に、行うべきタスクの可能性のある仕様に関する「信念」に基づいて、実行する可能性が最も高いアクションを選択すると述べています。研究者は、8つのオブジェクトをさまざまな構成で、テーブルセッティングする方法についての情報とデータセットを組み合わせます。 8つのオブジェクトとは、マグカップ、グラス、スプーン、フォーク、ナイフ、ディナープレート、小さなプレート、ボウルです。
ロボットアームは、実際の世界と見たものに基づいたシミュレーションからの両方の特定の構成でテーブルセッティングする作業を行いました。このテストでは、アイテムが取り外されたり、積み上げられたり、隠されたりした場合でも、ロボットは可能な限り多くの配置順序を検討しなければいけません。
ロボットアームは、「数回の」実験では一度もミスをしませんでした。数万のシミュレートされたテスト実行で、ほんのわずかなミスがありました。具体的には、ロボットは20,000回のシミュレーションで6つのミスをしました。科学者は、ロボットの「信念」システムはロボットに報酬と罰を与えるために使用でき、線形時相論理と呼ばれるものの上に構築されていると言います。