先日、arXivにプレプリントをアップしました。 概要の日本語訳をこちらに掲載します。
複雑な非線形性を近似できるニューラルネットワークは、非線形動的システムのデータ駆動制御において広範囲に応用されています。 しかし、動力学が未知のシステムの高速オンライン同定と制御は依然として中心的な課題です。 本論文では、エコーステートネットワーク(ESN)とモデル予測経路積分(MPPI)制御を統合した新手法を提案し、これらの課題に取り組みます。 提案するReservoir Predictive Path Integral(RPPI)制御は、ESNによる非線形動力学の高速学習を可能にし、学習した非線形性を並列化されたMPPI制御計算で直接活用します。 このフレームワークはUncertainty-aware RPPI(URPPI)にさらに拡張され、ESNの不確実性を活用して探索と活用のバランスが自動調整されます。 Duffing振動子とquadruple-tankシステムの制御実験により、URPPIが制御性能を向上させ、従来の二次計画法ベースのモデル予測制御手法と比較して制御コストを最大60%削減することが実証されました。
ご興味ある方は、こちらのリンクからアクセスしていただければと思います。