機械人學習
機械人學習(英語:Robot learning)是機械人學和機器學習的交叉研究領域[1]。較之其他機器學習算法的應用領域,機械人系統具有訓練成本高、包括傳感器在內的硬件限制、與外界進行物理交互、交互環境持續動態變化等難點,因而對機械人學習提出了特定的要求[2][3]。
目前,對於機械人學習算法的涵蓋範圍,各研究組織沒有統一界定,有的認為機械人學習旨在設計算法使得各類機械人本體實現「學習」[2],有的則認為將各類機器學習算法集成於機械人上都算作機械人學習[4][3]。同此隨着機器學習領域的快速發展,機械人學習也不斷出現新的研究方向[4]。
研究方向
編輯對於機械人學習,IEEE機械人和自動控制協會下屬的機械人學習技術委員會總結的研究方向為[1]:
- 學習機械人本體、機械人任務或機械人環境的模型
- 學習下至傳感器、電機等硬件,上至抽象任務的層次表示
- 使用模仿學習(imitation learning)或強化學習的方法來學習機械人的任務決策或控制策略
- 將學習算法與機械人本體的控制架構結合
- 使用統計推斷方法分析多模態傳感器信息
- 對機械人的時空信息進行表徵學習
- 發展型機械人和基於進化算法的機械人學習
自2017年起,Sergey Levine(加州伯克利)、肯·戈德堡(加州伯克利)、Vincent Vanhoucke(谷歌大腦)等一眾高校和研究所學者開始組織機械人學習會議(英語:Conference on Robot Learning),其中第一屆的徵稿主題範圍包括[5][6]:
參考文獻
編輯- ^ 1.0 1.1 Robot Learning - Scope. IEEE Robotics and Automation Society. [2023-03-08]. (原始內容存檔於2023-03-21).
- ^ 2.0 2.1 Buhmann, M. D.; Melville, Prem; Sindhwani, Vikas; Quadrianto, Novi; Buntine, Wray L.; Torgo, Luís; Zhang, Xinhua; Stone, Peter; Struyf, Jan; Blockeel, Hendrik; Driessens, Kurt; Miikkulainen, Risto; Wiewiora, Eric; Peters, Jan; Tedrake, Russ; Roy, Nicholas; Morimoto, Jun; Flach, Peter A.; Fürnkranz, Johannes. Robot Learning. Encyclopedia of Machine Learning. 2011: 865–869. doi:10.1007/978-0-387-30164-8_732.
- ^ 3.0 3.1 A Summary of the First Conference on Robot Learning. Google AI Blog. 2017-12-13 [2023-03-08]. (原始內容存檔於2023-03-08).
- ^ 4.0 4.1 Recent Technical Innovations In Robot Learning. IEEE RAS. [2023-03-08]. (原始內容存檔於2023-03-08).
- ^ CoRL2017 - Conference on Robot Learning 2017. CoRL Conferences. [2023-03-08]. (原始內容存檔於2023-03-08).
- ^ CoRL 2017 : Conference on Robot Learning. wikicfp. [2023-03-08]. (原始內容存檔於2023-03-08).
外部連結
編輯- IEEE RAS Technical Committee on Robot Learning (official IEEE website) (頁面存檔備份,存於互聯網檔案館)
- IEEE RAS Technical Committee on Robot Learning (TC members website) (頁面存檔備份,存於互聯網檔案館)
- Robot Learning at the Max Planck Institute for Intelligent Systems and the Technical University Darmstadt (頁面存檔備份,存於互聯網檔案館)
- Robot Learning at the Computational Learning and Motor Control lab (頁面存檔備份,存於互聯網檔案館)
- Humanoid Robot Learning at the Advanced Telecommunication Research Center (ATR) (英文) (日語)
- Learning Algorithms and Systems Laboratory at EPFL (LASA) (頁面存檔備份,存於互聯網檔案館)
- Robot Learning (頁面存檔備份,存於互聯網檔案館) at the Cognitive Robotics Lab (頁面存檔備份,存於互聯網檔案館) of Juergen Schmidhuber at IDSIA and Technical University of Munich
- The Humanoid Project: Peter Nordin, Chalmers University of Technology
- Inria and Ensta ParisTech FLOWERS team, France (頁面存檔備份,存於互聯網檔案館): Autonomous lifelong learning in developmental robotics
- CITEC at University of Bielefeld, Germany (頁面存檔備份,存於互聯網檔案館)
- Asada Laboratory, Department of Adaptive Machine Systems, Graduate School of Engineering, Osaka University, Japan
- The Laboratory for Perceptual Robotics (頁面存檔備份,存於互聯網檔案館), University of Massachusetts Amherst Amherst, USA
- Centre for Robotics and Neural Systems, Plymouth University (頁面存檔備份,存於互聯網檔案館) Plymouth, United Kingdom
- Robot Learning Lab (頁面存檔備份,存於互聯網檔案館) at Carnegie Mellon University
- Project Learning Humanoid Robots (頁面存檔備份,存於互聯網檔案館) at University of Bonn
- Skilligent Robot Learning and Behavior Coordination System (commercial product)
- Robot Learning class at Cornell University
- Robot Learning and Interaction Lab at Italian Institute of Technology
- Reinforcement learning for robotics at Delft University of Technology