草稿:多智能體
多智能體系統(multi-agent system, MAS 或「自組織系統」)是一個由多個互動的智能代理組成的電腦化系統。多智能體系統能夠解決單一代理或單一系統難以或無法解決的問題。智能可能包括系統化、功能性、程序化的方法、演算法搜尋或強化學習等。
儘管有相當大的重疊,多智能體系統並不總是與智能體基礎模型(agent-based model, ABM)相同。智能體基礎模型的目標是尋找對智能體集體行為的解釋性見解,這些智能體遵循簡單的規則,而不一定需要是「智能的」,通常應用於自然系統中,而不是解決特定的實際或工程問題。智能體基礎模型的術語在科學領域中更常使用,而多智能體系統則更多用於工程和技術領域。多智能體系統研究適用的應用包括在線交易、災害應對、目標監控以及社會結構建模等。
概念
多智能體系統由智能體及其環境組成。通常,多智能體系統的研究指的是軟件智能體。然而,多智能體系統中的智能體同樣可以是機械人、人類或人類團隊。一個多智能體系統可能包含結合了人類和智能體的團隊。 智能體可以根據其複雜程度分為不同類型,主要類別包括:
- 被動智能體或「無目標的智能體」(例如在簡單模擬中作為障礙物、蘋果或鑰匙的角色)
- 具有簡單目標的主動智能體(如群體中的鳥類,或捕食模型中的狼與羊)
- 認知智能體(進行複雜計算的智能體)
智能體的環境可以分為以下幾種:
- 虛擬環境
- 離散環境
- 連續環境
智能體的環境也可以根據以下屬性進行分類:1. 可取得性(是否能夠獲得關於環境的完整信息)2. 確定性(某個行動是否會引發明確的效果)3. 動態性(在某一時刻有多少個體影響環境)4. 離散性(環境中可能的行動數量是否是有限的)5. 情節性(某些時期的智能體行動是否會影響其他時期)6. 維度性(空間特徵是否為環境的重要因素,智能體是否在決策時考慮空間)。智能體的行動通常通過適當的中介軟件進行協調。這種中介軟件為多智能體系統提供了一級設計抽象,並提供了管理資源訪問和智能體協調的方法。
特徵
多智能體系統中的智能體具有以下幾個重要特徵:
• 自主性:智能體至少是部分獨立的,具備自我意識和自主性
• 局部視角:沒有任何智能體擁有完整的全局視角,或者系統過於複雜,無法讓某個智能體利用這種知識
• 去中心化:沒有智能體被指定為控制者(否則系統會被有效地簡化為一個單體系統)
自組織與自引導
多智能體系統可以展現自組織、自引導以及其他控制模式和相關的複雜行為,即使其中所有智能體的策略都很簡單。當智能體能夠使用任何約定的語言在系統的通信協議約束下共享知識時,這種方法可能會促進共同的改進。示例語言包括知識查詢操作語言(Knowledge Query Manipulation Language, KQML)或智能體通信語言(Agent Communication Language, ACL)。
系統範式
許多多智能體系統在計算機模擬中實現,通過離散的「時間步驟(time steps)」來推進系統。多智能體系統的各個組件通常使用加權請求矩陣進行通信,例如:
• 速度 - 非常重要:最小值 = 45 mph
• 路徑長度 - 中等重要性:最大值 = 60,預期最大值 = 40
• 最大重量 - 不重要
• 合約優先級 - 普通
以及加權回應矩陣,例如:
• 速度:最低 50,但僅限於天氣晴朗時
• 路徑長度:晴天時為 25,雨天時為 46
• 合約優先級 - 普通 (注意:救護車將優先於此合約,您需要等待)
在多智能體系統中,挑戰-回應-合約的方案很常見,其中:
1.首先分發一個「誰可以?」的問題。
2.只有相關的組件會回應:「我可以,以這個價格。」
3.最終建立一份合約,通常通過幾次簡短的雙方通信步驟完成,同時考慮其他組件、演化中的「合約」以及組件演算法的約束集。
另一種多智能體系統常用的範式是「信息素」機制,其中組件為其他鄰近組件留下信息。這些信息素可能會隨着時間蒸發或濃縮,即其值可能減少或增加。
參考資料
- Yoav Shoham, Kevin Leyton-Brown. Multiagent Systems: Algorithmic, Game-Theoretic, and Logical Foundations. Cambridge University Press, 2009. http://www.masfoundations.org/
- ^ Hu, J.; Turgut, A.; Lennox, B.; Arvin, F., "Robust Formation Coordination of Robot Swarms with Nonlinear Dynamics and Unknown Disturbances: Design and Experiments" IEEE Transactions on Circuits and Systems II: Express Briefs, 2021.
- ^ Stefano V. Albrecht, Filippos Christianos, Lukas Schäfer. Multi-Agent Reinforcement Learning: Foundations and Modern Approaches. MIT Press, 2024. https://www.marl-book.com/
- ^ Li, Guohao (2023). "Camel: Communicative agents for "mind" exploration of large language model society"[1](PDF). Advances in Neural Information Processing Systems. 36: 51991–52008. arXiv:2303.17760. S2CID 257900712.
- ^ Niazi, Muaz; Hussain, Amir (2011). "Agent-based Computing from Multi-agent Systems to Agent-Based Models: A Visual Survey" (PDF). Scientometrics. 89 (2): 479–499. arXiv:1708.05872. doi:10.1007/s11192-011-0468-9. hdl:1893/3378. S2CID 17934527.
- ^ Rogers, Alex; David, E.; Schiff, J.; Jennings, N.R. (2007). "The Effects of Proxy Bidding and Minimum Bid Increments within eBay Auctions". ACM Transactions on the Web. 1 (2): 9–es. CiteSeerX 10.1.1.65.4539. doi:10.1145/1255438.1255441. S2CID 207163424. Archived from the original on April 2, 2010. Retrieved March 18, 2008.
- ^ Schurr, Nathan; Marecki, Janusz; Tambe, Milind; Scerri, Paul; Kasinadhuni, Nikhil; Lewis, J.P. (2005). "The Future of Disaster Response: Humans Working with Multiagent Teams using DEFACTO". Archived (PDF) from the original on June 3, 2013. Retrieved January 8, 2024.
- ^
- ^
- ^
- ^ Li, Guohao. CAMEL:Communicative Agents for “Mind” Exploration of Large Language Model Society (PDF). Advances in Neural Information Processing Systems.