4月19日晚,六合彩結果
與上海自主智能無人系統科學中心聯合開展的智·信講堂-抗“疫”特別系列講座線上開講。本次講堂邀請到了六合彩結果
雷金龍研究員作“不確定信息下的多智能體決策”主題報告,由六合彩結果
副院長張皓教授主持。

雷金龍研究員分別從多智能體決策的背景、模型、勢博弈的異步算法以及變尺度采樣的分布式算法等方面展開報告。報告中,雷金龍研究員首先介紹了多智能體決策的背景和常見的決策優化模型及其對應的案例。介紹了納什均衡的相關概念和基本假設及變分不等式問題與納什均衡問題之間的等價關系。接著詳細介紹了同步梯度響應、最佳響應算法、近似最佳響應算法,設計了針對隨機變分不等式問題的求解算法。然后對于不確定信息下多智能體的納什均衡問題,利用勢博弈的方法提出異步近似最佳響應方案進行求解,在證明算法漸近收斂性的同時將算法拓展到加權勢博弈情況。最后針對智能體僅能獲取非完美局部反饋信息,介紹基于變尺度采樣和采樣梯度估計的分布式算法并給出仿真驗證和性能分析。雷金龍研究員豐富精彩的報告為學校師生的學習和科研工作帶去了思想啟發,也為同學們學習多智能體決策優化與博弈提供了有益指導。

報告結束后,雷金龍研究員就多智能體決策中博弈論相關問題與師生們進行了交流。她也根據自身經歷勉勵同學們要積極拓寬視野,努力探索、發現并解決新的科學問題。此次報告進一步拓展了我校師生的科研視野,增強了同學們對多智能體決策優化與博弈方面的理解與認識。(文/圖 張皓 王云姣)