2025年3月4日下午,由六合彩結果
、同濟大學上海智能科學與技術研究院聯合舉辦的智·信講堂第73期在嘉定校區智信館117報告廳開講。本次講堂邀請多倫多大學Lacra Pavel教授作題為“On System Theory for Learning in Games”的主題報告。

報告伊始,Lacra Pavel教授首先介紹了系統理論在博弈學習算法分析與設計中的關鍵作用。她回顧了眾多已提出的算法/動態,包括最佳響應策略、(投影)梯度策略、近端動力學策略、虛擬博弈、基于收益的策略或Q學習(強化學習)等。接著,她指出,在某些博弈設置中,為何某些算法有效而其他算法無效,以及如何放寬這些算法的假設并以系統的方式進行推廣,是近年來學術界關注的熱點話題。
在報告中,Lacra Pavel教授詳細闡述了她所在團隊在這一領域的貢獻。團隊的方法基于利用系統理論原理以及與無源性/耗散性的聯系,展示了如何將一些流行的博弈論算法視為耗散/無源動態系統與某些博弈映射之間的反饋互連。一旦實現這一點,學習動態的收斂性分析就可以基于標準的無源性理論,通過簡潔的論證來完成。
此外,Lacra Pavel教授還討論了如何利用無源性啟發的思想來設計新的算法和學習動態,以解決納什均衡和廣義納什均衡問題。最后,她進一步介紹了基于無源性的高階學習動態,并探討了具有內在動態特性的智能體的學習擴展問題。

報告結束后,Lacra Pavel教授同與會師生進行了親切的交流和討論。她還結合自身經歷勉勵同學們要積極拓寬視野、勇于探索、發現并解決新的科學問題。此次報告不僅拓展了我校師生的學術視野,也增強了大家對系統理論在博弈學習中應用的理解和認識。