近日,國(guó)際先進(jìn)人工智能協(xié)會(huì)2023年會(huì)(Association for the Advance of Artificial Intelligence, AAAI)論文錄用結(jié)果發(fā)布,我校統(tǒng)計(jì)與數(shù)學(xué)學(xué)院初晨博士以第一作者身份撰寫的論文“A Pair-Approximation Method for Modelling the Dynamics of Multi-Agent Stochastic Games”入選。
該論文旨在研究在隨機(jī)博弈設(shè)置下,多智能體強(qiáng)化學(xué)習(xí)的動(dòng)力學(xué)建模問(wèn)題。論文巧妙地利用了統(tǒng)計(jì)物理中的對(duì)近似(Pair-Approximation)方法來(lái)刻畫智能體在成對(duì)交互中的行為決策與環(huán)境之間的反饋關(guān)系,并推導(dǎo)出能夠描述Q值向量對(duì)密度函數(shù)演化的福克-普朗克(Fokker-Planck)方程,最終由對(duì)的概率分布的演化可進(jìn)一步完全描述多智能體學(xué)習(xí)的動(dòng)力學(xué)以及環(huán)境狀態(tài)隨時(shí)間的演變。通過(guò)一系列的實(shí)驗(yàn),驗(yàn)證了該理論模型能夠準(zhǔn)確地描述多智能體隨機(jī)博弈的演化動(dòng)力學(xué)。該論文不僅揭示了統(tǒng)計(jì)物理與強(qiáng)化學(xué)習(xí)之間的奇妙聯(lián)系,還進(jìn)一步基于隨機(jī)博弈模型為社會(huì)困境問(wèn)題的解決提供了新的思路。
國(guó)際先進(jìn)人工智能協(xié)會(huì)是人工智能領(lǐng)域的主要國(guó)際學(xué)術(shù)組織之一,該協(xié)會(huì)主辦的AAAI年會(huì)是國(guó)際人工智能學(xué)術(shù)會(huì)議之一,是人工智能領(lǐng)域歷史悠久的國(guó)際學(xué)術(shù)會(huì)議之一,也是中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)推薦的A類國(guó)際學(xué)術(shù)會(huì)議,旨在推動(dòng)人工智能領(lǐng)域的研究和應(yīng)用,增進(jìn)大眾對(duì)人工智能的了解。AAAI本年度共接收8777篇論文投稿,錄用率為19.6%。這是我校首次在AAAI上以第一單位發(fā)表論文,是我校今年在人工智能頂級(jí)會(huì)議上發(fā)表的第三篇論文,標(biāo)志著我校在人工智能領(lǐng)域的持續(xù)創(chuàng)新與突破。