報告題目:人工智能:強化學習的基本理論及其應用
主要內容:講述及探討強化學習的基本理論及其應用。強化學習是機器學習的一種范式,它通過與環境的交互來學習如何實現特定的目標。其核心是智能體(Agent)通過與環境(Environment)的交互學習最優策略,以最大化長期累積獎勵(Cumulative Reward),這通常涉及到策略的學習,即在給定狀態下選擇最佳動作的規則。學習目標為熟悉強化學習的主要思路使得學生在學習高級強化學習算法的時候有良好的理論基礎。
報告人:方輝
報告人所在單位:英國拉夫堡大學
報告人職稱/職務及學術頭銜:博士
時間:2025年4月22日14:00-16:00
地點:云塘校區文科樓D505
報告人簡介:2006年畢業于布拉德福德大學主攻多媒體基于內容的智能檢索,致力于開發圖像壓縮域快速檢索與管理系統,曾應用于歐盟 FP6 框架下倫敦奧運點播查詢系統,2006-2015年于牛津大學等多所英國知名高校從事博士后研究員工作,曾領導開發國際地震中心可視化地震數據分析平臺,入選牛津大學社會影響力案例,2015年到2018年期間就職于知山大學和利物浦約翰莫爾斯大學,2019年1月入職拉夫堡大學。近年來主持國家級科研項目多項,包括:創新英國 KTP項目(KTP PROJECT £197,792),創新英國SMART GRANT,英國科學工程理事會工業合作基金,英國科學工程理事會項目等,其中大型項目成果:與倫敦奇點智能公司的開發產品已被聯合利華及荷蘭卡夫享氏公司采用;與利茲教學醫院開發的視覺體液健康系統也在原型測試階段;已在頂級會議和頂級期刊 (CVPR, AAAI, ECCV,IEEE TRANSACTIONS ON VISUALIZATION AND COMPUTER GRAPHICS, PATTERN RECOGNITION等)發表論文150余篇。同時,擔任多個國際著名期刊和會議編輯,包括 EUROVIS., INTERNATIONAL CONFERENCE ON COMPUTATIONAL VISUAL MEDIA (CVM), COMPUTER GRAPHICS AND VISUAL COMPUTING (CGVC), INTERNATIONAL CONFERENCE ON EMERGING UBIQUITOUS SYSTEMS AND PERVASIVE NETWORKS (ICEUSPN), GUEST EDITOR OF SPECIAL ISSUE IN MDPI ENTROPY, AI Communications 副主編。
承辦單位:國際工學院 通識教育中心