趙陽洋
發布時間: 2023-10-30 14:43:50 瀏覽量:
長沙理工大學計算機學院研究生導師基本信息表 |
||||||
1、個人基本信息: |
||||||
姓 名:趙陽洋 |
性 別:女 |
|
||||
出生年月:1995.12 |
技術職稱:講師 |
|||||
畢業院校:華南理工大學 |
學歷(學位):博士 |
|||||
所在學科:軟件工程 |
研究方向:強化學習、大模型、人機交互 |
|||||
2、教育背景: |
||||||
華南理工大學大學 |
博士 |
|||||
2021.11----2022.11 |
Utrecht University |
聯合培養博士 |
||||
3、 目前研究領域: |
||||||
強化學習、大模型、人機交互 |
||||||
4、已完成或已在承擔的主要課題: |
||||||
1、基于大模型和強化學習的任務驅動-情緒感知型對話策略研究,湖南省自然科學基金面上項目青年項目,主持,5萬 2、基于端云融合的網聯協同控制關鍵技術研究及應用,廣東省重點領域研發計劃項目,新一代人工智能專項,參與,10000萬 3、面向在線社會網絡的信息傳播結構分析與宏觀預測,廣東省基礎與應用基礎研究基金,面上項目,參與,10萬元 4、基于大數據分析的移動音樂智能搜索與推薦平臺,廣州市科技計劃項目,廣州市產業技術重大攻關計劃-現代產業技術專題項目,參與,1400萬元 5、面向移動互聯網用戶大數據分析及推薦平臺的產業化應用,廣東省應用型科技研發專項資金項目重點項目,參與,400萬元 |
||||||
6、已發表的學術論文: |
||||||
[1] Yangyang Zhao, Jinchuan Long*, Mehdi Dastani, Shihan Wang. Rescue Conversations from Dead-ends: Efficient Exploration for Task-oriented Dialogue Policy Optimization. Transactions of the Association for Computational Linguistics, 2024. (TACL,一區TOP期刊) [2] Yangyang Zhao, Hua Qin, Zhenyu Wang, Mehdi Dastani*, Shihan Wang*. Decomposed Deep-Q Network for Efficient Dialogue Policy Learning. IEEE Trans. Audio, Speech, and Lang. Process. (TASLP,一區TOP期刊) [3]Yangyang Zhao, Ben Niu, Mehdi Dastani*, Shihan Wang*. Bootstrapped Policy Learning for Task-oriented Dialogue through Goal Shaping. EMNLP 2024. (CCF-B) [4] Yangyang Zhao, Mehdi Dastani*, Shihan Wang*. Bootstrapped Policy Learning: Goal Shaping for Efficient Task-oriented Dialogue Policy Learning. AAMAS 2024. (CCF-B) [5] Yangyang Zhao, Zhenyu Wang*, Zhenhua Huang. Automatic Curriculum Learning With Over-repetition Penalty for Dialogue Policy Learning. AAAI 2021. (CCF-A) [6] Yangyang Zhao, Zhenyu Wang*, Kai Yin, Rui Zhang, Zhenhua Huang, Pei Wang. Dynamic Reward-based Dueling Deep Dyna-Q: Robust Policy Learning in Noisy Environments. AAAI 2020.oral (CCF-A) [7] Yangyang Zhao, Zhenyu Wang *, Changxi Zhu, Shihan Wang. Complementary Policy Learning from Episodic Memory Policy and DQN Policy. EMNLP 2021. (CCF-B) [8] Yangyang Zhao, Hua Qin, Zhenyu Wang*, Changxi Zhu, Shihan Wang*. A Versatile Adaptive Curriculum Learning Framework for Task-oriented Dialogue Policy Learning. NAACL 2022. (CCF-B) [9] 趙陽洋,王振宇*,王佩,楊添,張睿,尹凱. 任務型對話系統研究綜述. 計算機學報, 2020, 43(10): 1862-1896. (CCF-T1) |
||||||
7、 所獲學術榮譽及學術影響: |
||||||
指導研究生學生獲獎情況: 湖南省研究生計算機創新大賽(2024)(湖南省一等獎,優秀指導老師) 指導本科生獲獎情況: 中國大學生服務外包創新大賽(2024)(全國二等獎) 中國機器人及人工智能大賽(2024)(全國二等獎) 藍橋杯數字科技創新賽(2024)(全國三等獎) 中國大學生計算機設計大賽(2024)(中南賽區一等獎) 海峽兩岸暨港澳地區大學生計算機創新作品賽(2024)(湖南省三等獎) 學術兼職: ACL, EMNLP, NAACL, COLING, AAAI,IJCAI等人工智能及自然語言處理領域頂級會議審稿人 |