_日韩人妻无码一区二区三区,国产V在线最新观看视频,国产欧美日韩va另类在线播放

講師

當前位置: 首頁 > 師資隊伍 > 軟件系 > 講師 > 正文

趙陽洋

發布時間: 2023-10-30 14:43:50 瀏覽量:

長沙理工大學計算機學院研究生導師基本信息表

1、個人基本信息：

姓名：趙陽洋

性別：女

出生年月：1995.12

技術職稱：講師

畢業院校：華南理工大學

學歷（學位）：博士

所在學科：軟件工程

研究方向：強化學習、大模型、人機交互

2、教育背景：

2017.09----2022.12

華南理工大學大學

博士

2021.11----2022.11

Utrecht University

聯合培養博士

3、 目前研究領域：

強化學習、大模型、人機交互

4、已完成或已在承擔的主要課題：

1、基于大模型和強化學習的任務驅動-情緒感知型對話策略研究，湖南省自然科學基金面上項目青年項目，主持，5萬

2、基于端云融合的網聯協同控制關鍵技術研究及應用，廣東省重點領域研發計劃項目，新一代人工智能專項，參與，10000萬

3、面向在線社會網絡的信息傳播結構分析與宏觀預測，廣東省基礎與應用基礎研究基金，面上項目，參與，10萬元

4、基于大數據分析的移動音樂智能搜索與推薦平臺，廣州市科技計劃項目，廣州市產業技術重大攻關計劃-現代產業技術專題項目，參與，1400萬元

5、面向移動互聯網用戶大數據分析及推薦平臺的產業化應用，廣東省應用型科技研發專項資金項目重點項目，參與，400萬元

5、已出版的主要著作：

6、已發表的學術論文：

[1] Yangyang Zhao, Jinchuan Long*, Mehdi Dastani, Shihan Wang. Rescue Conversations from Dead-ends: Efficient Exploration for Task-oriented Dialogue Policy

Optimization. Transactions of the Association for Computational Linguistics, 2024. (TACL，一區TOP期刊)

[2] Yangyang Zhao, Hua Qin, Zhenyu Wang, Mehdi Dastani*, Shihan Wang*. Decomposed Deep-Q Network for Efficient Dialogue Policy Learning. IEEE Trans. Audio, Speech, and Lang. Process. (TASLP，一區TOP期刊)

[3]Yangyang Zhao, Ben Niu, Mehdi Dastani*, Shihan Wang*. Bootstrapped Policy Learning for Task-oriented Dialogue through Goal Shaping. EMNLP 2024. (CCF-B)

[4] Yangyang Zhao, Mehdi Dastani*, Shihan Wang*. Bootstrapped Policy Learning: Goal Shaping for Efficient Task-oriented Dialogue Policy Learning. AAMAS 2024. (CCF-B)

[5] Yangyang Zhao, Zhenyu Wang*, Zhenhua Huang. Automatic Curriculum Learning With Over-repetition Penalty for Dialogue Policy Learning. AAAI 2021. (CCF-A)

[6] Yangyang Zhao, Zhenyu Wang*, Kai Yin, Rui Zhang, Zhenhua Huang, Pei Wang. Dynamic Reward-based Dueling Deep Dyna-Q: Robust Policy Learning in Noisy Environments. AAAI 2020.oral (CCF-A)

[7] Yangyang Zhao, Zhenyu Wang *, Changxi Zhu, Shihan Wang. Complementary Policy Learning from Episodic Memory Policy and DQN Policy. EMNLP 2021. (CCF-B)

[8] Yangyang Zhao, Hua Qin, Zhenyu Wang*, Changxi Zhu, Shihan Wang*. A Versatile Adaptive Curriculum Learning Framework for Task-oriented Dialogue Policy Learning. NAACL 2022. (CCF-B)

[9] 趙陽洋，王振宇*，王佩，楊添，張睿，尹凱. 任務型對話系統研究綜述. 計算機學報, 2020, 43(10): 1862-1896. (CCF-T1)

7、 所獲學術榮譽及學術影響：

指導研究生學生獲獎情況：
“華為杯”中國研究生人工智能創新大賽（2024）（全國二等獎）

湖南省研究生計算機創新大賽（2024）（湖南省一等獎，優秀指導老師）

指導本科生獲獎情況：

中國大學生服務外包創新大賽（2024）（全國二等獎）

中國機器人及人工智能大賽（2024）（全國二等獎）

藍橋杯數字科技創新賽（2024）（全國三等獎）

中國大學生計算機設計大賽（2024）（中南賽區一等獎）

海峽兩岸暨港澳地區大學生計算機創新作品賽（2024）（湖南省三等獎）

學術兼職：
中文信息學會，計算機學會會員

ACL, EMNLP, NAACL, COLING, AAAI，IJCAI等人工智能及自然語言處理領域頂級會議審稿人

上一篇：乃科

下一篇：徐聰

免费A级毛片在线播放不收费,国产麻豆剧传媒精品国产av,最近最好的2019中文,最好看免费观看高清电影大全