Seminar第2648讲强化学习与大模型-上海大学理学院数学系中文主页


Seminar第2648讲强化学习与大模型


创建时间： 2024/05/16 谭福平浏览次数：返回

报告题目 (Title)：强化学习与大模型

报告人 (Speaker)：荆炳义教授（南方科技大学）

报告时间 (Time)：2024年05月21日 (周二) 15:00

报告地点 (Place)：校本部GJ303

邀请人(Inviter)：张阳春

报告摘要：强化学习与大模型的结合代表了人工智能领域的一项重要进展。强化学习（RL）是一种机器学习方法，通过与环境互动并根据反馈进行策略优化，以实现预定目标。大模型则通过大规模数据训练，展现出强大的自然语言处理和生成能力。将两者结合，可以使强化学习系统在复杂环境中更加智能和高效。同时，强化学习能够优化大模型的策略，使其在特定任务中的表现更为卓越。这样的结合不仅提升了AI系统的适应能力和决策水平，还拓展了其应用范围，从游戏和机器人控制，到自动驾驶和自然语言处理，展示出广阔的前景和潜力。

上一条：Seminar第2649讲分布阶数学模型的稳定分布高斯正交格式

下一条：核心数学研究所——几何与分析综合报告第81讲具有球覆盖性质的Banach空间

首页

本系概况

机构设置

师资队伍

科学研究

人才培养

国际交流

安全宣传

联系我们

English