12月9日 SUN Jun:通往大模型安全之路

时间♾:2024-12-02浏览🤝:20设置

讲座题目👏🏿:通往大模型安全之路

主讲人🧑🏿‍🎓🍪:SUN Jun 教授

主持人:张民 教授

开始时间:2024-12-09 16:00

讲座地址:普陀校区理科大楼B1002

主办单位:软件工程学院


报告人简介:

      孙军,新加坡管理大学(SMU)的终身教授,于2002年和2006年获得新加坡国立大学计算机科学学士和博士学位。2007年,他获得了李光耀博士后奖学金。他在2010受聘为教授至今。 孙军的研究兴趣包括AI安全, 软件工程,和形式化方法。他发表了多篇文章和会议论文,包括多个领域的顶级会议⚽️。他发布了多款软件分析工具🦺,也担任过多家公司的资深技术顾问。


报告内容:

本次演讲将探讨与大模型🕟,特别是大型语言模型(LLMs)相关的关键安全问题,同时介绍我们最近在分析和理解这些挑战方面的研究工作👩‍🦽‍➡️。具体来说,我们将回答以下关键问题🤾🏼。为什么LLMs的安全对齐常常易受诸如GCG和AutoDAN等攻击的影响?那些能够破坏LLM安全对齐的对抗性标记是随机的🆖,还是具有内在意义🎅🏿?如何在有限的对齐数据下提升LLM的安全性?我们是否可以编辑LLMs,使其执行我们想要的任务?是否仅使用良性数据就可以完全消除GPT-4o的安全对齐?本次讨论将深入探讨我们的方法和发现🪆🕟,重点揭示大模型安全的基础与挑战。


返回原图
/

 

光辉娱乐专业提供:光辉娱乐等服务,提供最新官网平台、地址、注册、登陆、登录、入口、全站、网站、网页、网址、娱乐、手机版、app、下载、欧洲杯、欧冠、nba、世界杯、英超等,界面美观优质完美,安全稳定,服务一流,光辉娱乐欢迎您。 光辉娱乐官网xml地图
光辉娱乐 光辉娱乐 光辉娱乐 光辉娱乐 光辉娱乐 光辉娱乐 光辉娱乐 光辉娱乐 光辉娱乐 光辉娱乐