从指令微调到数学推理能力,探索大模型潜力|9月14日 大模型系列活动第11期

点击蓝字

b65383f17967c20ba627acd6746907cb.jpeg

关注我们

AI TIME欢迎每一位AI爱好者的加入!

72e258b88471689a598edeaff66434a2.jpeg

哔哩哔哩直播通道

扫码关注AI TIME哔哩哔哩官方账号预约直播

ba8302ccf68a712a2cf3cda94362668d.gif

13:30—13:50

闫俊

Virtual Prompt Injection for Instruction-Tuned Large Language Models

13:50—14:10

宁雪妃

SoT: 利用并行解码加速LLM的尝试

14:10—14:30

张锐麒

Trained Transformers Learn Linear Models In-Context

14:30—14:50

魏来

InstructionGPT-4: A 200-Instruction Paradigm for Fine-Tuning MiniGPT-4

14:50—15:10

袁正

Scaling relationship on Learning Mathematical Reasoning with Large Language Models

15:10—16:00

Panel

1.如何全面地评测大语言模型的能力?怎样平衡大语言模型的能力与安全性?

2.大模型微调方法能否有效地提高模型在特定任务上的性能?在实际应用中有哪些潜在的局限性?

3.大模型在特定能力(如数学推理)方面的表现如何?如何充分发挥大模型在特定能力方面的优势?

嘉宾介绍

bc6d24b4ab167a5dcea8b971474cb4f9.jpeg

闫俊

南加州大学计算机系五年级博士生,导师是Xiang Ren教授,研究领域是可信自然语言处理。目前主要关注大预言模型的安全性,包括数据投毒攻击和模型鲁棒性。

个人主页:https://junyann.github.io/

c9188421a5093be6e6585b9e3c4fc7af.png

宁雪妃

清华大学博士后,合作导师为汪玉教授。研究领域为高效机器学习。目前主要关注生成模型的压缩和加速。

个人主页:https://www.ningxuefei.cc/

0366760ee0b5bdaf52fbb8727e0ec60f.jpeg

张锐麒

加州大学伯克利分校统计系二年级博士生,主要在Peter L. Bartlett教授的指导下工作。研究领域主要是理论深度学习和理论强化学习。目前关注Transformer,大语言模型和基于上下文学习(In-Context Learning)的理论。

个人主页:https://rqzhangberkeley.github.io/

0f187488afb66725b885f1b83630fdbf.jpeg

魏来

上海交通大学大四本科生,研究领域是多模态大模型和自然语言处理。

个人主页:https://waltonfuture.github.io/

e1ba1e684d6fd16044063af624908924.jpeg

袁正

清华大学统计中心博士,在阿里达摩院任高级算法工程师。主要研究方向为大模型中的对齐和逻辑推理。

往期精彩文章推荐

853199c308827710a7e0eadfebf4e62e.jpeg

-  关注我们,记得星标  -

 关于AI TIME 

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。

迄今为止,AI TIME已经邀请了1300多位海内外讲者,举办了逾600场活动,超600万人次观看。

6bb8e9a1f9019b13aa14bf52facf54b7.png

我知道你

在看

~

e143d7a825d8779e121fd5c70d524d96.gif

点击 阅读原文 预约直播!

猜你喜欢

转载自blog.csdn.net/AITIME_HY/article/details/132784504