研究发现更大的上下文对大语言模型来说意义不大 - 代码天地

研究发现更大的上下文对大语言模型来说意义不大

企业开发 2023-09-30 20:26:35 阅读次数: 0

研究发现更大的上下文对大语言模型来说意义不大

在大语言模型中，上下文窗口指的是模型在给定实例中可以处理和响应的文本长度。它可以被视为特定文本分析或聊天机器人对话的工作记忆。许多人都认为，语境窗口变大的趋势将继续提高大语言模型的性能和在各种应用中的实用性。但根据一项最新研究，大语言模型往往无法访问和使用在较长的上下文窗口中提供给它们的相关信息。当相关信息出现在输入上下文的开头或结尾时，它的性能最佳；而当模型必须在长上下文中间获取相关信息时，性能就会明显下降。此外，随着输入上下文的长度增加，即使是明确的长上下文模型，性能也会大幅下降。一味的追求长上下文，例如从标准版的4k扩展到8K,16K,32K,64K等，可能并没有太大意义。

Stanford study challenges assumptions about language models: Larger context doesn’t mean better understanding

猜你喜欢

转载自blog.csdn.net/qq_38563206/article/details/133035313

研究发现更大的上下文对大语言模型来说意义不大

语言大模型100K上下文窗口的秘诀

大语言模型拓展，通过上下文学习解决视觉任务

大模型的无限上下文与数据集组合艺术

大模型(LLM) + 上下文检索增强

大模型长上下文运行的关键问题

如何扩展大模型的上下文长度

谷歌新作SPAE：GPT等大语言模型可以通过上下文学习解决视觉任务

【大语言模型】5分钟了解预训练、微调和上下文学习

Go语言－Context上下文实践

上下文无关文法和语言

Sample语言上下文无关文法

预训练语言模型中上下文感知的语言表征学习讲解（图文解释）

【分享】百度千帆大模型Python调用上下文测评

大模型上下文长度的超强扩展：从LongLoRA到LongQLoRA

【分享】讯飞星火认知大模型Python调用上下文测评

符号调整改善了语言模型中的上下文学习

ACL 2018 | 神经语言模型如何利用上下文信息：长距离上下文的词序并不重要

【形状匹配算法】Shapecontext形状上下文算法的研究

Entitas深入研究（3）：多上下文系统

执行上下文、this

seam 上下文

CGContext与上下文

什么是上下文

javascript上下文this

上下文菜单

Flask上下文

执行上下文

上下文管理

上下文 ServletContext

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)