用Transformers库实现基础的大模型文本生成以及KV cache注意事项 - 代码天地

用Transformers库实现基础的大模型文本生成以及KV cache注意事项

企业开发 2025-04-09 17:42:41 阅读次数: 0

根据输入的prompt，生成一段指定长度的文字。Llama跑起来太慢了，这里用GPT-2作为列子。

from transformers import GPT2LMHeadModel, GPT2Tokenizer
import torch

tokenizer = GPT2Tokenizer.from_pretrained("gpt2")
model = GPT2LMHeadModel.from_pretrained("gpt2", pad_token_id=tokenizer.eos_token_id)

prompt_text = "This is a nice story that makes me"
max_gen_len = 9
input_ids = tokenizer.encode(prompt_text, return_tensors="pt")
prompt_len = input_ids.shape[-1]
print(f'length of prompt: {
     
      
      prompt_len}, length of generation: {
     
      
      max_gen_len}

猜你喜欢

转载自blog.csdn.net/qq_16763983/article/details/138828388

用Transformers库实现基础的大模型文本生成以及KV cache注意事项

动态构建J2Cache以及注意事项

CSS基础注意事项

【基础】httpclient注意事项

OpenCV基础以及注意事项

Qt绘制文本注意事项

使用PowerPoint的10大注意事项

mysql大表查询注意事项

mybatis生成的xml文件注意事项

idea打包生成war及注意事项

深度学习模型训练注意事项

pyspark训练ALS模型注意事项

用VS开发QT的注意事项

RF用例编写，及注意事项

Spring 整合hibernate 以及注意事项

NodeJs安装以及注意事项

Butterknife 使用以及注意事项！

Hook 实例以及注意事项

mysql union用法以及注意事项

nvm安装以及注意事项

锁的优化以及注意事项

列队题解以及注意事项

CosmoMC的安装以及注意事项

docker命令以及注意事项

taro框架的缺陷以及注意事项

rac相关命令以及注意事项

ireport的使用以及注意事项

易错点以及注意事项

PCB布线技巧以及注意事项

Spark- JdbcRDD以及注意事项

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

ConfigurationClassParser类的parse方法源码解析

基础大讲堂-java 位运算符

ConsecutiveInteger判断给定的整数n能否表示成连续的m(m>1)个正整数之和

多项式问题之六——多项式快速幂

Spring Security技术栈开发企业级认证与授权（四）RESTful API服务异常处理

Linux基础命令---apachectl

MATLAB中的线性插值

Unity编辑器拓展之十七：NGUI ComponentSelector增加搜索框

SqlServer 备份还原教程

[Unity动画]01.

每日归档

更多

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)