Python实现deepseek接口的调用
文章浏览阅读2.7k次,点赞28次,收藏33次。在 Python 中,可以使用 requests 或 httpx 库向 DeepSeek API 发送请求,实现文本生成、代码补全,知识问答等功能。本文将介绍如何在 Python 中调用 DeepSeek 接口,包括 API 认证、请求参数设置以及结果解析,帮助开发者快速集成 DeepSeek 功能到自己的应用中。第四步,将输出的代码复制到deepseek,API_KEY填刚才保存的apikey。第二步,点击用量统计,点击充值,不咋用的话,10块钱就够了。_python deepseek的api
LLM - 大模型 ScallingLaws 的预训练方案 教程(5)
文章浏览阅读1.8k次,点赞22次,收藏8次。使用 ScalingLaws 指导 100B 大模型的预训练方案,包括服务器资源、3D并行策略、Transformer架构、DeepNorm、混合精度策略、EGS策略、AdamW、WarmUp、GradientClipping、样本、位置编码等,使用大模型稳定和高效训练。
Android 12系统源码_输入系统(三)输入事件的加工和分发
文章浏览阅读1.2k次,点赞20次,收藏13次。通过Android12系统源码梳理输入事件的加工和分发流程_android rotaryencoder
手把手教你玩转DeepSeek:让AI听懂你的“人话“
文章浏览阅读14次。我想用****做****,目的为了****,希望****,但是我不懂**设计,也不会写提示词,请根据上面的分析,帮我设计一个**提示词,说人话。例如:我想用既梦AI设计山间别墅,目的是用于开民宿酒店,希望游客能够喜欢这里能经常来参观。当我不懂建筑设计,也不会写提示词。请根据上面的分析,学习并理解10位国际建筑大师的设计风格,并写提示词,提示词里面要包括主体名、场景、光线、色彩、媒介、大师名、质感。说人话。记住:DeepSeek就像智能电饭煲——不会读心术,但只要你按下正确的功能键,就能煮出香喷喷的米饭。
LeetCode - Google 大模型10题 第1天 Self-Attention(自注意力机制) 3题
文章浏览阅读877次,点赞18次,收藏18次。GroupQueryAttention(分组查询注意力机制) 和 KVCache(键值缓存) 是大语言模型中的常见架构,GroupQueryAttention 是注意力机制的变体,通过将查询(Query)分组,每组与相同的键(Key)值(Value)交互,优化计算效率和性能,保持模型对于输入信息有效关注,减少计算资源的消耗,适用于处理大规模数据和复杂任务的场景。KVCache 是缓存机制,用于存储和快速检索键值对(KV),当模型处理新的输入(Q)时,直接从缓存中读取KV数据,无需重新计算。
Android 12系统源码_RRO机制(一)Runtime Resource Overlay机制实践
文章浏览阅读1.7k次,点赞20次,收藏25次。通过一个简单demo的演示,初步认识和使用Android系统的RRO机制_android rro
用Dify+ DeepSeek 搭建自己的知识库或工作流
文章浏览阅读130次,点赞9次,收藏4次。基于字节的coze平台从0到1搭建我们自己的智能体从coze到超级创业个体:2025是AI Agent大爆炸的元年!搭建智能体的七大步骤:需求梳理、软件选型、提示工程、数据库、构建 UI 界面、测试评估、部署你的智能体如何并行调用多个通用AI大模型?实战案例:AI Agent提取小红书文案以及图像进行OCR文字识别并同步写入飞书多维表格实战案例:AI Agent提取抖音爆款短视频链接中的文案,基于大模型和提示词完成符合小红书风格和作者特点的文案仿写。
LeetCode - Google 大模型10题 第2天 Position Embedding(位置编码) 3题
文章浏览阅读1.1k次,点赞8次,收藏21次。在 Transformer 架构中,位置编码(Position Embedding) 是辅助模型理解序列中元素顺序的关键机制。_相对位置编码position embedding
Android 12系统源码_窗口管理(九)深浅主题切换流程源码分析
文章浏览阅读1.1k次,点赞12次,收藏25次。结合Android12系统源码,梳理系统深浅主题切换的源码流程_android 深浅主题变化后,一定会调用onconfigurationchanged回调吗?
C++对象内存模型布局详解
文章浏览阅读1.4k次,点赞13次,收藏24次。本文详细解释了C++中虚函数表的构成,对象模型(包括简单对象模型、表格驱动对象模型和继承下的模型),以及虚继承、多继承和菱形继承下的内存布局。还探讨了封装带来的布局成本以及特定空类继承层次的类大小计算。
LLM - 理解多模态大模型 Qwen2-VL 的 NDR 与 M-RoPE 教程
文章浏览阅读883次,点赞21次,收藏24次。Qwen2-VL 是多模态语言模型,在自然语言处理和视觉理解领域展现出卓越的性能,通过深度融合语言和视觉信息,高效地处理图文混合输入,精准理解图像内容,以及生成与之相关的高质量文本描述。_qwen2-vl mrope
【C++】share_ptr详解
文章浏览阅读5.8k次,点赞28次,收藏38次。分析:根据对象生成顺序,先初始化基类 enable_shared_from_this ,再初始化派生类 Frame 对象本身,这时 Frame 对象已经生成,但 _M_weak_this 成员还未被初始化,最后应通过 shared_ptr sp(new T()) 等方式调用 shared_ptr 构造函数(内部会调用 _M_weak_assign 成员函数来初始化 _M_weak_this 成员)。share_ptr 内部中的引用计数是线程安全的,但是引用的资源不是线程安全的。_share ptr
LLM - 理解 DeepSeek 的 MLA (多头隐含注意力) 公式与源码 教程(1)
文章浏览阅读442次,点赞2次,收藏6次。DeepSeek 的 MoE(Mixture-of-Experts) 和 MLA(Multi-Head Latent Attention) 是架构中的核心技术。MoE 通过混合专家机制,模型在处理任务时动态激活最相关的子网络(即“专家”),从而实现高效的资源利用。MLA 则专注于优化注意力机制,通过低秩联合压缩注意力键K和值V,显著降低推理过程中的 KV 缓存开销。MLA 结合旋转位置编码(RoPE),优化位置信息的处理。_deepseek mla公式理解
Android系统源码_AndroidStudio导入AOSP
文章浏览阅读791次,点赞20次,收藏23次。介绍AndroidStudio如何导入AOSP源码并保证方法可以正常点击跳转_android studio aosp
1992-2023年全国及31省对外开放度测算数据(含原始数据+计算过程+结果)(无缺失)
文章浏览阅读259次。1992-2023年全国及31省对外开放度测算数据(含原始数据+计算过程+结果)(无缺失)_1992-2023年我国出口总额
LLM - 理解 DeepSeek 的 GPRO (分组相对策略优化) 公式与源码 教程(2)
文章浏览阅读1.4k次,点赞30次,收藏30次。GPRO,即 Group Relative Policy Optimization,分组相对策略优化,是 PPO(Proximal Policy Optimization, 近端策略优化) 的优化版本,省略优化 评论家模型(Critic Model),用于估计价值(Value Function Model),降低模型训练的资源消耗。_deepseek gpro
2000-2023年全国各省城镇平均受教育年限数据(含原始数据+计算过程+结果)
文章浏览阅读570次,点赞9次,收藏2次。2000-2023年全国各省城镇平均受教育年限数据(含原始数据+计算过程+结果)_2023年各省人均受教育年限
Android 12系统源码_系统启动(一)init进程
文章浏览阅读1.1k次,点赞28次,收藏27次。结合Android12系统源码梳理系统启动过程中的init进程相关的源码_setprop ro.vendor.passwd
Unity 卡死排查方法(游戏死循环、打包卡死)
文章浏览阅读806次,点赞8次,收藏3次。unity2021.3.20f1目前打这种包会失败,提示代码量过大,后续unity2022升级NDK后解决,临时解决办法:https://forum.unity.com/threads/android-builds-failing-when-script-debugging-is-enabled.1027357/#post-7627372。查看当前unity的线程就可以定位什么问题了。打包需要勾选ScriptDebugging。打开线程窗口,调试->窗口->线程。只打arm64架构包。_unity点击运行卡住不动
今日推荐
周排行