科普神文,一次性讲透AI大模型的核心概念
文章浏览阅读542次,点赞18次,收藏28次。Transformer已经引领了各种尖端的AI应用程序的创建。除了支持像Bard和ChatGPT这样的聊天机器人之外,它还驱动我们移动键盘上的自动完成功能和智能扬声器中的语音识别。然而,它的真正威力在语言之外。它的发明者发现,transformer模型可以识别和预测任何重复的主题或模式。从图片中的像素,使用Dall-E、Midjourney和Stable Diffusion等工具,到计算机代码使用GitHub Copilot等生成器。它甚至可以预测音乐中的音符和蛋白质中的DNA来帮助设计药物分子。_ai大模型的核心原理
最近爆火的新职业Prompt提示工程师到底是做什么的?迈向大模型第一步Prompt提示工程基础原理及实践
文章浏览阅读662次,点赞27次,收藏13次。想象一下,你在装饰房间。你可以选择一套标准的家具,这是快捷且方便的方式,但可能无法完全符合你的个人风格或需求。另一方面,你也可以选择定制家具,选择特定的颜色、材料和设计,以确保每件家具都符合你的喜好和空间要求。比如,选择一个特制的沙发,你可以决定其尺寸、布料类型、甚至是扶手的样式。你还可以根据房间的主题选择颜色,甚至添加一些独特的装饰,比如刺绣或特别的缝线。这就是Prompt工程的概念。就像你通过选择不同的设计元素来定制家具一样,Prompt工程涉及对AI的输入进行精细调整,以获得更加贴合需求的结果。
Agent实战:基于大模型的Agent技术框架开发实战
文章浏览阅读1k次,点赞33次,收藏11次。ReAct框架的设计哲学是:在动态和不确定的环境中,有效的决策需要持续的学习和适应,以及快速将推理转化为行动的能力,即形成有效的观察—思考—行动—再观察的循环。工具,也就是Tools,指的是我们给Agent武装的功能函数、代码段和其他技术工具。随着技术的进步和应用领域的扩展,ReAct及其衍生框架可能会成为智能Agent领域的主导力量,推动人工智能技术向更高水平的自主性和智能性迈进。在Agent的开发过程中,这些工具不仅提供了必要的支持和便利,增强了Agent的能力,而且可以确保Agent的性能和可靠性。
聊聊AI Agent,以及在医疗行业的应用
文章浏览阅读865次,点赞29次,收藏28次。AI Agent是一种能够感知环境、独立决策、执行任务的智能体,不仅限于对输入做出反应,还具备主动分析和任务分解能力。在架构上,由四个模块协同作用,确保AI Agent能自主处理复杂任务,提供灵活、有效的解决方案。在医疗领域,AI Agent的应用前景广泛,涵盖从日常辅助、影像分析、病历管理到手术支持、慢病管理等多场景,为医护人员减负、提升诊断精准度并优化患者体验提供智能支持。AI Agent(人工智能代理)是一种能够感知环境、进行决策并执行动作的自主智能体。_医疗 ai agent
叙事Prompt也能提升LLM推理能力?用叙事框架SoT解决复杂问题
文章浏览阅读735次,点赞28次,收藏13次。如何通过更好的提示工程来提升模型的推理能力,一直是研究人员和工程师们关注的重点。从最初的 few-shot learning 到 Chain of Thought(CoT),再到 Tree of Thoughts(ToT)和 Graph of Thoughts(GoT),prompting 技术在不断进化。而最新的研究表明,一个出人意料的方向可能带来突破性的进展——那就是将叙事(Narrative)元素引入到 prompt 中。
Ollama运行本地LLM大模型简单教程:大显存很重要
文章浏览阅读1.1k次,点赞28次,收藏10次。以上就是这段时间我们在研究本地部署的LLM大模型的体验,NVIDIA Chat RTX目前虽然比最早的体验版好用了不少,但依然处于很早期的状态,要自行添加指定模型比较麻烦,而且不能联系上下文这点体验并不好,不过想装来玩玩还是可以的,毕竟它的安装和使用都很简单,内置的小模型对显存容量需求也不高,8GB以上的显卡就可以跑。Ollama搭配Page Assist这组合胜在够简单,比较适合刚接触这方面的新手,添加模型很方便,知识库和联网搜索功能都很好用,当然上限确实不是很高就是,而且功能也够用。
揭秘2025最抢手职业:AI提示词工程师的崛起!
文章浏览阅读883次,点赞14次,收藏12次。在2025年,随着科技的飞速发展,一个新的职业——AI提示词工程师,正在迅速崛起并成为市场上最抢手的职业之一。这一职位的诞生和普及,不仅标志着人工智能技术的深度发展,也预示着人类与机器之间沟通方式的根本变革。AI提示词工程师的角色定位于设计和优化人工智能系统的交互界面,使之能够更加自然、高效地与人类进行交流。他们通过对语言模型的深入理解和创新应用,为AI系统提供丰富的词汇库和应答机制,从而让机器能够更好地理解人类的意图和情感。_ai时代:提示词工程的崛起
AI大模型训练相关参数如何估算?有这一篇就够了
文章浏览阅读1.1k次,点赞31次,收藏24次。随着大模型时代的到来,模型参数量、训练数据量、计算量等各方面急剧增长。参数规模方面,在过去的几年里,语言模型的参数规模从数亿增长到数千亿,甚至达到万亿级别。例如OpenAI的GPT-3拥有175B参数,而GPT MoE参数规模到达了1.8T;数据量方面,训练一个大模型通常需要达到T级别tokens;另外,由于参数规模和数据量庞大,随之带来的是巨大的计算量。_大模型训练参数计算
【大模型教程】大语言模型在表格任务中的应用
文章浏览阅读256次,点赞5次,收藏3次。大语言模型(LLMs)的快速发展催生了丰富多样的应用。本教程深入探讨了LLMs在表格数据中的应用,涵盖多种表格相关任务,例如表格理解、文本到SQL转换以及表格数据预处理。本教程按照技术方法将LLM解决方案分为五类:提示(prompting)、微调(fine-tuning)、检索增强生成(RAG)、代理(agents)以及多模态方法(multimodal methods)。它讨论了LLMs如何为解释、增强、查询和清理表格数据提供创新方法,并介绍了学术界的贡献及其在工业领域的实际应用。_面向表格的大语言模型
ai经理必备《AI赋能:AI重新定义产品经理》,一直在定义,从未被超越
文章浏览阅读1.4k次,点赞44次,收藏8次。大家好,今天给大家推荐一本ai产品经理必读的一本书籍《AI赋能:AI重新定义产品经理》,非常适合转行/入门或者已经是产品经理的小伙伴们。随着AI在越来越多的行业被应用,AI赋能的价值逐步体现出来。本书从AI的本质出发,介绍AI技术过往的发展历程和最新的理论成果,然后讲解如何站在移动互联网和大数据的基础上,系统地学习、应用AI技术。本书旨在向读者提供学习AI技术的资料、路径,以及打磨AI产品的观点、思路。此外,本书通过介绍笔者接触、打磨AI产品的实际经历,指出AI赋能过程中需要避免的“坑”。
多模态大模型微调实践!PAI+LLaMA Factory搭建AI导游
文章浏览阅读553次,点赞5次,收藏8次。一、引言AI的快速发展推动了各行各业的智能化转型和创新,随之而来的是对AI应用的迫切需求。如何微调大模型、高效搭建AI应用成为了开发者们广泛关注的技术方向。阿里云人工智能平台PAI,联合开源低代码大模型微调框架LLaMA Factory ,共同打造多模态大模型微调训练最佳实践,通过微调 Qwen2-VL 模型,快速搭建文旅领域知识问答机器人,带您开启AI创新与应用之旅,点击可马上体验~二、详细实验步骤。_阿里微调训练平台
【AI开源项目】LangChain (一)3分钟让你知道什么是LangChain,以及LangChain的部署配置全流程
文章浏览阅读858次,点赞22次,收藏22次。LangChain 是一个为各种大型语言模型应用提供通用接口的框架,旨在简化应用程序的开发流程。通过 LangChain,开发者可以轻松构建如图所示的 RAG(Retrieval-Augmented Generation)应用。在这里插入图片描述。
2024年大模型LLM还有哪些可研究的方向?听听大佬怎么说
文章浏览阅读919次,点赞16次,收藏17次。纯属brainstorm,欢迎大家一起探讨。想到哪里说到哪里,有遗漏的点欢迎大家在评论区中指出。个人认为现在LLM能做的点还很多,这个行业距离饱和还有一段距离。这里通过“
写一个名为Rectangle的类表示矩形
文章浏览阅读2.2k次,点赞3次,收藏9次。要求该类提供计算面积的方法getArea()方法,以及修改width和height的值及获得width和height当前值的方法。Java中的矩形类Rectangle可以描述一个矩形的位置和大小,可以使用构造函数来创建Rectangle对象。要使用Rectangle类计算矩形的面积和周长,需要先创建一个Rectangle对象,然后通过对象调用类中的方法来实现计算功能。这个构造函数的四个参数分别表示矩形左上角的x坐标、y坐标,以及矩形的宽和高。_写一个名为rectangle的类表示矩形。其属性包括宽width、高height和颜色color,widt
计算机组成原理-总线(学习这一篇就够了!)
文章浏览阅读5.4k次,点赞18次,收藏96次。1、总线是构成计算机系统的互联机构,是多个系统功能部件之间进行数据传送的公共通道,并在争用资源的基础上进行工作。2、总线有物理特性、功能特性、电气特性、机械特性,因此必须标准化。衡量总线性能的重要指标是总线带宽,它的定义为总线本身所能达到的最高传输速率。3、计算机系统中,根据应用条件和硬件资源不同,信息的传输方式可采用串行传送,并行传送和分时传送。4、总线仲裁是总线系统的核心问题之一。为了解决多个主设备同时竞争总线控制权的问题,必须具有总线仲裁部件。5、总线通信是总线系统的又一核心问题之一。_计算机总线
大模型中幂律缩放法则和涌现能力
文章浏览阅读1.1k次,点赞10次,收藏10次。文章探讨了幂律缩放法则在描述模型性能与资源之间的关系,指出大模型性能线性增长与资源成倍增长的关联。它揭示了模型性能预测的可能性,以及大模型中涌现现象的存在,如GPT-4的案例。研究引用了中国计算机学会CCCF期刊的内容。
操作系统(第一章之概念、形成、特征、功能)
文章浏览阅读1.9k次,点赞19次,收藏32次。操作系统属于软件中的系统软件,是紧挨着硬件的第一层软件,是对硬件功能的首次扩充;其他软件则是建立在操作系统之上的,通过操作系统对硬件功能进行扩充,并在操作系统的统一管理和支持下运行各种软件。操作系统与硬软件的关系如下图所示。从用户的角度来看,操作系统是用户与计算机硬件系统之间的接口,用户通过操作系统来使用计算机系统,即用户在操作系统的支持下,能够方便、快捷、安全、可靠地操纵计算机硬件资源,运行自己的程序。_操作系统
今日推荐
周排行