回顾2023 亚马逊云科技 re:Invent，创新AI，一路同行

作为全球云计算龙头企业的亚马逊云科技于2023年11月27日至12月1日在美国拉斯维加斯举办了2023 亚马逊云科技 re:Invent，从2012年开始举办的亚马逊云科技 re:Invent 全球大会,到现如今2023 亚马逊云科技 re:Invent，回顾历届re:Invent大会，亚马逊云科技在每一届大会上都会推出新产品，其推行的创新概念已日趋成为全球云计算行业创新的风向标。

数据规模拓展无极限，引领 Serverless 构建之路

亚马逊云科技高级副总裁 – Peter 在re:Invent大会的第一天发布了数据库和应用领域的三项 Serverless 创新，使客户能够更快、更轻松地扩展其数据基础设施，以支持苛刻的业务用例。

老枝新芽？三大全新Serverless服务推出

**全新 Amazon Aurora Limitless Database **可自动扩展到每秒数百万个写入事务并管理 PB 级数据，同时保持操作单个数据库的简单性；
全新 Amazon ElastiCache Serverless 可以更快、更轻松地创建高可用缓存服务并立即扩展以满足应用程序需求；
全新 Amazon Redshift Serverless 使用 AI 模型来预测工作负载并自动扩展和优化，提供高达10倍的性价比提升。

Amazon Aurora Limitless Database 数据拓展无极限

回顾近年来亚马逊云科技在其庞大云服务体系上构建大规模的 Serverless 服务，有包括用于存储的 Amazon S3、用于计算的 Amazon Lambda、以及用于数据库的 Amazon DynamoDB。到后来2018年，亚马逊云科技推出了 Amazon Aurora Serverless，它能够根据工作负载需求自动无缝地调整数据库容量，而无需对数据库进行任何调整或故障切换。虽然推出了Amazon Aurora Serverless，但是Peter 得出结论：“我们仍然受到物理服务器大小的限制，这并不是 Serverless。但是，**数据库分片是一种众所周知的改进技术。考虑到将数据水平划分为子集并将其分布到一堆物理上独立的数据库服务器（称为分片），以利用单个服务器的数据库性能。” ,所以亚马逊云科技推出了全新 Amazon Aurora Limitless Database：客户可轻松扩展其数据库，突破单个服务器的容量限制，并通过数据库分片实现高性能，**有了无限的数据库，就无需担心新增需要管理的新数据库，您的应用程序只是一个可用的数据库入口。

Amazon ElastiCache Serverless 即刻构建云上中坚力量

Amazon ElastiCache Serverless是一种新的无服务器选项，允许客户在一分钟内创建缓存并根据应用程序流量模式立即扩展容量。Amazon ElastiCache Serverless 与两种流行的开源缓存解决方案 Redis 和 Memcached 兼容。
从作者本人的使用经验来看，在以往使用Elasticache创建Redis或者Memcached的时候，都至少会等待4-5分钟的时间，同时删除也需要等待很长时间，若是针对于测试环境，是非常浪费时间的一个环节，那么现在Elaticache Serverless推出后，作者立刻就去体验了一番Elasticache Serverless，实际上操作下来，其实启动速度不一定是官方宣称的1分钟内，当然也有，但是大多数情况下是在1分钟至2分钟这个区间，创建的缓存数据库才会变为可用状态。
小节一下

速度确有提升，猜测可能是因为资源量的原因，导致可能速度不那么快
Serverless的一大特点就是自动拓展资源量，在默认情况下资源不设限，可自行增长。当然也给了客户可选，自行设置最大资源量

Amazon Redshift Serverless AI助力，省时省力

亚马逊云科技在2021年推出了**Amazon Redshift Serverless，**但是对于一些苛刻的工作负载，仍需要人工干预。Peter 通过介绍一些具有挑战性的数据仓库模式来展示这些问题

对于仪表板和报告的小型查询，需要持续低于秒级的低延迟；
对于大型 ETL 批处理作业，需要在不干扰其他工作负载的情况下高效运行。这些作业可能处理数十亿行；
对于特殊的复杂分析查询，需要优化性能而不影响生产工作负载。这些查询可能是典型查询的10-100倍大小。

基于上述问题，亚马逊云科技推出了一项新的**Amazon Redshift Serverless 功能：下一代 AI 驱动的扩展和优化。**该功能使用 AI 模型来预测工作负载并自动扩展和优化资源，将现有的基于查询态的资源分配升级为基于查询、数据量级计算复杂度等多方面维度，利用机器学习模型将计算资源动态分配，以帮助客户实现性价比目标。

亚马逊云科技在 Serverless 技术方面以开创性工作为基础，旨在帮助客户管理任何规模的数据并大幅简化其运营，以便他们能够专注于为最终用户进行创新，而无需花费时间和精力来配置、管理和扩展其数据基础设施。主要包含以下能力：

基于机器学习的预测模型，能够预测未来工作负载模式并提前调整资源容量。
实时查询分析器，利用机器学习估算每个查询的资源需求并进行合理分配。该系统能分析每个查询的超过50个独特特征。
针对客户需求，优化每个查询以降低成本或提高性能。查询具有线性、次线性和超线性等不同扩展模式。

软硬兼施，AI加持，全栈生成式 AI 能力

亚马逊云科技与 Anthropic 深化合作关系

Adam 强调了在快速发展的人工智能领域中，客户灵活选择权的重要性。为了实现这一目标，亚马逊云科技持续拓展与业界领先的创新公司，比如开创性的 AI 初创公司 Anthropic 的合作。通过与 Anthropic 建立新的合作关系，后者将利用亚马逊云科技的专用机器学习芯片 Trainium 来训练他们的下一代复杂 Claude 模型。Amazon Bedrock 的客户还将享有独家早期使用权，体验其他地方无法使用的先进 Claude 定制和微调模型功能。

Amazon AI 再发力！

Amazon Bedrock 发布更多模型选择和全新开发工具，助力安全构建和规模化生成式 AI 应用

Amazon Bedrock 现已支持新推出的基础模型版本包括：Anthropic Claude 2.1、Meta Llama 2 70B 以及 Amazon Titan Family 等

Amazon Bedrock 全新功能，包括模型的微调、检索增强生成（RAG）以及基于 Amazon Titan 大模型的预训练

在生成式 AI 的顶层，另一个关键层面是通过 Amazon Bedrock 为客户提供简单快速和安全地访问各种基础模型的 API 的途径。Amazon Bedrock 在两个月前推出，已经吸引了超过10,000名来自各个行业的活跃客户使用它来快速构建和扩展生成式 AI 应用。Adam 也发布了 Amazon Bedrock 的全新功能，包括模型的微调、检索增强生成（RAG）以及基于 Amazon Titan 大模型的预训练。

Agents for Amazon Bedrock

**借助全新 GA 的 Agents for Amazon Bedrock，用户可以通过简单的几个步骤创建和部署完全托管式的 Agent，通过动态调用 API 来执行复杂的业务任务。**Amazon Bedrock 可以根据用户提供的自然语言指令完成任务所需的 API 架构。

Guardrails for Amazon Bedrock

在亚马逊云科技，我们致力于以负责任的方式开发 AI，Adam 本次针对生成式 AI 的安全，全新发布 Guardrails for Amazon Bedrock 预览版，根据应用程序需求和 AI 政策定制保障措施。Guardrails 可以跨基础模型，为所有应用程序提供一致的 AI 安全级别，阻止生成式 AI 应用程序中不需要的话题，根据 AI 策略过滤有害内容等。生成式 AI 一定要是安全的，是负责任的，这是亚马逊云科技的 Job Zero。

全新一代 Graviton 处理器 —— Amazon Graviton4

回顾近几届亚马逊云科技Re:Invent大会，几乎都会推出硬件

2018 年，AWS 发布了适用于开源和非性能关键型脚本工作负载的第一个版本的 Graviton，作为其 A1 实例系列的一部分。
2019 年 12 月第二代 AWS Graviton2 发布，作为其第六代实例中的第一个，AWS 承诺与第五代 Intel 和 AMD 实例相比，性价比提高 40%，平均降低 72%在功耗方面。
2022 年 5 月，AWS 提供了 Graviton3 处理器作为其第七代 EC2 实例的一部分，计算性能比 Graviton2 进一步提高了 25%。

如今，2023年亚马逊云科技Re:Invent推出全新一代Graviton—Amazon Graviton 4：96 个 Neoverse V2 内核、每个内核 2MB 的 L2 缓存和 12 个 DDR5-5600 通道共同作用，使得 Graviton4 与 Graviton3 相比，处理数据库的速度提升多达 40%，处理 Web 应用程序的速度提升 30%，处理大型 Java 应用程序的速度提升 45%。
对于支持Amazon Graviton 4的R8G实例将提供多种大小，与第 7 代基于 Graviton3 的内存优化型实例（R7g）相比，具有 3 倍的 vCPU 数量和 3 倍的内存量。
亚马逊云科技计算和网络副总裁 David Brown 表示：“通过将我们的芯片设计重点放在对客户重要的实际工作负载上，我们能够为他们提供最先进的云基础设施。” “Graviton4 标志着我们在短短五年内推出的第四代芯片，是我们为广泛的工作负载打造的最强大、最节能的芯片。”

注:表中以"/"填充的表示作者没有找到相关数据进行填充

处理器	Graviton1	Graviton2	Graviton3(E)	Graviton4
实例	A1	M6g/M6gd
C6g/C6gd/C6gn
R6g/R6gd
T4g
X2gd
G5g
I4g/Im4gn/Is4gen	C7g/C7gd/C7gn
M7g/M7gd
R7g/R7gd
Hpc7g	R8G
核心	Cortex-A72	Neoverse-N1	Neoverse-V1	Neoverse V2
最大频率	2000MHz	2500MHz	2600MHz
架构修订	ARMv8.0	ARMv8.2-a	ARMv8.4-a	ARMv9.0-A
核心数	16	64	64	96
L1缓存（每个核心）	48KB inst / 32KB data	64KB inst / 64KB data	64KB inst / 64KB data	/
L2缓存（每个核心）	512KB	1MB	1MB	2MB
LLC（共享）	/	32MB	32MB	/
DRAM	/	8x DDR4	8x DDR5	12x DDR5-5600
DDR加密	/	yes	yes	/

全新一代 Amazon Trainium2 芯片

**基于训练芯片 Trainium 的成功经验，Adam 正式发布了全新一代 Trainium2 芯片。**它拥有数千亿甚至数万亿个参数的基础模型训练做了优化，性能比上一代芯片提高到4倍，拥有65 EFlops 可以按需提供性能支持。明星生成式 AI 企业 Anthropic 计划用 Trainium2 芯片构建模型。

在进行创新的时候，我们会在各种不同的 FM 还有 API 之间交互，Amazon Bedrock 能够提供各式各样模型，例如 AI21 labs、Anthropic、Cohere、Meta，还有 Amazon Titan 模型。此外亚马逊云科技也是首个集成 Meta Llama 2 模型的云厂商。

亚马逊云科技成为首家推出 NVIDIA GH200 NVL32 实例的云厂商

NVIDIA 创始人、CEO Jensen Huang 宣布，亚马逊云科技成为首家推出 NVIDIA GH200 NVL32 实例的云厂商。这款实例带有32个 GH200 超级芯片，它们之间通过高达 900GB/s NVLink 网络进行互联，形成一个具有高达 20TB 共享内存的实例，可用于加速训练具有1万亿参数的 AI 大模型

有Q必有A，亚麻家王炸产品Amazon Q

有问题必定有答案，亚马逊云科技在2023 Re:Invent上推出王炸产品 **Amazon Q：**一款基于生成式人工智能（AI）的新型助手，专为辅助工作而设计，可以针对客户的业务量身定制，可为开发人员和 IT 专业人员提供支持，可在 AWS 的多个领域提供，无论您在哪里工作，都可以快速访问答案和创意
提供多种功能和使用场景

借助 Amazon Q，AI 专家将随时待命，回答问题、更快地编写代码、排查问题、优化工作负载，甚至可以帮助您编写新功能。这些功能简化了在 AWS 上构建应用程序的所有阶段的工作。
如果需要额外的帮助，Amazon Q 还支持您直接从 Q 界面与 AWS Support 座席进行互动，从而消除客户自助服务体验中的任何难题。与 AWS Support 的集成在控制台中提供，并提供 AWS Support 套餐中包含的权益。

亚马逊云科技的技术哲学

Amazon CTO Werner Vogels 博士今年在 re:Invent 上的主题演讲，以一种特殊的角度将亚马逊作为一个最佳实践，向我们展示了如何设计出成本优先的技术架构。

“在商业活动中识别最有盈利潜力的领域，并以此为中心来构建和优化整个业务架构。” 这句话其实在某种程度上也昭示了亚马逊的技术哲学，即技术总是围绕商业来构建的，它的目的也是让商业运转得更具效率。这样就不难看出为什么是亚马逊首先将云技术普及给了用户，并且它一直代表了云技术领域最先进的思潮。

第一法则：将成本视作一种非功能性需求
在设计、开发和运营系统时，要在早期就开始以及持续考虑成本问题，以平衡功能、上线时间和效率。
第二法则：系统的耐久性取决于其成本与业务模型的匹配度
设计与业务模式的盈利杠杆相契合的系统，以利用规模经济，顺势而为，确保收益的同时不断成长。无限制的增长若没有盈利将削弱价值。
第三法则：架构设计就是一系列取舍的集合
每个设计决策都伴随着权衡。定期重新评估技术和商业上的权衡，投入资源以满足业务需求至关重要。
第四法则：无法观察的系统将带来无法估量的成本
尽管监控系统需要前期投资，但它们让组织能够精准找出浪费的行为，优化工作流程，并将资源有序地用于优先级高的事情。
第五法则：成本感知架构实现成本控制
有了强大的监控体系，您可以在发现改进机会的领域采取行动。通过实施细致的控制，您可以在成本与用户体验之间取得最佳平衡。
第六法则：成本优化是渐进的过程
追求成本效率是一个持续的过程。监控您的系统以了解其模式并消除低效率。持续优化需要重新审视系统，以找到更多的改进空间。
第七法则：未经挑战的成功会导致盲目自信
持续质疑过去有效的方法。重新审视先前成功的方法和工具。正如 Grace Hopper（著名计算机科学家，COBOL 之母）所说，英语中最危险的短语之一是：“我们一直都是这样做的”。

展望未来

从2020年开始，亚马逊云科技就开始对来年进行预测，并积极应对未来的发展

对于2021：从学校教育到太空：关于技术将如何在来年继续改变我们的生活的八个预测

云将无处不在
机器学习的互联网
2021年，图片、视频、音频将胜过文字
技术将像数字世界一样改变我们的物理世界
远程学习在教育中赢得一席之地
小型企业将竞相向云计算，东南亚和撒哈拉以南非洲地区将引领潮流
量子计算开始蓬勃发展

对于2022：

人工智能支持的软件开发占据主导地位
无处不在的云有优势
智能空间的兴起，尤其是在老年护理领域
可持续发展有自己的架构
新的连接浪潮将带来新的应用类别

对于2023：

云技术将重新定义我们所知道的体育运动
模拟世界将重塑我们的实验方式
智能能源创新浪潮
即将到来的供应链转型
定制芯片成为主流

对于2024

生成式 AI 将逐渐具备文化意识
女性科技终于腾飞
AI 助手重塑开发者生产力
教育变革紧跟科技创新步伐

从近几年的预测以及社会发展，足见亚马逊云科技对于未来的深谋远见，在应对未来的发展也一直在做出积极响应，自研芯片、助力教育和女性发展、加速AI创新等等。

活动预告：2023 亚马逊云科技 re:Invent 中国行 —— 10个城市巡展来了

为进一步将 2023 亚马逊云科技 re:Invent 精华内容以及体验带给中国客户与云计算爱好者，我们特举办2023亚马逊云科技 re:Invent 中国行活动！城市巡展将覆盖北京、上海、广州、深圳、成都、青岛、南京、西安、杭州、长沙10个城市。诚邀您体验最新技术和产品，感知运用 AI 解决方案提升技能构建新应用，实现行业赋能获取实践成果。全球盛会，中国共享，亚马逊云科技期待您的莅临！

2023亚马逊云科技 re:Invent 中国行之re:Invent 2023 主题演讲分享

在2023亚马逊云科技 re:Invent 中国行城市巡展中，我们还将邀请到神秘重磅嘉宾，带你全景解读2023亚马逊云科技 re:Invent 的众多重磅发布及应用创新！想要紧跟大咖脚步，全面探索大会前沿？分享不容错过，敬请期待！

2023亚马逊云科技 re:Invent 中国行之解锁北京站隐藏彩蛋

在城市巡展中，北京站还精心准备了面向业务/技术决策者的生成式 AI 入门的早鸟课程。本课程将为大家提供生成式 AI 的概览，以及规划生成式 AI 项目和建立生成式 AI 准备组织的方法。学员可以了解什么是生成式 AI、它如何解决高管的担忧和难题，以及它如何助力业务增长，如何为大量行业带来革命性巨变。

10大城市巡展，扫码即刻入“团”！

2023年12月12日起，2023亚马逊云科技 re:Invent 中国行城市巡展活动将在10大城市开启，覆盖北京、上海、广州、深圳、成都、青岛、南京、西安、杭州、长沙10个城市，期待您的到来！

更多精彩内容，详见亚马逊云科技公众号，微信搜索：亚马逊云科技

参阅资料