稀疏大模型在爱奇艺广告排序场景中的实践

武汉源创会回归,4月20聊聊大模型” 01 背景与现状 1、广告领域数据特点 广告领域数据可以分成:连续值特征和离散值特征。不同于 AI 图像、视频、语音等领域,广告领域内的原始数据大多以 ID 形式呈现,比如用户 ID、广告 ID、与用户交互的广告 ID 序列等,而且 ID 规模较大,形成了广告领域数据高维稀疏的鲜明特点。 连续值特征 既 有静态的(比如用户的年龄),也有基于用户行为的动态特征(比如用户点击某行业广告的次数)。 优点是具备良好的泛化能力。 一个用户对行业的偏好可以泛化到对这个
分类: 其他 发布时间: 04-15 21:04 阅读次数: 0

爱奇艺数据湖实战 - Hive数仓平滑入湖

武汉源创会回归,4月20聊聊大模型” 爱奇艺基于 Hive 构建了传统的离线数据仓库,支持了公司运营决策、用户增长、视频推荐、会员、广告等业务需求。近几年,随着业务对数据实时性的更高要求。我们引入了基于 Iceberg 的数据湖技术,大幅提升数据查询性能及整体流通效率。从性能和成本角度考虑,将现有的Hive表迁移到数据湖是必要的。然而多年来,大数据平台上已经积累了数百 PB 的 Hive 数据,如何将 Hive 迁移到数据湖,成为我们面临的一大挑战。本文介绍了爱奇艺从 Hive 平滑迁移到 I
分类: 其他 发布时间: 04-15 20:54 阅读次数: 0

爱奇艺 CTR 场景下的 GPU 推理性能优化

武汉源创会回归,4月20聊聊大模型” 01 背景介绍 GPU 目前大量应用在了爱奇艺深度学习平台上。GPU 拥有成百上千个处理核心,能够并行的执行大量指令,非常适合用来做深度学习相关的计算。在 CV(计算机视觉),NLP(自然语言处理)的模型上,已经广泛的使用了 GPU,相比 CPU 通常能够更快、更经济的完成模型的训练和推理。 CTR (Click Trough Rate) 模型广泛使用在推荐、广告、搜索等场景中,用来估算用户点击某个广告、视频的概率。在 CTR 模型的训练场景中已经大量使用
分类: 其他 发布时间: 04-15 20:44 阅读次数: 0

从编译器、游戏引擎到游戏掌机——我是这样做独立游戏的

武汉源创会回归,4月20聊聊大模型” 引言   自己开发制作游戏是一个儿时起就有的梦,特别是长时间接触魔兽争霸3世界编辑器后,我对游戏引擎和开发工具也有着特别的兴趣。学生时代接触编程以后,梦的外延开始扩散,不满足于使用各式编程语言做开发,开始维护一门自己喜欢的写游戏业务逻辑的编程语言项目 Yuescript,因为学习图形学和作为练手项目重写 Cocos2d-x 有了 Dora SSR 游戏引擎。工作后因为对游戏掌机的喜爱,开始与伙伴合作研发自由开放的可编程游戏掌机设备——吉祥机,实现自己游戏梦
分类: 其他 发布时间: 04-15 20:34 阅读次数: 0

AI 版权第一案:我用 AI 做的图,版权归我吗?

武汉源创会回归,4月20聊聊大模型” 最近,一个跟 AI 相关的案子引起了全国同行的围观,原因是一个百家号作者在网上写文章时,用了一张网上的 AI 图片当配图,结果被图片的生产者告侵权。这不禁让人紧张:以后 AI 产的图片,还能随便用吗?会不会侵权? 事情是这样的—— 2023年2月,李昀锴使用 Stable Diffusion 模型,通过在模型上输入数十个提示词,设置相关迭代步数、图片高度、提示词引导系数以及随机数种子等,生成了数张人像图片。随后,李昀锴以 “春风送来了温柔” 为名发布在社交
分类: 其他 发布时间: 04-15 20:24 阅读次数: 0

【直播预告】程序员逆袭CEO分几步?

武汉源创会回归,4月20聊聊大模型” 2024年,是充满未知和挑战的一年。AI 的发展日新月异,已经有人用它来写代码了,啥时候会替代程序员,可真不好说。另一方面,程序员扎堆的 IT 互联网行业却进入了平台期甚至下行期,降本增效成为行业主流,裁员缩招的声音不绝于耳。在这种前有狼后有虎的年头,作为程序员,又该何去何从? 程序员的职业生涯,真的只能走到35岁吗?我们该如何做,才能夯实自身,提高替代难度?又该如何学习,才能不断进步,勇立潮头?对于有创业梦想的人,又该如何规划,才能穿越牛熊,逆流而上?
分类: 其他 发布时间: 04-15 20:14 阅读次数: 0

国产数据库圈,为啥那么多水货?

武汉源创会回归,4月20聊聊大模型” 如今,在“国产化”的趋势下,国产数据库领域的创业浪潮一浪高过一浪。截至2023年底,中国市场上有将近300款数据库产品,约有100家数据库厂商。知名投资机构如红杉、高瓴、腾讯等纷纷下场,每家手上投资的数据库至少在3个以上,可见资本的青睐。 一些数据库凭借自身的实力,拿下了亿元融资,中标多个项目,节节高升,成功上市;可是也有一些数据库,还在经受市场的质疑。在16家国产数据库相关上市公司中,盈利的寥寥无几,不禁让人怀疑这种“亏钱赚吆喝”的模式能走到几时? 那么
分类: 其他 发布时间: 04-15 20:04 阅读次数: 0

国产数据库,是研发们的“离职创业咖啡店”吗?

武汉源创会回归,4月20聊聊大模型” 上周,《国产数据库圈,为啥那么多水货?》的讨论热度甚高,今天我们总结了一下直播嘉宾李令辉的看法,认同的不妨点个赞吧~ 分享嘉宾: 李令辉 云原生数据库 ClapDB 创始人,前乘法云 CTO,美洽 CTO,滴滴出行首席架构师。 目前致力于基于云上的基础设施新范式,提供新时代的分析型数据服务。 ClapDB 是一款重头开始基于云原生架构设计和实现的数据库,充分利用现代云原生技术优势。采用 C++ 开发,期望给予更高的性能,让您可以在任意规模的数据下轻松快速得
分类: 其他 发布时间: 04-15 19:54 阅读次数: 0

云计算 - 负载均衡SLB方案全解与实战

武汉源创会回归,4月20聊聊大模型” 云计算 - 负载均衡SLB方案全解与实战,介绍SLB的核心技术、用户最佳实践、阿里云 SLB产品举例、应用场景。 关注【TechLeadCloud】,分享互联网架构、云服务技术的全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室成员,阿里云认证的资深架构师,项目管理专业人士,上亿营收AI产品研发负责人。 一、引言 云计算作为现代信息技术的基石,正在以前所未有的速度推动着各行各业的数字化进程。其中,
分类: 其他 发布时间: 04-13 16:34 阅读次数: 0

云计算 - 以阿里云为例,企业上云策略全览与最佳实践

武汉源创会回归,4月20聊聊大模型” 云采用框架(Cloud Adoption Framework,简称CAF)为企业上云提供策略和技术的指导原则和最佳实践,帮助企业上好云、用好云、管好云,并成功实现业务目标。本云采用框架是基于服务大量企业客户的经验总结,将企业云采用分为四个阶段,并详细探讨企业应在每个阶段采取的业务和技术策略;同时,还提供了一系列最佳实践、文档和辅助工具,帮助云架构师、云管理团队等干系人能够实现组织协同达成目标。 关注【TechLeadCloud】,分享互联网架构、云服务技术
分类: 其他 发布时间: 04-13 16:24 阅读次数: 0

亮点抢先看!4月16-17日,百度Create大会开设“AI公开课”,大咖带你打造赚钱工具

武汉源创会回归,4月20聊聊大模型” 3月16日,2024百度Create AI开发者大会正式开放售票,嘉宾套票定价399元。据悉,本次大会以“创造未来(Create the Future)”为主题,设有20+深度论坛、超30节AI公开课、3000平AI互动体验区和AI音乐节等精彩环节,将于4月16日至17日在深圳国际会展中心(宝安)举办。 作为全球首个AI开发者大会,百度Create大会一直是科技突破与行业变革的风向标,吸引了海内外顶尖的AI专家、开发者和从业者踊跃参与。为满足不同观众的多样
分类: 其他 发布时间: 04-13 16:14 阅读次数: 0

探索云原生时代:技术驱动的业务架构革新

武汉源创会回归,4月20聊聊大模型” 云原生技术正重塑IT领域,本文深度剖析了其发展历程、核心概念、生态系统及实践案例,展望未来趋势,揭示了这一技术如何引领企业转型与创新。 关注【TechLeadCloud】,分享互联网架构、云服务技术的全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室成员,阿里云认证的资深架构师,项目管理专业人士,上亿营收AI产品研发负责人。 一、引言 在数字化浪潮中,云原生技术已成为推动企业快速创新的重要动力。本
分类: 其他 发布时间: 04-13 16:04 阅读次数: 0

Docker技术全景:推动云原生架构的关键力量

武汉源创会回归,4月20聊聊大模型” 本文深入探讨了Docker的发展历程、核心技术、在云服务中的应用以及其庞大生态系统。通过分析Docker如何革新容器化技术、加速云服务的发展,并构建一个多元化的生态系统,本文揭示了Docker在当代云计算领域中的重要角色及其对未来技术趋势的影响。 关注【TechLeadCloud】,分享互联网架构、云服务技术的全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室成员,阿里云认证的资深架构师,项目管理
分类: 其他 发布时间: 04-13 15:54 阅读次数: 0

Kubernetes Pod配置:从基础到高级实战技巧

武汉源创会回归,4月20聊聊大模型” 本文深入探讨了Kubernetes Pod配置的实战技巧和常见易错点。 关注【TechLeadCloud】,分享互联网架构、云服务技术的全维度知识。作者拥有10+年互联网服务架构、AI产品研发经验、团队管理经验,同济本复旦硕,复旦机器人智能实验室成员,阿里云认证的资深架构师,项目管理专业人士,上亿营收AI产品研发负责人 一、简介 Kubernetes基础概念回顾 在深入探讨Pod配置之前,让我们先快速回顾一下Kubernetes(K8s)的基础概念。Kub
分类: 其他 发布时间: 04-13 15:44 阅读次数: 0

13个干货议题!拓数派携众多大咖共话国产数据库未来趋势

武汉源创会回归,4月20聊聊大模型” 1月6日下午,由拓数派、PolarDB 开源社区、PostgreSQL 中文社区共同主办的《国产数据库共话未来趋势》技术沙龙将在上海举行。 本次沙龙现场大咖云集,来自拓数派、阿里云、平安科技等公司的众多行业技术大咖将与大家面对面交流,与广大技术爱好者交流分享。主题将围绕国产数据库未来趋势展开,内容涵盖数据库应用实践、管理、优化、维护等多个方面,干货多多! 除此之外,现场还将进行「SQL 优化王子」挑战赛,演讲嘉宾将和现场观众一起分享 SQL “坑”题,现场
分类: 其他 发布时间: 04-13 15:34 阅读次数: 0

拓数派加入 OpenCloudOS 操作系统开源社区,作为成员单位参与社区共建

武汉源创会回归,4月20聊聊大模型” 近日,拓数派签署 CLA(Contributor License Agreement 贡献者许可协议),正式加入 OpenCloudOS 操作系统开源社区。 拓数派(英文名称“OpenPie”)是国内基础数据计算领域的高科技创新企业。作为国内云上数据库和数据计算领域的引领者,以“Data Computing for New Discoveries”「数据计算,只为新发现」为使命,致力于在数字原生时代,运用突破性计算理论、独创的云原生数据库旗舰产品以及之上的
分类: 其他 发布时间: 04-13 15:24 阅读次数: 0

PieCloudDB Database 多种压缩手段:降低数据库存储成本

武汉源创会回归,4月20聊聊大模型” 随着企业数据规模的不断增长,数据库用户的关键业务系统面临着存储和处理庞大数据量的挑战。这不仅意味着更昂贵的 IT、数据成本,还包括更多的资源消耗和管理复杂性。为了满足企业的需求,云原生虚拟数仓 PieCloudDB Database 通过一系列的创新技术手段帮助企业降低成本并提高效率。 云原生虚拟数仓 PieCloudDB 从产品设计到产品研发,都注重为用户降本增效。PieCloudDB 采用存算分离架构,在冷热数据分析、数据波峰波谷场景下能显著降本增效。
分类: 其他 发布时间: 04-13 15:14 阅读次数: 0

一站式获取 PieCloudDB Database 产品、社区及数据库行业全动态

武汉源创会回归,4月20聊聊大模型” 第一部分 PieCloudDB Database 最新动态 PieCloudDB 推出社区版全新版本 11月14日,PieCloudDB 再度升级,推出社区版全新版本,免费面向用户开放下载,新版本将支持单机和多节点部署两种方式。欢迎试用! 下载链接:piestore.openpie.com 新增 Compaction 功能 PieCloudDB 新增 Compaction 功能,支持 VACUUM COMPACT 命令将指定表的小数据文件合并为指定大小的数
分类: 其他 发布时间: 04-13 15:04 阅读次数: 0

2023 龙蜥操作系统大会演讲实录:《兼容龙蜥的云原生大模型数据计算系统——πDataCS》

武汉源创会回归,4月20聊聊大模型” 本文主要分三部分内容:第一部分介绍拓数派公司,第二部分介绍 πDataCS 产品,最后介绍 πDataCS 与龙蜥在生态上的合作。 杭州拓数派科技发展有限公司(简称“拓数派”,英文名称“OpenPie”)是国内基础数据计算领域的高科技创新企业。作为国内云上数据库和数据计算领域的引领者,以“Data Computing for New Discoveries”「数据计算,只为新发现」为使命,致力于在数字原生时代,运用突破性计算理论、独创的云原生数据库旗舰产品
分类: 其他 发布时间: 04-13 14:54 阅读次数: 0

足不出户闹元宵,挑战 IT 人专属灯谜!

武汉源创会回归,4月20聊聊大模型” 又是一年元宵时,火树银花人团圆 除了吃汤圆、闹花灯、舞龙舞狮之外 不猜灯谜怎么能叫过元宵节? 为此 PieCloudDB 社区准备了几道特别的灯谜 听说只有“IT人”才能答对全部哦~ 快带上你的小伙伴来挑战一下吧! JetBrains 全家桶 2024 首个大版本更新 (2024.1) 老乡鸡“开源”了 微软都打算付钱了,为何还是被骂“白嫖”开源? 【已恢复】腾讯云后台崩了:大量服务报错、控制台登入后无数据 德国也要“自主可控”,州政府将 3 万台 PC
分类: 其他 发布时间: 04-13 14:44 阅读次数: 0