AI 编程与研发效能论坛 笔记摘录

大模型出来之后,90%的技能好像价值归零了,但是由于杠杆作用,剩余的10%的技能则放大了1000倍。                     —— Kent  Beck

目录

LLM涉及到的领域

LLM涉及到的技术

关键问题与技术挑战

企业面临的挑战

AI编程是不是软件工程的一颗银弹?


 LLM涉及到的领域

  • NLP/ML
  • 提示工程
  • 知识工程
  • 多任务调度
  • 算法优化

LLM涉及到的技术

  • 算法:深度学习、强化学习、迁移学习

  • 大语言模型预训练技术,包括构建预训练系统

  • 参数高效微调技术

  • 数据治理技术,包括预训练数据、微调数据

  • 模型缩放技术

  • 安全、可信、稳健性


关键问题与技术挑战

关键技术 具体内容 所属分类
中文友好的代码生成
  • 在保障模型性能的条件下,增强中文语义的理解能力,满足利用中文/英文描述同等的代码生成能力
模型优化
Prompt
  • 判断用户输入的任务描述完整性和合理性,并通过交互明确意图,提高代码生成准确率
  • Prompt结合精准上下文,扩大模型生成感知野
模型优化
AI Agent 探索
  • 结合预训练模型,在Agent逻辑下,完成复杂任务的精准生成与推理
  • 结合记忆模块,进行搜索增强,减少模型幻觉,提升回答准确率

模型优化

工程优化

体验评估与优化
  • 构建客观且贴近真实工程的评估指标/手段
工程优化
模型在线学习
  • 基于用户的显式和隐式反馈对在线的大模型进行微调,实现在线模型实时更新
模型优化
低成本SFT
  • 如何实现各种研发场景的训练/验证数据集快速低成本建设,以及模型的训练以及自动验证部署
  • 模型参数外挂等技术,实现低成本训练与数据隔离
模型优化
后处理
  • 根据项目上下文,检查和修复所生成代码的编译运行错误
  • 结合单元测试,修复生成程序中的逻辑性错误

模型优化

工程优化

模型量化
  • 在保证精度不过多下降的前提下,量化模型,支撑端测算力实现模型推断
工程优化

企业面临的挑战

  1. 算力硬件投入巨大
    1. >以2012年为分水岭,AI模型对算力的需求在仅仅6年间增长了300,000倍。
    2. >GPU 硬件性能每年增长1倍。
  2. 算力建设成本高昂
    1. >当今AI负载要求单机架具备20kw-40kw供电能力,未来可能增长到80kw。

    2. >大部分企业目前单机架供电能力在7~15kw左右

  3. 算力需求多样
    1. >单机单卡、单机多卡、多机多卡训练资源要求多样资源占用率、利用率高

    2. >开发人员数量众多,开发环境资源占用率高,利用率低


 AI编程是不是软件工程的一颗银弹?

可能是,目前的AI编程已经相当成熟,在有限的时间下,解决一道编程问题,专业的竞赛选手在AI的辅助下,可以在15分钟内提供满分求解代码。但需要认识到的一点,对于那些调用深度代码很高的项目,比如C++,项目的函数调用深度可以深入到10乃至18层。受限于目标视野,这时候使用AI进行编程将很难得到预想的效果,这也是未来需要进行解决的一个难题。

这是一个多角度的问题,因为现在一定程度上,很多互联网公司已经开始使用AI编程了;但很多从业人员对AI编程持有怀疑态度,对编码的可靠性存有疑问。

或许在未来的某一天,AI编程真的达到了很高的水准,并且得到了业内大部分人的认可和应用,这时候我们可以回过头说,这确实是一颗银弹,是一个普适的解决方式,是行业的巨大变革。

猜你喜欢

转载自blog.csdn.net/cold_code486/article/details/134020834