从BOSS上挖掘 人工智能岗位 需要掌握的技能
一、岗位要求
工程基础能力扎实,熟练掌握python/C++/Java等至少一门编程语言以及常见的机器学习框架tensorflow/pytorch/caffe等至少一个;
有相关NLP或大模型项目经验者优先 ;
对NLP技术如语义表示、问答、理解、生成等,有深入研究或实际项目经验者优先;
对大模型训练、推理和应用开发有深入的了解和实践经验,有大模型应用或相关平台、AI云基础设施等产品经验者优先,有AI明星创业公司经历者优先;
熟悉CNN、RNN,LSTM,LLAMA,LLAMA2等深度神经网络模型,具备大模型训练调优经验者优先考虑;
有基于LLM(百亿以上)的相关研究和实践经验,并有相关顶会论文至少1篇
候选人应至少对如下的一个或多个LLM相关技术有深入了解和实践:复杂推理、长上下文(long context kernel)、预训练、对齐(Alignment)、指令微调、模型度量和分析
参与过知名商业大模型算法研发的优先(如: ChatGPT、Claude、讯飞星火、ChatGLM、文心一言、阿里通义、 MinMax)
精通TensorFlow/PyTorch/Megatron等深度学习训练或推理框架底层原理,熟悉3D并行训练技术原理
对大模型有技术热情,熟悉GPT/BERT/llama/GLM等模型的结构和原理
熟悉语言大模型基本原理及应用,具备千亿级别参数大模型设计、研发或调优经验
主导过自然语言算法或语言大模型(大于300亿参数)方向研发工作,或发表过相关顶会、期刊论文
参与过主流榜单评测,有多个语言大模型主流评测榜单上进入前五的记录优先;
1基于AI大模型,构建代码补全、代码CR意见生成、单元测试生成、代码优化等代码领域的研发辅助产品能力;
构建和维护代码数据研制流水线,从不同的代码数据源中提取、转换和加工代码数据,以支持大模型的代码能力的训练;
通过代码大模型的Prompt工程、RAG工程、SFT和DPO等手段,优化模型在特定业务场景的性能。
计算机科学、软件工程、人工智能或相关专业,本科及以上学历,3年以上研发经验;
熟练掌握Python编程语言,熟悉常见的编程语言和开发工具,熟练掌握算法与数据结构、能熟练的进行面向对象的程序设计与开发,编码习惯好;同时擅长多门编程语言(如Java、Go、C/C++、JavaScript等)者优先;
对大模型相关技术(预训练、模型微调、推理性能优化,AI Agent等)有系统的学习认知和实际项目经验,有较深刻的大模型业务落地实战经验者优先;
熟悉大模型应用的全链路技术,包括训练、微调、评估、优化及产品应用经验;
熟悉传统的自然语言处理技术,包括分类、匹配、转换、抽取等;
具备丰富的AIGC应用交付经验,例如知识库问答、信息抽取等,熟悉AIGC在场景应用的全流程;
二、LLM学习图谱