文章主要内容总结
该论文提出了一种基于大型语言模型(LLM)的Text2Model框架,旨在将自然语言描述的化学反应器场景自动转换为可模拟的Modelica代码。研究团队通过以下步骤验证了方法的有效性:
- 合成数据集构建:设计26种不同类型的反应器模板(包括ODE/DAE系统、可逆/不可逆反应、不同操作模式),生成988个带有LaTeX描述的Q&A对。
- 模型微调:使用低秩适应(LoRA)技术对Llama 3.1 8B Instruct模型进行监督微调,重点优化Modelica代码生成能力。
- 多模型对比:将微调后的模型与基线Llama模型及GPT4o进行对比,通过8类错误指标(如语法错误、单位转换错误、方程结构错误等)评估生成代码的准确性。
- 泛化能力测试:设计4类未见场景(如连续反应、多组分系统)验证模型的扩展性。
创新点
- 领域特定代码生成:首次将LLM应用于动态化学反应器模型生成,突破了传统领域特定语言(DSL)的使用门槛。
- 合成数据增强<