Sinergym: 基于深度强化学习的建筑模拟控制环境搭建指南

sinergym Gym environment for building simulation and control using reinforcement learning 项目地址: https://gitcode.com/gh_mirrors/si/sinergym

项目概述

Sinergym 是一个基于 Gymnasium 接口设计的开源环境，专为利用深度强化学习（DRL）进行建筑模拟控制而生。它采用EnergyPlus Python API进行仿真引擎通信，并计划兼容更多如OpenModelica的仿真工具。本指南将引导您了解其关键组件，以及如何高效地设置和使用这个强大的工具。

1. 项目目录结构及介绍

Sinergym 的组织结构清晰，便于开发者理解和扩展：

sinergym/: 核心代码所在，包括环境定义、模拟器逻辑、建模、以及各种工具（如奖励函数和封装器）。
docs/: 使用Sphinx生成的在线文档，以 Restructured Text 格式详细描述了Sinergym的功能和用法。
examples/: 提供Jupyter笔记本形式的实例，帮助快速上手和理解Sinergym的应用场景。
tests/: 包含单元测试，确保代码质量与稳定性。
scripts/: 各种辅助脚本，用于训练代理、性能检查等，支持通过JSON配置。
LICENSE: 许可证文件，Sinergym遵循MIT许可证。

2. 项目的启动文件介绍

在Sinergym中，并没有单一的“启动文件”，而是通过Gymnasium接口来创建并交互环境。开始使用时，主要通过Python脚本与之互动。例如，以下是一个简单的启动和交互示例：

import gymnasium as gym
import sinergym

env = gym.make('Eplus-datacenter-mixed-continuous-stochastic-v1')
obs, info = env.reset()
terminated = truncated = False
R = 0.0

while not (terminated or truncated):
    action = env.action_space.sample()
    obs, reward, terminated, truncated, info = env.step(action)
    R += reward
print(f"总奖励：{R:.4f}")
env.close()

这段代码展示了如何导入Sinergym环境，执行基本的循环来模拟一个episode。

3. 项目的配置文件介绍

Sinergym的配置灵活性主要体现在环境的定制化上，而非传统意义上的单个配置文件。用户通过环境创建时指定的不同参数或通过自定义环境实现特定配置需求。比如，当创建环境时，可以通过环境ID指定不同的建筑模型和控制策略。对于更复杂的配置，如修改仿真细节、奖励机制或环境状态，用户通常通过编码方式调整，或利用Sinergym提供的API和脚本功能间接完成配置。

此外，虽然不直接提供一个预设的配置文件模板，但在scripts/目录下可能有示例脚本或环境初始化代码，这些可以看作是配置的间接体现，用户可以参考它们来调整自己的实验设置。

综上所述，Sinergym通过其模块化的设计和丰富的API提供了高度灵活的配置和启动流程，鼓励用户通过编程的方式进行个性化设定与集成。

sinergym Gym environment for building simulation and control using reinforcement learning 项目地址: https://gitcode.com/gh_mirrors/si/sinergym