有这样一种situation——我们需要根据此时的环境做出相应的行动,aim在于实现预期目标。
situation可以这样表示:
for(iter=START;iter!=END;iter++) #某个时间段 f(observation) #根据此刻观察到的环境采取相应行为
f(x)指的是从“此刻观察到的环境”到“采取某个特定的行为”的映射。
需要解决的问题是:找到最好的f(x)——“最好”指让我们最快实现目标。
有这样一种situation——我们需要根据此时的环境做出相应的行动,aim在于实现预期目标。
situation可以这样表示:
for(iter=START;iter!=END;iter++) #某个时间段 f(observation) #根据此刻观察到的环境采取相应行为
f(x)指的是从“此刻观察到的环境”到“采取某个特定的行为”的映射。
需要解决的问题是:找到最好的f(x)——“最好”指让我们最快实现目标。