神经网络时间序列分析,神经网络模型可解释性

时间序列模型和神经网络模型有何区别?

时间序列模型和神经网络模型有何区别？

时间序列的各个模型有什么区别和应用

信息管理安全模型有哪些

信息系统安全模型的构建是获得信息系统安全的基础和保障。安全模型是安全策略的一种精确描述,它在安全系统开发中起着关键的作用。

最早的安全模型是用于描述军事安全策略的,随着计算机的迅速普及,适应各种应用领域安全需求的安全模型不断地被提出。

随着计算机技术的发展与普及，许多企事业单位和管理机构都建立了自己的管理信息系统。在信息系统开发设计过程中，安全性能总是被放在首要的位置，成为信息系统生存的关键。

构建企业级信息系统的安全模型已日益成为一个重要的研究领域。信息系统安全性提升，主要来自信息安全产品和服务的贡献。

整个市场保持着以商用密码、防火墙、防病毒、入侵检测、身份识别、网络隔离、防信息泄露和备份恢复等产品为主导的格局，反垃圾邮件技术、大规模网络化技术和安全存储技术等方面取得很大进展。

很多信息系统安全模型为层次模型，可以把信息系统安全归结为一个层次模型，模型中各层之间互相依赖，下层向上层提供支持。云安全参考模型解决的是分类的关系。

。

有哪些深度神经网络模型？

目前经常使用的深度神经网络模型主要有卷积神经网络(CNN)、递归神经网络(RNN)、深信度网络(DBN)、深度自动编码器(AutoEncoder)和生成对抗网络(GAN)等。

递归神经网络实际.上包含了两种神经网络。

一种是循环神经网络(RecurrentNeuralNetwork);另一种是结构递归神经网络(RecursiveNeuralNetwork)，它使用相似的网络结构递归形成更加复杂的深度网络。

RNN它们都可以处理有序列的问题，比如时间序列等且RNN有“记忆”能力，可以“模拟”数据间的依赖关系。卷积网络的精髓就是适合处理结构化数据。

关于深度神经网络模型的相关学习，推荐CDA数据师的相关课程，课程以项目调动学员数据挖掘实用能力的场景式教学为主，在讲师设计的业务场景下由讲师不断提出业务问题，再由学员循序渐进思考并操作解决问题的过程中，帮助学员掌握真正过硬的解决业务问题的数据挖掘能力。

这种教学方式能够引发学员的独立思考及主观能动性，学员掌握的技能知识可以快速转化为自身能够灵活应用的技能，在面对不同场景时能够自由发挥。点击预约免费试听课。

预测模型可分为哪几类？

根据方法本身的性质特点将预测方法分为三类。1、定性预测方法根据人们对系统过去和现在的经验、判断和直觉进行预测，其中以人的逻辑判断为主，仅要求提供系统发展的方向、状态、形势等定性结果。

该方法适用于缺乏历史统计数据的系统对象。2、时间序列分析根据系统对象随时间变化的历史资料，只考虑系统变量随时间的变化规律，对系统未来的表现时间进行定量预测。

主要包括移动平均法、指数平滑法、趋势外推法等。该方法适于利用简单统计数据预测研究对象随时间变化的趋势等。

3、因果关系预测系统变量之间存在某种前因后果关系，找出影响某种结果的几个因素，建立因与果之间的数学模型，根据因素变量的变化预测结果变量的变化，既预测系统发展的方向又确定具体的数值变化规律。

扩展资料：预测模型是在采用定量预测法进行预测时，最重要的工作是建立预测数学模型。预测模型是指用于预测的，用数学语言或公式所描述的事物间的数量关系。

它在一定程度上揭示了事物间的内在规律性，预测时把它作为计算预测值的直接依据。因此，它对预测准确度有极大的影响。任何一种具体的预测方法都是以其特定的数学模型为特征。

预测方法的种类很多，各有相应的预测模型。趋势外推预测方法是根据事物的历史和现实数据，寻求事物随时间推移而发展变化的规律，从而推测其未来状况的一种常用的预测方法。

趋势外推法的假设条件是：(1)假设事物发展过程没有跳跃式变化，即事物的发展变化是渐进型的。

(2)假设所研究系统的结构、功能等基本保持不变，即假定根据过去资料建立的趋势外推模型能适合未来，能代表未来趋势变化的情况。由以上两个假设条件可知，趋势外推预测法是事物发展渐进过程的一种统计预测方法。

简言之，就是运用一个数学模型，拟合一条趋势线，然后用这个模型外推预测未来时期事物的发展。趋势外推预测法主要利用描绘散点图的方法(图形识别)和差分法计算进行模型选择。

主要优点是：可以揭示事物发展的未来，并定量地估价其功能特性。趋势外推预测法比较适合中、长期新产品预测，要求有至少5年的数据资料。组合预测法是对同一个问题，采用多种预测方法。

组合的主要目的是综合利用各种方法所提供的信息，尽可能地提高预测精度。

组合预测有2种基本形式，一是等权组合，即各预测方法的预测值按相同的权数组合成新的预测值；二是不等权组合，即赋予不同预测方法的预测值不同的权数。

这2种形式的原理和运用方法完全相同，只是权数的取定有所区别。根据经验，采用不等权组合的组合预测法结果较为准确。回归预测方法是根据自变量和因变量之间的相关关系进行预测的。

自变量的个数可以一个或多个，根据自变量的个数可分为一元回归预测和多元回归预测。同时根据自变量和因变量的相关关系，分为线性回归预测方法和非线性回归方法。

回归问题的学习等价于函数拟合：选择一条函数曲线使其很好的拟合已知数据且能很好的预测未知数据。参考资料：百度百科——预测模型参考资料：百度百科——定性预测。

三种时间序列模型

。

（1）如果除a0=1外所有其它的AR系数都等于零，则式（1-124）成为地球物理信息处理基础这种模型称为q阶滑动平均模型或简称为MA（q）模型（MovingAverageModel），其系统函数（传输函数）为地球物理信息处理基础模型输出功率谱为地球物理信息处理基础或地球物理信息处理基础这是一个全零点模型，因为它只有零点，没有极点（除了原点以外）。

如果模型的全部零点都在单位圆内，则是一个最小相位系统，且模型是可逆的。

（2）如果除b0=1外所有其它的MA系数都等于零，则式（1-124）成为地球物理信息处理基础这种模型称为p阶自回归模型或简称为AR（p）模型（AutoregressiveModel），其传输函数为地球物理信息处理基础模型输出功率谱为地球物理信息处理基础或地球物理信息处理基础显然，该模型只有极点，没有零点（除了原点以外），因此这是一个全极点模型，而且只有当极点都在单位圆内时，模型才稳定。

（3）设a0=1和b0=1，其余所有的ak和bk不全为零。在这种情况下，模型的差分方程、系统函数和输出功率谱分别用式（1-124）、式（1-123）和式（1-125）或式（1-126）表示。

分子部分称为MA部分，而分母部分称为AR部分，这两部分分别满足稳定性和可逆性的条件。

这是一个“极点—零点”模型，称为自回归滑动平均模型ARMA（p，q）模型（Autore-gressiveMovingAverageModel）。

在上面已谈到，实际中所遇到的功率谱可分为三种：一种是“平谱”，即白噪声谱，第二种是“线谱”，即由一个或多个正弦信号所组成的信号的功率谱，第三种介于二者之间，即既有峰点又有谷点的谱，这种谱称为ARMA谱。

可以看出，AR模型能突出反映谱的峰值，而MA模型能突出反映谱的谷值。

沃尔德（Wold）分解定理阐明了上述三类模型之间的联系，即：任何广义平稳随机过程都可分解成一个可预测（确定）的部分和一个不可预测（完全随机）的部分。

确定性随机过程是一个可以根据其过去的无限个取样值完全加以预测的随机过程。

例如，一个由纯正弦信号（具有随机相位以保证广义平稳）和白噪声组成的随机过程，可以分解成一个纯随机成分（白噪声）和一个确定性成分（正弦信号）。

或者可以把这种分解看成为把功率谱分解成一个表示白噪声的连续成分和一个表示正弦信号的离散成分（具有冲激信号的形式）。

Wold分解定理的一个推论是：如果功率谱完全是连续的，那么任何ARMA过程（Au-toregressiveMovingAverageProcess）或AR过程（AutoregressiveProcess）可以用一个无限阶的MA过程（MovingAverageProcess）表示。

Колмогоров（Kolmogorov）提出的一个具有类似结论的定理：任何ARMA或MA过程可以用一个无限阶的AR过程表示。

这些定理很重要，因为如果选择了一个不合适的模型，但只要模型的阶数足够高，它仍然能够比较好地逼近被建模的随机过程。

估计ARMA或MA模型参数一般需要解一组非线性方程，而估计AR模型参数通常只需解一组线性方程，因此，AR模型得到了深入的研究和广泛应用。

如果被估计过程是p阶自回归过程，那么用AR（p）模型即能很精确地模拟它；如果被估计过程是ARMA或MA过程，或者是高于p阶的AR过程，那么用AR（p）模型作为它们的模型时，虽然不可能很精确，但却可以尽可能地逼近它，关键是要选择足够高的阶数。

证明如下：假设MA模型为地球物理信息处理基础对上式进行Z变换得到X（z）=B（z）W（z）式中B（z）是MA信号模型的系统函数，或者说是bi（i=1，2，3，…）序列的Z变换。

设MA信号模型满足可逆性条件，即B-1（z）的存在，令B-1（z）=G（z）=1+g1z-1+g2z-2+g3z-3+…这样X（z）G（z）=（1+g1z-1+g2z-2+g3z-3+…）X（z）=W（z）则地球物理信息处理基础对上式进行Z反变换，得到x（n）+g1x（n-1）+g2x（n-2）+g3x（n-3）+…=w（n）上式就是x（n）的AR信号模型，因此证明了一个时间序列可以用有限阶MA信号模型表示时，也可以用无限阶的AR模型表示，对于ARMA模型也同样可以证明。

［例1-2］已知x（n）的功率谱为地球物理信息处理基础求出该模型的系统函数H（z）。

解：利用欧拉公式可以将Pxx（ejω）变为地球物理信息处理基础取z=ejω，则上式变为地球物理信息处理基础令，那么，，显然有理多项式B（z）的分子、分母都是最小相位的。

所以有地球物理信息处理基础与式（1-120）相比较，得。又由式（1-125）得到所求的系统函数地球物理信息处理基础。

如何在Python中用LSTM网络进行时间序列预测

时间序列模型时间序列预测分析就是利用过去一段时间内某事件时间的特征来预测未来一段时间内该事件的特征。

这是一类相对比较复杂的预测建模问题，和回归分析模型的预测不同，时间序列模型是依赖于事件发生的先后顺序的，同样大小的值改变顺序后输入模型产生的结果是不同的。

举个栗子：根据过去两年某股票的每天的股价数据推测之后一周的股价变化；根据过去2年某店铺每周想消费人数预测下周来店消费的人数等等RNN和LSTM模型时间序列模型最常用最强大的的工具就是递归神经网络（recurrentneuralnetwork,RNN）。

相比与普通神经网络的各计算结果之间相互独立的特点，RNN的每一次隐含层的计算结果都与当前输入以及上一次的隐含层结果相关。通过这种方法，RNN的计算结果便具备了记忆之前几次结果的特点。

典型的RNN网路结构如下：右侧为计算时便于理解记忆而产开的结构。

简单说，x为输入层，o为输出层，s为隐含层，而t指第几次的计算；V,W,U为权重，其中计算第t次的隐含层状态时为St=f(U*Xt+W*St-1)，实现当前输入结果与之前的计算挂钩的目的。

对RNN想要更深入的了解可以戳这里。

RNN的局限：由于RNN模型如果需要实现长期记忆的话需要将当前的隐含态的计算与前n次的计算挂钩，即St=f(U*Xt+W1*St-1+W2*St-2+...+Wn*St-n)，那样的话计算量会呈指数式增长，导致模型训练的时间大幅增加，因此RNN模型一般直接用来进行长期记忆计算。

LSTM模型LSTM（LongShort-TermMemory）模型是一种RNN的变型，最早由JuergenSchmidhuber提出的。

经典的LSTM模型结构如下：LSTM的特点就是在RNN结构以外添加了各层的阀门节点。

阀门有3类：遗忘阀门（forgetgate），输入阀门（inputgate）和输出阀门（outputgate）。

这些阀门可以打开或关闭，用于将判断模型网络的记忆态（之前网络的状态）在该层输出的结果是否达到阈值从而加入到当前该层的计算中。

如图中所示，阀门节点利用sigmoid函数将网络的记忆态作为输入计算；如果输出结果达到阈值则将该阀门输出与当前层的的计算结果相乘作为下一层的输入（PS：这里的相乘是在指矩阵中的逐元素相乘）；如果没有达到阈值则将该输出结果遗忘掉。

每一层包括阀门节点的权重都会在每一次模型反向传播训练过程中更新。更具体的LSTM的判断计算过程如下图所示：LSTM模型的记忆功能就是由这些阀门节点实现的。

当阀门打开的时候，前面模型的训练结果就会关联到当前的模型计算，而当阀门关闭的时候之前的计算结果就不再影响当前的计算。因此，通过调节阀门的开关我们就可以实现早期序列对最终结果的影响。

而当你不不希望之前结果对之后产生影响，比如自然语言处理中的开始分析新段落或新章节，那么把阀门关掉即可。

（对LSTM想要更具体的了解可以戳这里）下图具体演示了阀门是如何工作的：通过阀门控制使序列第1的输入的变量影响到了序列第4,6的的变量计算结果。

黑色实心圆代表对该节点的计算结果输出到下一层或下一次计算；空心圆则表示该节点的计算结果没有输入到网络或者没有从上一次收到信号。

Python中实现LSTM模型搭建Python中有不少包可以直接调用来构建LSTM模型，比如pybrain,kears,tensorflow,cikit-neuralnetwork等（更多戳这里）。

这里我们选用keras。（PS：如果操作系统用的linux或者mac，强推Tensorflow！！！

）因为LSTM神经网络模型的训练可以通过调整很多参数来优化，例如activation函数，LSTM层数，输入输出的变量维度等，调节过程相当复杂。这里只举一个最简单的应用例子来描述LSTM的搭建过程。

应用实例基于某家店的某顾客的历史消费的时间推测该顾客前下次来店的时间。

具体数据如下所示：消费时间2015-05-1514:03:512015-05-1515:32:462015-06-2818:00:172015-07-1621:27:182015-07-1622:04:512015-09-0814:59:56....具体操作：1.原始数据转化首先需要将时间点数据进行数值化。

将具体时间转化为时间段用于表示该用户相邻两次消费的时间间隔，然后再导入模型进行训练是比较常用的手段。

转化后的数据如下：消费间隔04418054....2.生成模型训练数据集（确定训练集的窗口长度）这里的窗口指需要几次消费间隔用来预测下一次的消费间隔。

这里我们先采用窗口长度为3，即用t-2,t-1,t次的消费间隔进行模型训练，然后用t+1次间隔对结果进行验证。数据集格式如下：X为训练数据，Y为验证数据。

PS：这里说确定也不太合适，因为窗口长度需要根据模型验证结果进行调整的。

X1 X2 X3 Y0 44 18 044 18 0 54.... 注：直接这样预测一般精度会比较差，可以把预测值Y根据数值bin到几类，然后用转换成one-hot标签再来训练会比较好。

比如如果把Y按数值范围分到五类（1：0-20，2：20-40，3：40-60，4：60-80，5：80-100）上式可化为：X1 X2 X3 Y0 44 18 044 18 0 4...Y转化成one-hot以后则是(关于one-hot编码可以参考这里)1 0 0 0 00 0 0 0 1...3.网络模型结构的确定和调整这里我们使用python的keras库。

（用java的同学可以参考下deeplearning4j这个库）。

网络的训练过程设计到许多参数的调整：比如需要确定LSTM模块的激活函数（activationfucntion）（keras中默认的是tanh）；确定接收LSTM输出的完全连接人工神经网络（fully-connectedartificialneuralnetwork）的激活函数（keras中默认为linear）；确定每一层网络节点的舍弃率（为了防止过度拟合（overfit）），这里我们默认值设定为0.2；确定误差的计算方式，这里我们使用均方误差（meansquarederror）；确定权重参数的迭代更新方式，这里我们采用RMSprop算法，通常用于RNN网络。

确定模型训练的epoch和batchsize（关于模型的这两个参数具体解释戳这里）一般来说LSTM模块的层数越多（一般不超过3层，再多训练的时候就比较难收敛），对高级别的时间表示的学习能力越强；同时，最后会加一层普通的神经网路层用于输出结果的降维。

典型结构如下：如果需要将多个序列进行同一个模型的训练，可以将序列分别输入到独立的LSTM模块然后输出结果合并后输入到普通层。

结构如下：4.模型训练和结果预测将上述数据集按4:1的比例随机拆分为训练集和验证集，这是为了防止过度拟合。训练模型。

然后将数据的X列作为参数导入模型便可得到预测值，与实际的Y值相比便可得到该模型的优劣。

实现代码时间间隔序列格式化成所需的训练集格式importpandasaspdimportnumpyasnpdefcreate_interval_dataset(dataset,look_back): """ :paramdataset:inputarrayoftimeintervals :paramlook_back:eachtrainingsetfeaturelength :return:convertanarrayofvaluesintoadatasetmatrix. """ dataX,dataY=[],[] foriinrange(len(dataset)-look_back): dataX.append(dataset[i:i+look_back]) dataY.append(dataset[i+look_back]) returnnp.asarray(dataX),np.asarray(dataY)df=pd.read_csv("path-to-your-time-interval-file") dataset_init=np.asarray(df) #ifonly1columndataX,dataY=create_interval_dataset(dataset,lookback=3) #lookbackifthetrainingsetsequencelength这里的输入数据来源是csv文件，如果输入数据是来自数据库的话可以参考这里LSTM网络结构搭建importpandasaspdimportnumpyasnpimportrandomfromkeras.modelsimportSequential,model_from_jsonfromkeras.layersimportDense,LSTM,DropoutclassNeuralNetwork(): def__init__(self,**kwargs): """ :param**kwargs:output_dim=4:outputdimensionofLSTMlayer;activation_lstm='tanh':activationfunctionforLSTMlayers;activation_dense='relu':activationfunctionforDenselayer;activation_last='sigmoid':activationfunctionforlastlayer;drop_out=0.2:fractionofinputunitstodrop;np_epoch=10,thenumberofepochestotrainthemodel.epochisoneforwardpassandonebackwardpassofallthetrainingexamples;batch_size=32:numberofsamplespergradientupdate.Thehigherthebatchsize,themorememoryspaceyou'llneed;loss='mean_square_error':lossfunction;optimizer='rmsprop' """ self.output_dim=('output_dim',8) self.activation_lstm=('activation_lstm','relu') self.activation_dense=('activation_dense','relu') self.activation_last=('activation_last','softmax') #softmaxformultipleoutput self.dense_layer=('dense_layer',2) #atleast2layers self.lstm_layer=('lstm_layer',2) self.drop_out=('drop_out',0.2) self.nb_epoch=('nb_epoch',10) self.batch_size=('batch_size',100) =('loss','categorical_crossentropy') self.optimizer=('optimizer','rmsprop') defNN_model(self,trainX,trainY,testX,testY): """ :paramtrainX:trainingdataset :paramtrainY:expectvalueoftrainingdata :paramtestX:testdataset :paramtestY:epectvalueoftestdata :return:modelaftertraining """ print"TrainingmodelisLSTMnetwork!" input_dim=trainX[1].shape[1] output_dim=trainY.shape[1]#one-hotlabel #printpredefinedparametersofcurrentmodel: model=Sequential() #applyingaLSTMlayerwithxdimoutputandydiminput.Usedropoutparametertoavoidoverfitting (LSTM(output_dim=self.output_dim, input_dim=input_dim, activation=self.activation_lstm, dropout_U=self.drop_out, return_sequences=True)) foriinrange(self.lstm_layer-2): (LSTM(output_dim=self.output_dim, input_dim=self.output_dim, activation=self.activation_lstm, dropout_U=self.drop_out, return_sequences=True)) #argumentreturn_sequencesshouldbefalseinlastlstmlayertoavoidinputdimensionincompatibilitywithdenselayer (LSTM(output_dim=self.output_dim, input_dim=self.output_dim, activation=self.activation_lstm, dropout_U=self.drop_out)) foriinrange(self.dense_layer-1): (Dense(output_dim=self.output_dim, activation=self.activation_last)) (Dense(output_dim=output_dim, input_dim=self.output_dim, activation=self.activation_last)) #configurethelearningprocess model.compile(,optimizer=self.optimizer,metrics=['accuracy']) #trainthemodelwithfixednumberofepoches (x=trainX,y=trainY,nb_epoch=self.nb_epoch,batch_size=self.batch_size,validation_data=(testX,testY)) #storemodeltojsonfile model_json=model.to_json() withopen(model_path,"w")asjson_file: json_file.write(model_json) #storemodelweightstohdf5file ifmodel_weight_path: if.exists(model_weight_path): os.remove(model_weight_path) model.save_weights(model_weight_path)#eg:model_weight.h5 returnmodel这里写的只涉及LSTM网络的结构搭建，至于如何把数据处理规范化成网络所需的结构以及把模型预测结果与实际值比较统计的可视化，就需要根据实际情况做调整了。