LSTM神经网络输入输出究竟是怎样的？

如题所述

推荐答案 2017-12-11

输入输出都是向量，或者说是矩阵。LSTM用于分类的话，后面一般会接softmax层。个人浅薄理解，拿动作识别分类举例，每个动作帧放入LSTM中训练，还是根据task来训练每个LSTM单元的Weights。所以LSTM的单元数量跟输入和输出都没有关系，甚至还可以几层LSTM叠加起来用。分类的话，一般用最后一个单元接上softmax层。LSTM结构是传统的RNN结构扩展，解决了传统RNN梯度消失/爆炸的问题，从而使得深层次的网络更容易训练。从这个角度理解，可能会容易很多。今年的ResNet也是使传统的CNN更容易训练weights。看来deeplearning越来越深是趋势啊。如果说训练，就一个关键，所谓LSTMUnroll，将RNN展开成一个静态的“并行”网络，内部有“侧向连接”，实现长的短时记忆功能（状态“记忆”在LSTMCell里）。如果说预测，也就一个关键，要将Cell的h和C弄出来，作为当前状态（也就是所谓“记忆”）作为init参数输入，这样，携带了当前记忆状态的网络，预测得到的就是下一个输入了，所谓的recurrent了。那份代码里还包含了一个使用cudnn的实现（built-inRNNoperator），这是一个高性能的版本，可以真正干活的。原来我也尝试搞懂一些天书般的公式，很快发现从那里入手是个错误。强烈推荐：理解LSTM网络（翻译自UnderstandingLSTMNetworks）只要有一点点CNN基础+半个小时，就可以通过这篇文章理解LSTM的基础原理。回答你的问题：和神经元个数无关，不知道你是如何理解“神经元”这个概念的，输入输出层保证tensor的维数和输入输出一致就可以了。

温馨提示：答案为网友推荐，仅供参考

当前网址：http://99.wendadaohang.com/zd/WeWXzzOtWW7XXBBzvB.html

其他回答

第1个回答 2017-12-11

常规feedforward输入和输出：矩阵输入矩阵形状：(n_samples,dim_input)输出矩阵形状：(n_samples,dim_output)注：真正测试/训练的时候，网络的输入和输出就是向量而已。加入n_samples这个维度是为了可以实现一次训练多个样本，求出平均梯度来更新权重，这个叫做Mini-batchgradientdescent。如果n_samples等于1，那么这种更新方式叫做StochasticGradientDescent(SGD)。Feedforward的输入输出的本质都是单个向量。常规Recurrent(RNN/LSTM/GRU)输入和输出：张量输入张量形状：(time_steps,n_samples,dim_input)输出张量形状：(time_steps,n_samples,dim_output)注：同样是保留了Mini-batchgradientdescent的训练方式，但不同之处在于多了timestep这个维度。Recurrent的任意时刻的输入的本质还是单个向量，只不过是将不同时刻的向量按顺序输入网络。所以你可能更愿意理解为一串向量asequenceofvectors，或者是矩阵。

第2个回答 2017-12-11

关于如何输入的问题，LSTM是一个序列模型，对于输入数据也是一个序列，LSTM每个时间步处理的是序列中一个时刻的输入，比如你当前输入是一个汉字“我”，因为模型只能接受的是数值向量，因此需要embedding，“我”就需要变成了一个向量，假如是[0.1,0.8,3.2,4.3]（通过wordembedding技术获得），这里向量维度是4，那么就需要4个神经元去接收向量中的每个元素，而这四个神经元就构成了当前时刻的LSTMUnit，其他时刻也是这样，从而完成输入。因此就可以知道输入层神经元（LSTMunit中神经元数）的个数等于词向量的size。

相似回答

LSTM神经网络输入输出究竟是怎样的答：LSTM的三个门输出数字和向量的情况都有。门（input，forget，output）输出的维度和cell状态的维度一致即可。也就是说三个门的输出分别控制被控制向量（cell input，cell（t-1），cell（t））中的元素。举个例子，如果cell状态的维度是1，那么被控制向量（cell input，cell（t-1），cell（t））的维度...

LSTM神经网络输入输出究竟是怎样的答：神经网络利用现有的数据找出输入与输出之间得权值关系（近似），然后利用这样的权值关系进行仿真，例如输入一组数据仿真出输出结果，当然你的输入要和训练时采用的数据集在一个范畴之内。例如预报天气：温度湿度气压等作为输入天气情况作为输出利用历史得输入输出关系训练出神经网络，然后利用这样的神经网络输入今...

lstm做交通预测的输入输出是什么样的答：RNN 和 LSTM 模型时间序列模型最常用最强大的的工具就是递归神经网络（recurrent neural network, RNN）。相比与普通神经网络的各计算结果之间相互独立的特点，RNN的每一次隐含层的计算结果都与当前输入以及上一次的隐含层结果相关。通过这种方法，RNN的计算结果便具备了记忆之前几次结果的特点。典型的RNN网...

LSTM模型分析答：LSTM模型：时间序列与空间结构数据的处理专家本文将深入探讨LSTM模型，一种递归神经网络(RNN)的革新设计，专为解决时间序列数据中的长期依赖问题而生，同时也能应用于空间结构数据的处理。如图1所示，LSTM凭借其独特的门控机制（输入门、遗忘门、输出门）实现了突破。门控机制的实现细节遗忘门：通过前单元...

直观理解LSTM(长短时记忆网络)答：LSTM也有这样的链式结构，但其重复模块内部的机构不同。具体如下：之下说明一下内部四个网络的具体意义。主要分为：单元状态 + 门限。单元状态：让信息以不变的方式向下流动，相当于一个传送带，但传送带上的东西会随着他通过每一个重复模块基于当时的输入有所增减。门限：有能力向单元状态增加或者剔除...

十分钟掌握RNN与LSTM原理及其结构应用(Seq2Seq & Attention机制)_百度...答：深度探索：RNN与LSTM的基石与应用世界</ RNN，即循环神经网络，以其独特的优势在处理序列数据时展现出惊人的记忆能力。它的核心原理和结构包括单向和双向的简单设计，以及多输入单输出的灵活应用。在文本分类、图像描述和自编码器翻译等任务中，RNN发挥着不可忽视的作用。Seq2Seq的魔法：注意力的力量</ ...

理解LSTM 网络答：我们会一步一步地剖析 LSTM 解析图。现在,我们先来熟悉一下图中使用的各种元素的图标。在上面的图例中,每一条黑线传输着一整个向量,从一个节点的输出到其他节点的输入。粉色的圈代表按位 pointwise 的操作,诸如向量的和,而黄色的矩阵就是学习到的神经网络层。合在一起的线表示向量的连接,分开的线表示内容被...

长短期记忆网络(LSTM)答：1997年，Sepp Hochreiter和Jürgen Schmidhuber这对神经网络领域的先驱，首次提出了LSTM，它的目标直指RNN在长序列学习中的挑战，特别是如何保持信息的连续流动。他们独创的“门控机制”赋予了网络选择性记忆和遗忘的能力，包括输入门、遗忘门和输出门，这些组件共同作用于单元状态，赋予了LSTM捕捉长期依赖关系...

lstm具有什么特点答：一个cell当中被放置了三扇门，分别叫做输入门、遗忘门和输出门。一个信息进入LSTM的网络当中，可以根据规则来判断是否有用。只有符合算法认证的信息才会留下，不符的信息则通过遗忘门被遗忘。说起来无非就是一进二出的工作原理，却可以在反复运算下解决神经网络中长期存在的大问题。目前已经证明，LSTM是...

大家正在搜

神经网络是什么什么是输入输出输入输出的功能输入输出是什么意思基于神经网络 elman神经网络 RBF神经网络 hopfield神经网络神经网络使用