2025年rmsprop（rmsprop是什么算法）

科技前沿 • 2025-04-17 18:18 • 阅读 55

大家好，我是讯享网，很高兴认识大家。

考虑优化问题：

RMSProp (root mean square propagation) 算法是对 AdaGrad 算法的改进。在 AdaGrad 算法中，由于梯度分量的直接累加，步长随着迭代的进行而单调递减，这可能导致后期步长过小。PMSProp 则在此基础上引入权重参数，其对应的分量累计变为加权和

利用替代 AdaGrad 算法中的来对步长各分量进行修正。具体的迭代格式为：

输入信息：迭代初始值 x0 ，数据集大小 N ，样本梯度计算函数 pgfun ，目标函数值与梯度计算函数 fun 以及提供算法参数的结构体 opts 。

输出信息：迭代得到的解和包含迭代信息的结构体 out 。

从输入的结构体 opts 中读取参数或采取默认参数。

以 x0 为迭代初始点。计算初始点处的目标函数值和梯度，记初始时期 (epoch) 为 0。

gsum 用来存储梯度分量的累计量。 count 用于计算时期。

RMSProp 的迭代循环，以 opts.maxit 为最大迭代次数。

等概率地从中选取批量记录在 idx 之中，批量大小为 opts.batchsize. 计算对应的样本的梯度。

RMSProp 改进的自适应步长方法，每一步的梯度分量积累为当前梯度分量和上一步分量积累的加权平均。

以梯度分量积累来确定逐分量步长，在下降更快的方向的步长减小，而下降更慢的方向以更大的步长进行更新。

每当参与迭代的总样本次数超过数据集的总样本时，记为一个时期 (epoch)。每一个时期，记录当前的目标函数值和梯度范数，并令时期计数加一。

在页面实例：利用随机算法求解逻辑回归问题中，我们展示该算法的一个应用，并且与其它随机算法进行比较。

其它随机算法参见：随机梯度下降法、 AdaGrad、 AdaDelta、 Adam。

此页面的源代码请见： RMSProp.m。

此页面为《最优化：建模、算法与理论》、《最优化计算方法》配套代码。代码作者：文再文、刘浩洋、户将，代码整理与页面制作：杨昊桐。