小批量随机梯度下降


Vincent
发布于 2024-04-07 / 6 阅读 / 0 评论 /
小批量随机梯度下降 到目前为止,我们在基于梯度的学习方法中遇到了两个极端情况: 使用完整数据集来计算梯度并更新参数,一次处理一个训练样本来取得进展。 二者各有利弊:每当数据非常相似时,梯度下降并不是非常“数据高效”。 而由于CPU和GPU无法充分利用向量化,随机梯度下降并不特别“计算高效”。 这暗示