神经网络是如何学习的? ---- 步长对模型训练的影响

所属课程: 人工智能大变革(16星期,32课时)

*irgil HE

9岁半

发布于:06-12
浏览数:34

 

在这节课上,我们学习了梯度下降的工作原理,特别是如何选择学习的步长。步长就像一个人在雪山下坡滑雪的时候,如果步长太大,比如说0.1米,那就可能滑得太快,过头了,没能到达最低点;如果步长太小,比如0.01米,就滑得太慢,可能要花很长时间才能到达目标。因此,我们需要找一个合适的步长,比如0.05米,这样能快点滑下去,抵达终点

我们还学习了为什么使用多个初始点更能帮助我们找到全局最小值。如果只从一个地方开始,可能会因为找错了方向而停下来。想象一下,如果我们从五个不同的地方开始找,就能更好地探索周围的环境,找到最低点。所以,

我明白了合适的步长和初始点是成功的关键!

你还没有登录,请先登录注册
  • 还没有人评论,欢迎说说您的想法!