您现在的位置是:网站首页> 新闻快讯> 软件使用 新闻快讯
最新解码器(最新解码器美国大英多少钱)
小玉2023-07-05【软件使用】
231人已围观
简介为什么传统的非线性优化需要一个很好的初值才能work,而神经网络却不需要呢?神经网络也需要吗,怎么可以说不需要?你知不知道早前的预训练跟现在根本

最新解码器(最新解码器美国大英多少钱)
最后更新:2023-07-05 05:49:51
推荐指数:
为什么传统的非线性优化需要一个很好的初值才能work,而神经网络却不需要呢?神经网络也需要吗,怎么可以说不需要?你知不知道早前的预训练跟现在根本没有关系?那会儿是先训练出一个自编码器,然后去掉解码器部分,将编码器训练好的参数保留下来,再开始在指定任务上使用梯度下降,否则就无法正常训练。你知不知道有很多人在研究各种参数初始化的方法,DNN使用xavier初始化、resnet使用he初始化、LSTM的kernel使用正交初始化以及forgetbias使用全一初始化......除了参数初始化方法,还有自适应优化器、各种归一化方法等,这些研发成果让原本需要繁琐预训练的深度学习框架,都可以直接进行训练,只是你不知道而已。到目前为止,神经网络的优化问题还没被完全解决,而训练一个包含千亿参数的大型Transformer仍然是一件非同寻常的事情。
很赞哦! (0)
上一篇:打字拼音输入法(智能拼音输入法)
相关文章
文章评论
验证码: