DL：调优trick-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

DL：调优trick

阅读量：4060 次

发布时间：2019-05-25

本文共 282 字，大约阅读时间需要 1 分钟。

优化器，例如SGD，adam

学习率，乘以衰减系数

dropout层，防止过拟合
（第一跑模型不加dropout，后期调优在LSTM后添加dropout层）

变量初始化（正交分布初始化，正态分布初始化，均匀分布初始化）

训练次数（验证集loss不减少则停止）

正则化（LR）

预训练（word2vec）

激活函数（sigmoid计算量大，饱和区梯度消失；tanh梯度消失；ReLU解决梯度消失但某些神经元可能永远不会激活，leaky ReLU可以解决ReLU问题，但没有完全证明leaky ReLU好于ReLU）

模型选择（CNN对轮廓敏感，RNN对连续序列敏感）

转载地址：http://ruwji.baihongyu.com/

你可能感兴趣的文章

我努力是因为，我想通过自己，带给这个世界点什么！

数据结构基础笔记、基础知识总结、周周练汇总，通过代码，更快速掌握数据结构和算法知识！

赛前必看！！NOIP竞赛及CSP认证初赛赛前辅导详细视频教程！！！

完美解决AttributeError: module ‘torchvision.models‘ has no attribute ‘detection‘

VMWare报错：无法获得VMCI驱动程序的版本：句柄无效。

重磅！AI与区块链技术知识分享交流会！特邀贾志刚老师、双一流211高校研究生！

入门卷积神经网络必备，基础、理论、实战一网打尽！

Java报错：No enclosing instance of type learnJ is accessible.

java学习（2）类变量与实例变量

java学习（3）类的四大特性1

java学习（4）类的四大特性2之继承

java学习（5）类的四大特性2之继承（方法重载）

java学习（6）类的四大特性2之继承（方法覆盖）

java学习（7）类的四大特性2之继承（抽象类）

java学习（8）类的四大特性2之继承（接口）

java学习（9）类的四大特性2之继承（final）

java学习（10）数组

java学习（11）位与进制

java学习（12）集合（1）

java学习（13）集合（2）

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2024-09-19 23:20:08 当前IP: 3.137.180.214 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我