博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
DL:调优trick
阅读量:4060 次
发布时间:2019-05-25

本文共 282 字,大约阅读时间需要 1 分钟。

  • 优化器,例如SGD,adam
  • 学习率,乘以衰减系数
  • dropout层,防止过拟合
    (第一跑模型不加dropout,后期调优在LSTM后添加dropout层)
  • 变量初始化(正交分布初始化,正态分布初始化,均匀分布初始化)
  • 训练次数(验证集loss不减少则停止)
  • 正则化(LR)
  • 预训练(word2vec)
  • 激活函数(sigmoid计算量大,饱和区梯度消失;tanh梯度消失;ReLU解决梯度消失但某些神经元可能永远不会激活,leaky ReLU可以解决ReLU问题,但没有完全证明leaky ReLU好于ReLU)
  • 模型选择(CNN对轮廓敏感,RNN对连续序列敏感)

转载地址:http://ruwji.baihongyu.com/

你可能感兴趣的文章
我努力是因为, 我想通过自己,带给这个世界点什么!
查看>>
数据结构基础笔记、基础知识总结、周周练汇总,通过代码,更快速掌握数据结构和算法知识!
查看>>
赛前必看!!NOIP竞赛及CSP认证初赛赛前辅导详细视频教程!!!
查看>>
完美解决AttributeError: module ‘torchvision.models‘ has no attribute ‘detection‘
查看>>
VMWare报错:无法获得VMCI驱动程序的版本:句柄无效。
查看>>
重磅!AI与区块链技术知识分享交流会!特邀贾志刚老师、双一流211高校研究生!
查看>>
入门卷积神经网络必备,基础、理论、实战一网打尽!
查看>>
Java报错:No enclosing instance of type learnJ is accessible.
查看>>
java学习(2)类变量与实例变量
查看>>
java学习(3)类的四大特性1
查看>>
java学习(4)类的四大特性2之继承
查看>>
java学习(5)类的四大特性2之继承(方法重载)
查看>>
java学习(6)类的四大特性2之继承(方法覆盖)
查看>>
java学习(7)类的四大特性2之继承(抽象类)
查看>>
java学习(8)类的四大特性2之继承(接口)
查看>>
java学习(9)类的四大特性2之继承(final)
查看>>
java学习(10)数组
查看>>
java学习(11)位与进制
查看>>
java学习(12)集合(1)
查看>>
java学习(13)集合(2)
查看>>