non-saturating neurons非饱和神经元

news/2024/11/9 15:52:42

输出saturating neurons的activation:

  • sigmoid: input neurons的值会被挤压到[0,1]的区间
  • tanh:input neurons的值会被挤压到[-1,1]的区间输出

non-saturating neurons 的activation:

  • relu:input neurons的值,要么变0, 要么保持原值(无挤压,无最大最小值限制)l- eaky_relu:input neurons的值, 要么按照某比例缩小,要么保持原值(无挤压,无最大最小值限制)

为什么要用relu这样的能生成non-saturating neurons的non-linear activations, 而不用生成saturating neurons的sigmoid或tanh?

  • 规避vanishing, exploding of gradients 带来的gradient值过大过小,导致训练效率低下
  • 使用了RELU后,训练效率大幅提升

最后,回头问一句,什么是saturation? 为什么要叫saturating, non-saturating?

  • 因为有一个数学计算叫做saturation arithmetic
  • 这个算法就是要求将input的值全部变成在某个最大值和最小值之间的值。

在这里插入图片描述


http://www.niftyadmin.cn/n/4230177.html

相关文章

ActiveMQ的应用配置

2019独角兽企业重金招聘Python工程师标准>>> 管理页面 输入http://192.168.48.129:8161 点击 “ Manage ActiveMQ broker ”进入管理页面 初始默认密码 admin/admin 安全配置(消息安全) ActiveMQ 如果不加入安全机制的话&#xf…

The Cross-evaluation of Machine Learning-based Network Intrusion Detection Systems

本文提出了交叉检验的框架,指的是在不同的数据集进行交叉验证。we endorse the idea of cross-evaluating ML-NIDS by using malicious samples captured in different network datasets.1 By performing such cross-evaluations, it is possible to gauge addition…

图神经网络在反欺诈领域的应用

具体场景为图神经网络在恶意网址检测中的应用。 文章目录1. 场景介绍2. 节点刻画3. 恶意网址检测3.1 构建图3.2 模型设计3.3 评估结果1. 场景介绍 恶意网址检测中存在的难点有两方面: 一是借助短链接或跳转的方式到恶意网址,链接或跳转的前置页面特征不…

创造选择与选择权

当我发烧时,其实并不是我们发烧,而是被发烧所控制。同理,当我们变富后,也会被富裕所控制。These individuals have riches just as we say that we “have a fever,” when really the fever has us. I also have in mind that s…

用Markdown画流程图

流程图语法: 流程图的语法大体分为两部分:流程图元素定义部分;连接流程图元素部分,该部分用来指明流程图的执行走向。 定义元素的语法 tag>type: content:>url 实例: flowchat st>start: 开始 e>end: …

Burp Suite详细教程

文章目录1. Proxy模块2. Send to Intruder3. Repeater1. Proxy模块 抓包之前必须配置代理服务器,将代理IP设置为127.0.0.1,Chrome如下图所示 在Burp Suite中 使intercept is on 打开拦截: 在浏览器中打开页面,就能在软件中查看相…

复盘概念解释

复盘,围棋术语,也称 “复局”,指对局完毕后,复演该盘棋的记录,以检查对局中招法的优劣与得失关键。一般用以自学,或请高手给予指导分析。如按照棋谱排演,类如复盘,称 “ 打谱 ” 或 …