神经网络的梯度分布感知 INT8 训练,Neurocomputing
来源: 时间:2024年12月13日 06:05
最近,低位宽量化(如 INT8)已普遍用于深度神经网络推理加速,但很少有研究人员关注低精度训练量化技术。考虑到深度神经网络训练中的反向传播计算量更大,并且比推理过程具有更大的能量开销,反向传播的量化对于超大规模神经网络的训练以及低-具有在线培训需求的功率器件。然而,梯度分布的形状特异性和连续可变性使得梯度量化变得困难,许多研究提出了各种复杂的梯度量化方法以减少训练精度损失。在本文中,我们提出了两种主要用于 INT8 量化训练的创新技术,包括用于量化各种特殊梯度分布的数据感知动态分段量化方案和用于实现较低量化误差的更新方向周期性搜索策略。然后,我们基于这两种方法构建了一个分布感知的 INT8 量化训练框架,并在各种模型和任务上进行了实验。实验结果表明,与不同模型(包括 ResNet、MobileNetV2、VGG、AlexNet 和 LSTM)上的全精度浮点对应方法相比,我们提出的 INT8 量化训练方法在最终训练精度上的损失可以忽略不计。通过用8位整数计算代替浮点计算进行网络训练,
"点击查看英文标题和摘要"
相关知识
感统训练知识百科
感统训练是什么?这些训练项目您需要知道
感统训练≠体育训练
感统训练方法.pdf
吴江感统训练
【产麻新谭】前置胎盘产妇产后出血人工智能神经网络预测模型的建立与验证
感统训练方法介绍 感统训练方法
感统训练和体育训练的区别
儿童感统认知训练,加力健康智能感统认知训练系统
感统训练跟体育运动没区别?错!! 感统训练≠体育运动!
网址: 神经网络的梯度分布感知 INT8 训练,Neurocomputing https://www.trfsz.com/newsview484925.html
推荐资讯
- 1发朋友圈对老公彻底失望的心情 12775
- 2BMI体重指数计算公式是什么 11235
- 3补肾吃什么 补肾最佳食物推荐 11199
- 4性生活姿势有哪些 盘点夫妻性 10428
- 5BMI正常值范围一般是多少? 10137
- 6在线基础代谢率(BMR)计算 9652
- 7一边做饭一边躁狂怎么办 9138
- 8从出汗看健康 出汗透露你的健 9063
- 9早上怎么喝水最健康? 8613
- 10五大原因危害女性健康 如何保 7828
资讯热点排名
资讯热点
