pytorch loss反向传播出错的解决方案-巨人网络通讯

pytorch loss反向传播出错的解决方案

今天在使用pytorch进行训练，在运行 loss.backward() 误差反向传播时出错：

RuntimeError: grad can be implicitly created only for scalar outputs

File "train.py", line 143, in train
loss.backward()
File "/usr/local/lib/python3.6/dist-packages/torch/tensor.py", line 198, in backward
torch.autograd.backward(self, gradient, retain_graph, create_graph)
File "/usr/local/lib/python3.6/dist-packages/torch/autograd/__init__.py", line 94, in backward
grad_tensors = _make_grads(tensors, grad_tensors)
File "/usr/local/lib/python3.6/dist-packages/torch/autograd/__init__.py", line 35, in _make_grads
raise RuntimeError("grad can be implicitly created only for scalar outputs")
RuntimeError: grad can be implicitly created only for scalar outputs

问题分析：

因为我们在执行 loss.backward() 时没带参数，这与 loss.backward(torch.Tensor(1.0)) 是相同的，参数默认就是一个标量。

但是由于自己的loss不是一个标量，而是二维的张量，所以就会报错。

解决办法：

1. 给 loss.backward() 指定传递给后向的参数维度：

loss = criterion(pred, targets)
loss.backward()
# 改为：
loss = criterion(pred, targets)
loss.backward(loss.clone().detach())

2. 修改loss函数的输出维度

把张量的输出修改为标量，比如说多多个维度的loss求和或求均值等。此方法对于某些任务不一定适用，可以尝试自己修改。

criterion = nn.L1Loss(reduction='none')
# 把参数去掉，改为：
criterion = nn.L1Loss()

这里顺便介绍一下pytorch loss函数里面的reduction 参数

在新的pytorch版本里，使用reduction 参数取代了旧版本的size_average和reduce参数。

reduction 参数有三种选择：

'elementwise_mean'：为默认情况，表明对N个样本的loss进行求平均之后返回(相当于reduce=True，size_average=True);

'sum'：指对n个样本的loss求和(相当于reduce=True，size_average=False);

'none'：表示直接返回n分样本的loss(相当于reduce=False)

补充：在Pytorch下，由于反向传播设置错误导致 loss不下降的原因及解决方案

在Pytorch下，由于反向传播设置错误导致 loss不下降的原因及解决方案

刚刚接触深度学习一段时间，一直在研究计算机视觉方面，现在也在尝试实现自己的idea，从中也遇见了一些问题，这次就专门写一下，自己由于在反向传播（backward）过程中参数没有设置好，而导致的loss不下降的原因。

对于多个网络交替

描述

简单描述一下我的网络结构，我的网络是有上下两路，先对第一路网络进行训练，使用groud truth对这一路的结果进行监督loss_steam1，得到训练好的feature.然后再将得到的feature级联到第二路，通过网络得到最后的结果，再用groud truth进行监督loss。

整个网络基于VGG19网络，在pytorch下搭建，有GPU环境：

出现的情况，loss_steam1不怎么下降

这个问题确实折麽自己一段时间，结果发现自己出现了一个问题，下面将对这个问题进行分析和解答：

PyTorch梯度传递

在PyTorch中，传入网络计算的数据类型必须是Variable类型， Variable包装了一个Tensor，并且保存着梯度和创建这个Variablefunction的引用，换句话说，就是记录网络每层的梯度和网络图，可以实现梯度的反向传递.
则根据最后得到的loss可以逐步递归的求其每层的梯度，并实现权重更新。

在实现梯度反向传递时主要需要三步：

1、初始化梯度值：net.zero_grad() 清除网络状态

2、反向求解梯度：loss.backward() 反向传播求梯度

3、更新参数：optimizer.step() 更新参数

解决方案

自己在写代码的时候，还是没有对自己的代码搞明白。在反向求解梯度时，对第一路没有进行反向传播，这样肯定不能使这一路的更新，所以我就又加了一步：

loss_steam1.backward( retain_graph = True) //因为每次运行一次backward时，如果不加retain_graph = True，运行完后，计算图都会free掉。

loss.backward()

这样就够了么？我当时也是这么认为的结果发现loss_steam1还是没有降，又愁了好久，结果发现梯度有了，不更新参数，怎么可能有用！

optimizer_steam1.step() //这项必须加
optimizer.step()

哈哈！这样就完成了，效果也确实比以前好了很多。

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。如有错误或未考虑完全的地方，望不吝赐教。

您可能感兴趣的文章:

pytorch 多个反向传播操作
pytorch中的自定义反向传播,求导实例
pytorch .detach() .detach_() 和 .data用于切断反向传播的实现
PyTorch: 梯度下降及反向传播的实例详解

上一篇：深度解析Django REST Framework 批量操作
下一篇：pytorch Variable与Tensor合并后 requires_grad()默认与修改方式

pytorch loss反向传播出错的解决方案

今天在使用pytorch进行训练，在运行 loss.backward() 误差反向传播时出错： RuntimeError: grad can be implicitly created only for scalar outputs File \"train.py\", line 143, in train loss.backward() File \"/usr/local/lib/pytpytorch,loss,反向,传,播出,...

和田地区电话机器人维修（机器人维修点附近）

本文目录一览： 1、科沃斯售后电话2、扫地机器人修理毛病及处理办法共享3、简述工业...

电销机器人不等同于骚扰电话

电话机器人，是魔，也是佛。只有自我否定，才能促进发展。工信部旗下的12321举报...

Win10怎么自动更新地图? win10设置自动更新地图的技巧

Windows10系统想要设置自动更新地图，该怎么操作呢？下面我们就来看看详细的教程。...

银行语音机器人

3 回访和核验：在很多业务场景里，客服需要给公司或网站的注册用户和服务客户一一...

电话机器人可以推销吗（电话机器人费用怎么收费）

本文目录一览：1、电销机器人打电话违法吗2、电销机器人会涉及违法吗?3、电话智能营...

商标与商品通用名称的关系

商品名称,是指用以区别其他商品而用在本商品上的称谓,分为通用名称和特有名称。商...

秦皇岛不封号电话营销系统怎么办理,群呼线路-值得推荐

秦皇岛不封号电话营销系统怎么办理,群呼线路接通数、人工抢接数等多项数据,服务不...

电销卡服务优势会是什么?

目前市场上有很多品牌的电销卡,虽然品牌不同,但是它们的功能和特点都是相同的.电销...

电销大王卡犯法吗（推销大王卡有什么收入）

本文目录一览：1、腾讯大王卡可以网上注销吗,注销要钱吗2、大王卡不注销会追究吗...

大数据智能营销系统多少钱

大数据智能营销系统是一款包含：精细客源采集，自动微信营销，精细引流客户为一体...

AI决定物联网，物联网改写家居市场格局

1、数字化社会的到来信息化、技术化的发展都在推进数字化社会的进程。 80年代，电...

武汉智能电销机器人报价（武汉电话机器人）

今日给各位共享武汉智能电销机器人报价的常识，其间也会对武汉电话机器人进行解说...

广东中麦电销卡如何使用（10020中麦通信官网话费充值）

本文目录一览：1、电销卡有哪些优势?2、怎样使用电销电话卡不会被封?这些技巧需要掌...

福建企业外呼系统（电话自动外呼系统）

今天给各位分享福建企业外呼系统的知识，其中也会对电话自动外呼系统进行解释，如...

400防伪电话是多少400电话有哪些功能能够避免客户流失？

当客户拨打公司的400电话,进入防伪码查询节点,首先会听到一段彩铃介绍:欢迎致电某某...

pytorch loss反向传播出错的解决方案

全 部 栏 目

问题分析：

解决办法：

1. 给 loss.backward() 指定传递给后向的参数维度：

2. 修改loss函数的输出维度

这里顺便介绍一下pytorch loss函数里面 的reduction 参数

对于多个网络交替

描述

整个网络基于VGG19网络，在pytorch下搭建，有GPU环境：

出现的情况，loss_steam1不怎么下降

PyTorch梯度传递

解决方案

全部栏目

这里顺便介绍一下pytorch loss函数里面的reduction 参数