pytorch加载预训练模型与自己模型不匹配的解决方案-巨人网络通讯

pytorch加载预训练模型与自己模型不匹配的解决方案

pytorch中如果自己搭建网络并且加载别人的与训练模型的话，如果模型和参数不严格匹配，就可能会出问题，接下来记录一下我的解决方法。

两个有序字典找不同

模型的参数和pth文件的参数都是有序字典(OrderedDict)，把字典中的键转为列表就可以在for循环里迭代找不同了。

model = ResNet18(1)
model_dict1 = torch.load('resnet18.pth')
model_dict2 = model.state_dict()
model_list1 = list(model_dict1.keys())
model_list2 = list(model_dict2.keys())
len1 = len(model_list1)
len2 = len(model_list2)
minlen = min(len1, len2)
for n in range(minlen):
    if model_dict1[model_list1[n]].shape != model_dict2[model_list2[n]].shape:
        err = 1

自己搭建模型的注意事项

搭网络时要对照pth文件的字典顺序搭，字典顺序、权重尺寸(shape)和变量命名必须与pth文件完全一致。如果仅仅是变量命名不同，可采用类似的方法对模型的权重重新赋值。

model = ResNet18(1)
model_dict1 = torch.load('resnet18.pth')
model_dict2 = model.state_dict()
model_list1 = list(model_dict1.keys())
model_list2 = list(model_dict2.keys())
len1 = len(model_list1)
len2 = len(model_list2)
minlen = min(len1, len2)
for n in range(minlen):
    if model_dict1[model_list1[n]].shape != model_dict2[model_list2[n]].shape:
        continue
    model_dict1[model_list1[n]] = model_dict2[model_list2[n]]
model.load_state_dict(model_dict2)

完整的代码见自己搭建resnet18网络并加载torchvision自带权重

新增的改进代码

model_dict1 = torch.load('yolov5.pth')
model_dict2 = model.state_dict()
model_list1 = list(model_dict1.keys())
model_list2 = list(model_dict2.keys())
len1 = len(model_list1)
len2 = len(model_list2)
m, n = 0, 0
while True:
    if m >= len1 or n >= len2:
        break
    layername1, layername2 = model_list1[m], model_list2[n]
    w1, w2 = model_dict1[layername1], model_dict2[layername2]
    if w1.shape != w2.shape:
        continue
    model_dict2[layername2] = model_dict1[layername1]
    m += 1
    n += 1
model.load_state_dict(model_dict2)

如果因为模型不匹配，运行第14行语句后，可看自己情况手动对m或n加上1。

补充：pytorch的一些坑：用预训练的vgg模型的部分层的特征报错，如张量不匹配

看代码吧~

#打算取VGG19的第二个全连接层的输出，那么就需要构建一个类，这个类要包含VGG的全部卷积层，
#以及到第二个全连接层的全部网络还有他们对应的参数
class Classification_att(nn.Module):
    def __init__(self, rgb_range):
        super(Classification_att, self).__init__()
        self.vgg19 =models.vgg19(pretrained=True)
        vgg = models.vgg19(pretrained=True).features
        conv_modules = [m for m in vgg]
        self.vgg_conv = nn.Sequential(*conv_modules[:37])
        classfi = models.vgg19(pretrained=True).classifier
        classif_modules = [n for n in classfi]
        self.vgg_class = nn.Sequential(*classif_modules[:4])
        vgg_mean = (0.485, 0.456, 0.406)
        vgg_std = (0.229 * rgb_range, 0.224 * rgb_range, 0.225 * rgb_range)
        self.sub_mean = common.MeanShift(rgb_range, vgg_mean, vgg_std)
        for p in self.vgg_conv.parameters():
            p.requires_grad = False
        for p in self.vgg_class.parameters():
            p.requires_grad = False
        self.classifi = nn.Sequential(
            nn.Linear(4096, 1024),
            nn.ReLU(True),
            nn.Linear(1024, 256),
            nn.ReLU(True),
            nn.Linear(256, 64),
        )
 
    def forward(self, x):
        x = F.interpolate(x, size=[224, 224], scale_factor=None, mode='bilinear', 
        align_corners=False)
        x = self.sub_mean(x)
        x = self.vgg_conv(x)  
        x = self.vgg_class(x)  #执行这部报错，说张量不匹配

原因是因为卷积层的输出不能直接连接全连接层，即使输出的张量的总的大小是一致的

查看vgg的pytorch源码发现是

x = self.features(x)
x = self.avgpool(x)
x = torch.flatten(x, 1)
x = self.classifier(x)
#自己的代码没有torch.flatten(x, 1)这步

所以自己的少了一步

x = torch.flatten(x, 1)

补上就好了！

以上为个人经验，希望能给大家一个参考，也希望大家多多支持脚本之家。

您可能感兴趣的文章:

解决Pytorch 加载训练好的模型遇到的error问题
pytorch 更改预训练模型网络结构的方法
解决Pytorch修改预训练模型时遇到key不匹配的情况

上一篇：Python数据分析入门之教你怎么搭建环境
下一篇：python执行js代码的方法

pytorch加载预训练模型与自己模型不匹配的解决方案

pytorch中如果自己搭建网络并且加载别人的与训练模型的话，如果模型和参数不严格匹配，就可能会出问题，接下来记录一下我的解决方法。两个有序字典找不同模型的参数和pth文件的pytorch,加载,预,训练,模型,...

“浙江服务”，转型新动力

服务外包，这个很多人已经不陌生的词汇，第一次成为了我省五年规划的主角。在日前...

webcolct.exe - webcolct 是什么进程

进程文件： webcolct or webcolct.exe 进程名称： Webcolct 进程类别：存在安全风险的进程英文...

共祝华诞普强AI能力平台正式上线

你好，普强我在随着人机语音交互技术逐渐成熟，智能语音客服、智能车载语音助手...

天津智能电销卡办理办理服务商-诚信服务

天津智能电销卡办理办理服务商达到筛选意向客户、锁定目标客户、准确客户分类的营...

厦门联通38套餐电销卡（38元联通卡套餐介绍）

本文目录一览：1、电销卡在哪里办理2、电销卡是什么?3、电销卡有哪些优势?4、电销卡...

短视频代运营公司收费报价表明细你是否了解

现阶段市场上面有许多的短视频代运营公司，人们在选择代运营公司的时候，都会关注...

承担违反著作权合同民事责任的条件

著作权合同当事人承担违约责任，除了有损害事实之外，还应当同时具备以—F两个条件...

虽然iPhone 8首发遇冷，但在体验店大家还是很热情的嘛

iPhone 8上市接近一周，直营店门可罗雀的凄凉场景依然历历在目。大家纷纷唱衰iPhone ...

400呼叫中心解决方案

400呼叫中心解决方案是企业业务发展的核心基础，也是企业业务开展的有效工具，同时...

金华市稳定高频电话卡便宜

深圳移动联合华为、移动研究院，对现网上干扰问题进行稳定高频电话卡便宜深入分析...

长沙电销专用卡（长沙电销卡办理）

本文目录一览：1、电销卡怎么办理2、求告知现在那种手机卡适合电话营销3、专门打电...

电销外呼系统号码从哪来（电销外呼系统违法吗）

本篇文章给大家谈谈电销外呼系统号码从哪来，以及电销外呼系统违法吗对应的知识点...

电话外呼系统是如何收费（外呼系统多少钱）

本文目录一览： 1、外呼琐细一个几何钱，有哪些听命？ 2、外呼琐细安装需求哪些用度...

微信定位找不到我公司的地址，微信定位找不到我的店铺

为什么微信定位找不到自己公司位置？你可以直接在各大地图软件中提交你公司的地址...

400电话办理满意度调查有更多提高

每一个企业要想发展更好，都应该重视客服方面关注，如果客服方面无法得到要求，那...

pytorch加载预训练模型与自己模型不匹配的解决方案

全 部 栏 目

两个有序字典找不同

自己搭建模型的注意事项

新增的改进代码

看代码吧~

查看vgg的pytorch源码发现是

所以自己的少了一步

全部栏目