深度学习中类别激活热图可视化背后的思想-欧普

新闻动态

您现在的位置：首页 > 新闻动态>

深度学习中类别激活热图可视化背后的思想

时间：2023-06-30 | 来源:欧普

类别激活图(CAM)是一种用于分类任务的强大技术。它允许研究人员检查被分类的图像，并了解图像的哪些部分/像素对模型的最终输出有更大的贡献。基本上，假设我们构建一个CNN，目标是将人的照片分类为“男人”和“女人”，然后我们给它提供一个新照片，它返回标签“男人”。有了CAM工具，我们就能看到图片的哪一部分最能激活“Man”类。如果我们想提高模型的准确性，必须了解需要修改哪些层，或者我们是否想用不同的方式预处理训练集图像，这将非常有用。在本文中，我将向你展示这个过程背后的思想。为了达到这个目的，我会使用一个在ImageNet上预训练好的CNN, Resnet50。我在这个实验中要用到的图像是，这只金毛猎犬：首先，让我们在这张图上尝试一下我们预训练模型，让它返回三个最有可能的类别： from keras.applications.resnet50 import ResNet50 from keras.preprocessing import image from keras.applications.resnet50 import preprocess_input, decode_predictions import numpy as npmodel = ResNet50(weights='imagenet')img_path = 'golden.jpg' img = image.lo_img(img_path, target_size=(224, 224)) x = image.img_to_array(img) x = np.expand_dims(x, axis=0) x = preprocess_input(x)preds = model.predict(x) # decode the results into a list of tuples (class, description, probability) print('Predicd:', decode_predictions(preds, top=3)[0]) 如你所见，第一个结果恰好返回了我们正在寻找的类别：Golden retriver。现在我们的目标是识别出我们的照片中最能激活黄金标签的部分。为此，我们将使用一种称为“梯度加权类别激活映射(Grad-CAM)”的技术(官方论文：https://arxiv.org/abs/1610.02391)。这个想法是这样的：想象我们有一个训练好的CNN，我们给它提供一个新的图像。它将为该图像返回一个类。然后，如果我们取最后一个卷积层的输出特征图，并根据输出类别对每个通道的梯度对每个通道加权，我们就得到了一个热图，它表明了输入图像中哪些部分对该类别激活程度最大。让我们看看使用Keras的实现。首先，让我们检查一下我们预先训练过的ResNet50的结构，以确定我们想要检查哪个层。由于结构很长，我将在这里只显示最后的block： from keras.utils import plot_model plot_model(model) 让我们使用最后一个激活层activation_49来提取我们的feature map。 golden = model.output[:, np.argmax(preds[0])] last_conv_layer = model.get_layer('activation_49') from keras import backend as K grads = K.gradients(golden, last_conv_layer.output)[0] po_grads = K.mean(grads, axis=(0, 1, 2)) iterate = K.function([model.input], [pooled_grads, last_conv_layer.output[0]]) pooled_grads_value, conv_layer_output_value = iterate([x]) for i in range(pooled_grads.shape[0]): conv_layer_output_value[:, :, i] *= pooled_grads_value[i] heatmap = np.mean(conv_layer_output_value, axis=-1) import matplotlib.pyplot as plt heatmap = np.um(heatmap, 0) heatmap /= np.max(heatmap) plt.matshow(heatmap) 这个热图上看不出什么东西出来。因此，我们将该热图与输入图像合并如下: import cv2 img = cv2.imread(img_path) heatmap = cv2.resize(heatmap, (img.shape[1], img.shape[0])) heatmap = np.uint8(255 * heatmap) heatmap = cv2.applyColorMap(heatmap, cv2.COLORMAP_JET) merged= heatmap * 0.4 + imgplt.imshow(merged) 如你所见，图像的某些部分(如鼻子部分)特别的指示出了输入图像的类别。英文原文：https://valentinaalto.medium.com/class-activation-maps-in-deep-learning-14101e2ec7e1 本文转自：公园，作者：Valentina Alto，编译：ronghuaiyang，转载此文目的在于传递更多信息，版权归原作者所有。审核编辑：何安
欧普

上一篇： Unity中所有特殊的文件夹...
下一篇：模型训练拟合的分类和表现...

欧普

新闻动态

深度学习中类别激活热图可视化背后的思想

产品推荐

0769-87811966

友情链接