深入浅出之DarkNet网络-活动速递-战纪无双网游活动聚合网

深入浅出之DarkNet网络

2024-07-06

一、VGG网络

深入浅出之VGGNet网络-CSDN博客文章浏览阅读375次，点赞2次，收藏2次。VGGNet（Visual Geometry Group Network）是一种深度卷积神经网络，由牛津大学计算机视觉组（Visual Geometry Group）的研究团队于2014年提出。VGGNet在当时的ImageNet图像识别挑战中取得了优异的表现，并成为了深度学习和计算机视觉领域中的经典模型之一。以下是对VGGNet的详细解析：VGGNet提供了多种网络结构，如VGG-11、VGG-13、VGG-16和VGG-19等，这些网络结构的基本架构相似，但卷积核的数量和深度有所不同。以VGG-16为例_vggnethttps://blog.csdn.net/a8039974/article/details/141906452https://blog.csdn.net/a8039974/article/details/141906452

VGGNet各级别网络结构图

VGG16包含了16个隐藏层（13个卷积层+3个全连接层），如图中的D列所示

VGG19包含了19个隐藏层（16个卷积层+3个全连接层），如图中的E列所示

VGG网络的结构非常一致，从头到尾全部使用的是3x3的卷积核和2x2的池化核

二、NIN网络

深入浅出之NIN网络-CSDN博客文章浏览阅读1.2k次，点赞27次，收藏11次。NIN网络由加州大学伯克利分校的研究团队提出，并在《Network In Network》论文中进行了详细阐述。该论文发表于ICLR-2014，NIN以一种全新的角度审视了卷积神经网络中的卷积核设计，通过引入子网络结构代替纯卷积中的线性映射部分，从而提高了网络的表达能力和非线性特性。_nin网络https://blog.csdn.net/a8039974/article/details/143110885https://blog.csdn.net/a8039974/article/details/143110885NiN块以一个普通卷积层开始，后面是两个1×1的卷积层。这两个1×1卷积层充当带有ReLU激活函数的逐像素全连接层。第一层的卷积窗口形状通常由用户设置。随后的卷积窗口形状固定为1×1。

三、Darknet 19

3.1 概述

Darknet-19 是Joseph Redmon 于2016年提出的。 Darknet-19 是 YOLO v2 的 backbone。Darknet-19 总共有 19 层 conv 层， 5 个 maxpooling 层。Darknet-19 吸收了 VGG16, NIN 等网络的优点，网络结构小巧，但是性能强悍。

提出背景：

Darknet19是YOLOv2目标检测算法中的骨干网络，由Joseph Redmon于2016年提出。它旨在通过紧凑的网络结构实现高效的目标检测性能。

主要贡献：

Darknet19结合了VGG16和NIN的优点，设计了一个轻量级的卷积神经网络，用于目标检测任务。它在保持与ResNet相当分类精度的同时，提供了更快的计算速度。

特点：

结构紧凑，参数少，计算效率高。

融合了多种网络结构的优点，如VGG的卷积核大小和NIN的1x1卷积核。

在计算速度和精度之间取得了良好的平衡。

优缺点：

优点：计算速度快，模型参数少，易于部署。

缺点：随着更复杂的网络结构出现，Darknet19的表达能力可能受限，特别是在处理更复杂场景或更高精度要求的任务时。

应用场景：

Darknet19广泛应用于目标检测任务，特别是在实时性要求较高的场景，如自动驾驶、视频监控等领域。同时，它也可以用于图像分类等任务。

3.2 网络结构：

Darknet19包含19个卷积层，5个最大池化层，无全连接层，使用了Avgpool。卷积层主要使用3x3的卷积核，部分层使用1x1卷积核进行特征降维。

实际输入为416 ∗ 416 416*416416∗416

没有FC层，5次降采样(MaxPool)，19个卷积层

使用Batch Normilazation来让训练更稳定，加速收敛，使model规范化。

使用Global Average Pooling

YOLOV2网络结构

3.3 darknet 19相对VGG优势

Darknet-19相对于VGG的优势主要体现在以下几个方面：

1. 网络结构的简洁性与高效性

Darknet-19：网络结构相对简洁，主要由卷积层、池化层和批量归一化层组成，没有VGG中那么多的全连接层。这种设计使得Darknet-19在保持高性能的同时，减少了计算量和参数数量，提高了计算效率。

VGG：虽然VGG网络在图像分类等任务中表现出色，但其网络结构相对较深且复杂，包含多个全连接层，这在一定程度上增加了计算负担和参数数量。

2. 参数量与计算量

Darknet-19：通过精心设计的网络结构和参数配置，Darknet-19在保持高性能的同时，显著减少了参数量和计算量。这使得Darknet-19在资源受限的环境下（如移动设备或嵌入式系统）具有更好的应用前景。

VGG：虽然VGG通过堆叠多个小卷积核（如3x3）来减少参数数量并降低过拟合风险，但其整体参数量和计算量仍然相对较大。

3. 训练与收敛速度

Darknet-19：由于其简洁的网络结构和较少的参数量，Darknet-19在训练过程中通常具有较快的收敛速度。这意味着在相同的时间内，Darknet-19可以完成更多的训练迭代，从而更快地达到或接近最优性能。

VGG：虽然VGG也能够在训练过程中逐渐收敛并达到较高的性能水平，但由于其网络结构的复杂性和较大的参数量，其收敛速度可能相对较慢。

4. 泛化能力与适应性

Darknet-19：由于其简洁而高效的网络设计，Darknet-19在多个数据集和任务上均表现出良好的泛化能力和适应性。这使得Darknet-19能够广泛应用于各种计算机视觉任务中。

VGG：VGG同样具有较强的泛化能力和适应性，但其相对复杂的网络结构可能在一定程度上限制了其在某些特定场景下的应用。

5. 应用场景

Darknet-19：由于其高效性和简洁性，Darknet-19特别适用于对计算资源和存储资源有严格限制的应用场景，如移动设备、嵌入式系统以及实时图像处理等。

VGG：VGG则更适用于对计算资源和存储资源要求相对宽松的应用场景，如高性能计算集群、数据中心等。

综上所述，Darknet-19相对于VGG的优势主要体现在网络结构的简洁性与高效性、参数量与计算量的减少、训练与收敛速度的加快以及泛化能力与适应性的提升等方面。这些优势使得Darknet-19在资源受限的环境下具有更好的应用前景和竞争力。

3.4 darknet-19和vgg-16哪个更优

Darknet-19和VGG-16各有其优势和适用场景，无法简单地判断哪个更优，而是需要根据具体的应用需求和资源限制来选择。以下是对两者优缺点的详细比较：

Darknet-19的优势：

网络结构简洁高效：Darknet-19的网络结构相对简洁，主要由卷积层、池化层和批量归一化层组成，没有复杂的全连接层，这减少了计算量和参数数量，提高了计算效率。

计算速度快：由于其简洁的网络结构和较少的参数量，Darknet-19在处理图像时的速度通常比VGG-16更快。例如，在处理一张图片时，Darknet-19可能比VGG-16快6倍左右。

训练收敛快：较少的参数和计算量使得Darknet-19在训练过程中通常具有较快的收敛速度，能够更快地达到或接近最优性能。

适用于资源受限环境：由于其高效性，Darknet-19特别适用于对计算资源和存储资源有严格限制的应用场景，如移动设备、嵌入式系统等。

VGG-16的优势：

性能稳定：VGG-16作为一种经典的卷积神经网络架构，经过长时间的验证和优化，其性能相对稳定可靠。

准确率高：在多个基准测试上，VGG-16都表现出了较高的准确率，尤其是在图像分类等任务中。

可扩展性强：VGG-16的网络结构具有一定的可扩展性，可以通过增加卷积层或全连接层等方式来进一步提升性能。

适用于复杂任务：由于其较深的网络结构和强大的特征提取能力，VGG-16适用于处理更复杂的计算机视觉任务。

综合考虑：

如果应用场景对计算速度和资源限制有较高要求，且对准确率的要求不是极端严格，那么Darknet-19可能是一个更好的选择。

如果应用场景对准确率有较高要求，且计算资源和存储资源相对充足，那么VGG-16可能更适合。

总之，Darknet-19和VGG-16各有千秋，选择哪个更优取决于具体的应用需求和资源限制。在实际应用中，可以根据具体情况进行权衡和选择。

3.5 pytorch实现

class DarkNet19(nn.Module):

"""DarkNet19 """

def __init__(self, num_classes: int = 1000, init_weight: bool = True) -> None:

super().__init__()

if init_weight:

self.apply(_initialize_weights)

self.features = nn.Sequential(

Conv(in_channels=3, out_channels=32, kernel_size=3),