计算机视觉基础

"基于学习机器视觉"

Posted by xxc on July 21, 2018
  • 图像增广

    • 变形
    1. RandomFlipLeftRight(左右翻转)
    2. RandomFlipTopBottom(上下翻转)
    3. RandomResizedCrop(随机裁剪)
    • 颜色变化
      1. RandomBrightness(亮度)
      2. RandomHue(色相)
      3. RandomColorJitter(多个颜色变换)
    • 多个增广:变形颜色一同使用,gdata.vision.transforms.Compose
  • 微调(Fine tuning)迁移学习中的常用方法

    1. 在源数据上训练一个神经网络A。
    2. 创建一个新的神经网络B,它复制A上除了输出层之外的所有模型参数。假设这些模型参数含有源数据上学到的知识,且这些知识同样适用于目标数据集。
    3. 为B添加一个输出大小为目标数据集类别数目的输出层,并将其权重初始化为随机值。
    4. 在目标数据集上训练B,将从头开始学习输出层,但其余层都是基于源数据上的模型参数进行微调
  • 锚框

    以每个像素为中心生成多个大小和比例不同的边界框

    • IoU:交集除并集

      dl-vision-1

      IoU = 两边界框相交面积除以其相并面积

      dl-vision-2

    • 预测:非最大抑制(NMS)