P13.3目标检测和边界框——动手学深度学习v2 - 代码天地

P13.3目标检测和边界框——动手学深度学习v2

企业开发 2022-02-28 20:25:10 阅读次数: 0

边界框

通常所用的边界框（相当于一个矩形框）有两种表示方式：

记录矩形左上角(x1, y1)和右下角(x2, y2)
记录矩形的中心点(cx, cy)和，矩形的宽 w和高 h

**都是由四个量表示，下面是两种表示方式的互换代码**

def box_corner_to_center(boxes):
    """从（左上，右下）转换到（中间，宽度，高度）"""
    x1, y1, x2, y2 = boxes[:, 0], boxes[:, 1], boxes[:, 2], boxes[:, 3]
    cx = (x1 + x2) / 2
    cy = (y1 + y2) / 2
    w = x2 - x1
    h = y2 - y1
    boxes = torch.stack((cx, cy, w, h), axis=-1)
    return boxes


def box_center_to_corner(boxes):
    """从（中间，宽度，高度）转换到（左上，右下）"""
    cx, cy, w, h = boxes[:, 0], boxes[:, 1], boxes[:, 2], boxes[:, 3]
    x1 = cx - 0.5 * w
    y1 = cy - 0.5 * h
    x2 = cx + 0.5 * w
    y2 = cy + 0.5 * h
    boxes = torch.stack((x1, y1, x2, y2), axis=-1)
    return boxes
复制代码

boxes[:,0]，因为是若干个框的结果，所以在第一维度上使用:取所有的值。

仔细学习一下这句代码：boxes = torch.stack((x1, y1, x2, y2), axis=-1)
torch.stack() 表示沿着一个新维度对输入张量序列进行连接，axis = -1表示倒数第一个维度。
boxes的维度是(n, 4)，任意一个量cx, cy, w, d的维度是(n)，将其沿着倒数第一个维度拼接到一起，又变成了(n, 4)。

一个比较不错的例子，用来理解torch.stack()

T1 = torch.tensor([[1, 2, 3],
                   [4, 5, 6],
                   [7, 8, 9]])

T2 = torch.tensor([[10, 20, 30],
                   [40, 50, 60],
                   [70, 80, 90]])

print(torch.stack((T1, T2), axis=0).shape)
print(torch.stack((T1, T2), axis=1).shape)
print(torch.stack((T1, T2), axis=2).shape)
print(torch.stack((T1, T2), axis=-1).shape)
复制代码

输出

torch.Size([2, 3, 3])
torch.Size([3, 2, 3])
torch.Size([3, 3, 2])
torch.Size([3, 3, 2])
复制代码

猜你喜欢

转载自juejin.im/post/7066389079922835464

P13.3目标检测和边界框——动手学深度学习v2

42 锚框【动手学深度学习v2】

锚框 anchor box bounding box 动手学深度学习v2 pytorch

[学习笔记]动手学深度学习v2

物体检测object detection object recognition和coco数据集动手学深度学习v2 pytorch

41 物体检测和数据集【动手学深度学习v2】

深度学习硬件：CPU 和 GPU 动手学深度学习v2

SSD Single shot detection 单发多框检测实现多尺度锚框动手学深度学习v2

模型选择 + 过拟合和欠拟合动手学深度学习v2 pytorch

动手学深度学习v2 p2 线性神经网络线性回归

物体检测算法：R-CNN，SSD，YOLO 动手学深度学习v2 pytorch

深度学习结课总结和进阶学习优化算法动手学深度学习v2

1.【动手学深度学习v2】深度学习介绍

CNN深度卷积神经网络 AlexNet 动手学深度学习v2 pytorch

深度神经网络分布式训练动手学深度学习v2

卷积层里的填充Padding和步幅Stride 动手学深度学习v2 pytorch

fine-tune 微调 Transfer learning 迁移学习动手学深度学习v2

【动手学深度学习v2李沐】学习笔记08：丢弃法

动手学深度学习V2——李沐（学习中遇到的问题）

Dropout 丢弃法动手学深度学习v2 pytorch

多层感知机 + 代码实现 - 动手学深度学习v2 pytorch

经典卷积神经网络 LeNet 动手学深度学习v2 pytorch

线性回归 + 基础优化算法动手学深度学习v2 pytorch

CNN卷积层动手学深度学习v2 pytorch

kaggle 预测房价竞赛总结动手学深度学习v2 pytorch

数据增广Data Augmentation 动手学深度学习v2

批量归一化Batch Normalization 动手学深度学习v2

网络中的网络 NiN 动手学深度学习v2 pytorch

使用块的网络 VGG 动手学深度学习v2 pytorch

BERT预训练动手学深度学习v2

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)