逆透视投影 torch

企业开发 2025-04-08 09:49:22 阅读次数: 0

逆透视投影 torch版本

import torch

def inverse_perspective_projection(points, K, distance):
    """
    这个函数计算给定估计距离的点集的逆透视投影。
    
    参数:
        points (bs, N, 2): 2D 图像上的点（每个批次有 N 个 2D 点）
        K (bs, 3, 3): 相机的内参矩阵（每个批次一个 3x3 的矩阵）
        distance (bs, N, 1): 3D 世界中每个点的距离
        
    类似于：
        - pts_l_norm = cv2.undistortPoints(np.expand_dims(pts_l, axis=1), cameraMatrix=K_l, distCoeffs=None)
    """

    # 第一步：将 2D 点转化为齐次坐标（在每个点的最后添加一个 1）
    points = torch.cat([points, torch.ones_like(points[..., :1])], -1)
    # points 的形状变为 (bs, N, 3)，此时最后一维是齐次坐标

    # 第二步：应用相机内参 K，计算归一化的图像坐标
    points = torch.einsum("bij,bkj->bki", torch.inverse(K), points)
    # 通过 K 的逆矩阵将点从像素坐标系转换到归一化相机坐标系

    # 第三步：如果没有给定距离参数，直接返回归一化后的坐标
    if distance == None:
        return points

    # 第四步：将归一化坐标乘以距离，恢复到实际的 3D 空间坐标
    points = points * distance
    return points

代码解释：

输入参数：
- points (bs, N, 2)：包含 bs 批次，每个批次 N 个 2D 图像点。每个点是一个二维坐标。
- K (bs, 3, 3)：相机内参矩阵，每个批次对应一个 3x3 的矩阵。相机的内参矩阵通常包含焦距和主点坐标。
- distance (bs, N, 1)：每个点在 3D 空间中的距离。
第一步：将 2D 点扩展为齐次坐标。
- points = torch.cat([points, torch.ones_like(points[..., :1])], -1) 将每个 2D 点添加一个 1，变成 (x, y, 1) 形式，这样可以进行齐次坐标变换。
第二步：应用相机的内参矩阵 K 的逆，将 2D 图像点从像素坐标系转换为归一化的相机坐标系。
- 使用 torch.einsum("bij,bkj->bki", torch.inverse(K), points) 计算逆透视变换。torch.inverse(K) 是相机内参的逆矩阵，然后使用爱因斯坦求和约定将其与点坐标进行相乘，得到归一化的 3D 坐标。
第三步：如果没有给定距离 distance，直接返回归一化后的点坐标。
第四步：如果给定了每个点的 distance，则将归一化的坐标乘以该点的距离，得到实际的 3D 空间坐标。

主要目的：

该函数通过逆透视投影，将 2D 图像上的点转换为 3D 空间中的坐标。这种方法通常用于从 2D 图像恢复 3D 空间中的物体位置，前提是知道每个点到相机的距离（distance）。

猜你喜欢

转载自blog.csdn.net/jacke121/article/details/146976277

逆透视投影 torch

透视投影

深入探究透视投影

OpenGL ES 透视投影

透视投影原理详解

CV — 透视（投影）变换

WebGL透视投影

投影矩阵求逆

对透视投影矩阵的推导的总结

WebGL之旅（十一）透视投影

OGL（教程12）——透视投影

DX透视投影矩阵的推导

opengles透视矩阵投影原理

Shader 特效——“透视投影” 的实现

【OpenGL】透视投影运用实例

torch CrossEntropyCriterion

loadcaffe in torch

Torch CmdLine

torch tensor

torch报错

Pytorch torch

Torch或Numpy

torch笔记

安装torch

Torch + Lua

torch分类

torch 数组

Torch 或 Numpy

dropblock torch

torch安装

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

ConfigurationClassParser类的parse方法源码解析

基础大讲堂-java 位运算符

ConsecutiveInteger判断给定的整数n能否表示成连续的m(m>1)个正整数之和

多项式问题之六——多项式快速幂

Spring Security技术栈开发企业级认证与授权（四）RESTful API服务异常处理

Linux基础命令---apachectl

MATLAB中的线性插值

Unity编辑器拓展之十七：NGUI ComponentSelector增加搜索框

SqlServer 备份还原教程

[Unity动画]01.

每日归档

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)