Colonne de champ de positionnement visuel (2) Introduction aux ensembles de données couramment utilisés

Préface L'   article précédent a présenté ce qu'est le positionnement visuel, ainsi que les points d'application du positionnement visuel dans diverses industries et les difficultés de recherche actuelles. Cet article présente principalement certains ensembles de données couramment utilisés dans le domaine du positionnement visuel, qui sont divisés en ensembles de données de positionnement intérieur et en ensembles de données de positionnement extérieur.Chaque ensemble de données est accompagné d'une adresse d'acquisition d'ensemble de données et d'un échantillon d'ensemble de données.

La reproduction de ce tutoriel est interdite. En même temps, ce tutoriel provient de Knowledge Planet [CV Technical Guide] Plus de tutoriels techniques, vous pouvez rejoindre Planet Learning.

Transformateur, détection de cible, groupe d'échange de segmentation sémantique

Bienvenue à prêter attention au guide technique de CV de compte public , en se concentrant sur le résumé technique de la vision par ordinateur, le suivi des dernières technologies, l'interprétation des articles classiques, les informations de recrutement de CV.

Les principales colonnes de direction de CV et les tutoriels les plus complets pour chaque cadre de déploiement

Ensembles de données communs

Il y avait relativement peu d'ensembles de données de positionnement visuel précoce. Au fur et à mesure que de plus en plus de personnes faisaient des recherches, de nombreux ensembles de données publics sont apparus. Ce qui suit présente quelques ensembles de données largement utilisés en fonction de l'environnement extérieur et de l'environnement intérieur.

jeu de données intérieur


Jeu de données de 7 scènes

Composées d'images RVB-D, de poses de caméra réelles et de modèles 3D de sept pièces intérieures (environ 125 mètres carrés au total), ces images contiennent des surfaces sans texture, du flou de mouvement, des structures répétitives, etc.

Documents liés aux ensembles de données :

Carlevaris-Bianco N, Ushani AK, Eustice RM. Vision à long terme du campus nord de l'Université du Michigan et ensemble de données lidar [J]. Le Journal international de la recherche robotique, 2016, 35(9): 1023-1035.


Jeu de données Inloc

L'ensemble de données InLoc est conçu pour le positionnement intérieur à grande échelle. En raison de changements importants de point de vue, de meubles en mouvement, d'occlusions et de changements d'éclairage, il existe des changements d'apparence importants entre l'image de requête à localiser et l'image de la base de données. L'ensemble de données est composé de RVB -D base de données d'images et ajout d'un ensemble d'images de requête RVB prises par des appareils portables, ce qui le rend adapté aux tâches de localisation en intérieur.

Adresse d'acquisition du jeu de données :

http://www.ok.sc.e.titech.ac.jp/INLOC/


Gare de Gangnam et grand magasin Hyundai:

L'ensemble de données fait partie de l'ensemble de données de positionnement NAVER Lab, qui se compose de 5 ensembles de données d'intérieur pour le positionnement visuel dans des environnements réels difficiles. L'ensemble de données est un grand centre commercial et une grande station de métro à Séoul, en Corée du Sud. Il a été tourné à l'aide d'un plate-forme d'arpentage et de cartographie dédiée composée de caméras 10 et de scanners laser 2. Afin d'obtenir des poses de caméra de vérité au sol précises, LiDAR SLAM a été utilisé pour fournir des poses initiales, puis SFM a été utilisé pour optimiser les poses initiales. L'ensemble de données contient environ 130 000 images et des poses de caméra 6DoF pour la formation et la validation. De plus, une carte de profondeur basée sur le lidar clairsemé est fournie pour les images d'entraînement.

Adresse d'acquisition du jeu de données :

https://github.com/naver/kapture/blob/main/doc/tutorial.adoc#download-a-dataset


Jeu de données LaMAR :

Il s'agit d'un ensemble de données spécifiquement pour les applications AR/VR. L'ensemble de données a été collecté à l'aide d'appareils Microsoft HoloLens 2 et Apple iPad Pro avec une application d'enregistrement de capteur brut personnalisée. 10 participants ont chacun reçu un appareil et ont été invités à marcher dans une zone désignée commune, c'est-à-dire marcher, visiter, inspecter et regarder librement dans l'environnement, ce qui entraîne différentes hauteurs de caméra et modèles de mouvement, ainsi que leurs trajectoires sans aucun plan ni restriction, jusqu'à Au cours d'une année, les participants ont visité chaque emplacement à différentes heures du jour et de la nuit. Au total, chaque emplacement compte plus de 100 séquences vidéo de 5 minutes, qui ne nécessitaient aucune préparation du lieu de tournage avant l'enregistrement, ce qui a permis de collecter des données participatives, et chaque emplacement a également été cartographié par un chariot NavVis M6. ou sac à dos VLX Captées deux à trois fois, les plates-formes utilisent des scanners laser et des caméras panoramiques pour générer des modèles 3D densément texturés de l'environnement.

Adresse d'acquisition du jeu de données :

https://lamar.ethz.ch/


jeu de données extérieur

Cambridge:

Contenant 5 scènes, cet ensemble de données est souvent utilisé pour former et tester des algorithmes de régression de pose dans des environnements urbains extérieurs à grande échelle

Adresse d'acquisition du jeu de données :

mi.eng.cam.ac.uk/projects/relocalisation/

Exemple d'ensemble de données :


Aix-la-Chapelle Jour-Nuit:

Sur la base de l'ensemble de données original d'Aix-la-Chapelle, qui représente l'ancien centre-ville d'Aix-la-Chapelle, en Allemagne, les images de la base de données ont toutes été capturées pendant la journée avec une caméra portative sur une période d'environ deux ans, fournissant des images de requête prises pendant la journée et à nuit, toutes les requêtes Les images sont toutes prises avec des caméras de téléphones portables, c'est-à-dire que l'ensemble de données jour-nuit d'Aix-la-Chapelle considère des scénarios où des appareils mobiles sont utilisés pour la localisation, comme la réalité augmentée ou la réalité mixte. Les images de requête nocturnes ont été prises à l'aide du HDR du téléphone portable pour créer des images (relativement) bien éclairées et de haute qualité.

Adresse de téléchargement de l'ensemble de données :

https://data.ciirc.cvut.cz/public/projects/2020VisualLocalization/Aachen-Day-Night/


RobotCar Saisons

Sur la base d'un sous-ensemble de l'ensemble de données RobotCar, qui représente une scène extérieure à Oxford, au Royaume-Uni, l'image de référence et l'image de requête sont capturées par trois caméras synchronisées montées sur la voiture, pointant vers l'arrière gauche, l'arrière arrière et l'arrière droit, respectivement. Les images ont été enregistrées en parcourant le même itinéraire sur une période de 12 mois. Une passe est utilisée pour définir la condition de référence et la représentation de la scène de référence. D'autres traversées couvrent différentes saisons et conditions d'éclairage pour les requêtes. Toutes les images sont enregistrées séquentiellement. L'ensemble de données RobotCar Seasons représente des scénarios de conduite autonome

Adresse d'acquisition du jeu de données :

https://data.ciirc.cvut.cz/public/projects/2020VisualLocalization/RobotCar-Seasons/


Saisons CMU:

Représente des scènes urbaines, suburbaines et de parc dans la région de Pittsburgh aux États-Unis. Les images de référence et de requête sont capturées par deux caméras frontales montées sur la voiture, pointant à un angle d'environ 45 degrés vers la gauche et la droite du véhicule. Ces images ont été enregistrées sur une période de 1 an. L'une des traversées est utilisée pour définir les conditions de référence et les représentations de scènes de référence, et d'autres traversées capturent différentes conditions saisonnières pour l'interrogation. Toutes les images sont enregistrées séquentiellement. L'ensemble de données CMU Seasons représente des scénarios de conduite autonome

Adresse d'acquisition du jeu de données :

https://data.ciirc.cvut.cz/public/projects/2020VisualLocalization/CMU-Seasons/


CHAUD:

L'utilisation d'images brutes provenant de caméras sphériques pour représenter la localisation dans des conditions réelles couvre un large éventail d'applications haut de gamme telles que la réalité virtuelle, les cartes et la robotique. L'ensemble de données a été collecté sur une période de 12 mois et couvrait 1,2 km de rues autour de l'Imperial College de Londres. Les conditions comprennent les changements de temps (clair, neigeux, pluvieux) et l'heure de la journée (midi, crépuscule, nuit).

Adresse d'acquisition du jeu de données :

https://www.visuallocalization.net/datasets/


Le prochain article résumera les critères d'évaluation et les algorithmes de formule couramment utilisés pour le positionnement visuel, et partagera plusieurs bons projets open source pour l'étude et la recherche.

 Bienvenue à prêter attention au guide technique de CV de compte public , en se concentrant sur le résumé technique de la vision par ordinateur, le suivi des dernières technologies, l'interprétation des articles classiques, les informations de recrutement de CV.

[Documents techniques] "Construire un tutoriel de modèle pytorch à partir de zéro" Téléchargement PDF de 122 pages

Groupe d'échange QQ : 470899183 . Il y a des grands gars dans le groupe qui sont chargés de répondre aux questions quotidiennes d'étude, de recherche scientifique et de code de chacun.

Groupe d'échange de déploiement de modèle : 732145323 . Il est utilisé pour la communication sur le déploiement de modèles, le calcul haute performance, l'accélération de l'optimisation et l'apprentissage technologique en vision par ordinateur.

autres articles

Un jour en ligne, star 4k | Facebook : Segmenter n'importe quoi

3090 carte unique pendant 5 heures, tout le monde peut s'entraîner exclusif ChatGPT, HKUST open source LMFlow

Efficient-HRNet | La pensée EfficientNet + la technologie HRNet seront-elles plus fortes et plus rapides ?

Tutoriel pratique|Analyse et optimisation des raisons courantes d'une faible utilisation du GPU

ICLR 2023 | SoftMatch : parvenir à un compromis entre la qualité et la quantité des pseudo-étiquettes dans l'apprentissage semi-supervisé

Innovation en détection de cible : une méthode semi-supervisée par région, quelques étiquettes suffisent (téléchargement de l'article original en pièce jointe)

CNN contre-attaque ! InceptionNeXt : Quand Inception rencontre ConvNeXt

Analyse d'interprétabilité des réseaux de neurones : 14 algorithmes d'attribution

Augmentation indolore : astuce pratique pour l'optimisation de la détection des cibles

Expliquez en détail les trois façons dont PyTorch compile et appelle les opérateurs CUDA personnalisés

Que dois-je faire si la mémoire GPU est insuffisante lors de la formation d'un modèle avec apprentissage en profondeur ?

Les principales colonnes de direction de CV et les tutoriels les plus complets pour chaque cadre de déploiement

Cours de didacticiel d'introduction à la vision par ordinateur 1v3

Groupe de communication dans diverses directions de la vision par ordinateur

Je suppose que tu aimes

Origine blog.csdn.net/KANG157/article/details/130450853
conseillé
Classement