Ouvrez la porte au monde de l'IA - de l'intelligence artificielle à la vision par ordinateur

Ouvrez la porte au monde de l'IA - de l'intelligence artificielle à la vision par ordinateur

1. À propos de l'intelligence artificielle

1.1 Introduction à l'intelligence artificielle

La première chose que nous devons savoir est le concept de base de l'intelligence artificielle. Qu'est-ce que la véritable intelligence artificielle ? La technologie du savoir-faire. L'intelligence artificielle est l'un des domaines les plus populaires dans le monde informatique d'aujourd'hui, elle implique de nombreux domaines et couvre les capacités de perception, d'apprentissage, de raisonnement et de prise de décision.

Du point de vue de l'application pratique : la capacité principale de l'intelligence artificielle est de porter des jugements et des prédictions sur la base d'informations données.

Quand est née l'intelligence artificielle AI ? Quelles sont les étapes de son développement jusqu'à présent ? Ce sont les choses auxquelles nous devons prêter attention. Faisons une série de chronologies. La conférence de Dartmouth de 1955 a marqué la naissance de l'IA. Cette année est connue comme la première année de l'IA. La porte du monde de l'IA a finalement commencé à être formellement exploré par les humains. Il accompagnera la civilisation humaine à travers une longue, longue histoire. Dans le processus de développement de l'IA, il y a eu trois périodes dorées, et chaque période dorée est due à un nouveau concept ou algorithme étant proposé

  • Le premier pic et le creux de l'IA : En 1957, Rosenblatt a inventé le premier réseau de neurones Perceptron, ainsi l'IA est entrée dans la première période de pointe. En 1970, en raison des percées en matière de puissance de calcul, elle n'a pas réussi à effectuer une formation à grande échelle sur les données et des tâches complexes, ainsi l'IA est entrée dans le premier creux
  • Deuxième pic et creux de l'IA : le réseau de neurones de Hopfield a été proposé en 1982 , et l'algorithme BP est apparu quatre ans plus tard en 1986, rendant possible l'entraînement de réseaux de neurones à grande échelle. Ces deux percées historiques ont poussé l'IA vers le deuxième apogée. C'était en 1990. L'ordinateur AI DARPA n'a pas obtenu les résultats escomptés et n'a pas obtenu plus de soutien financier, de sorte que la nouvelle vague émergente d'IA est de nouveau entrée dans un creux.
  • Le troisième pic de l'IA jusqu'à aujourd'hui : en 2006, **Hinton a proposé le réseau de neurones "deep learning"**, qui a fait une avancée majeure dans les performances de l'intelligence artificielle. En 2013, l'algorithme d'apprentissage en profondeur a fait des percées dans les domaines de la parole et de l'image. Cette IA est entrée dans une nouvelle ère - l'ère de l'intelligence perceptive

La pierre angulaire du développement de l'intelligence artificielle - Test de Turing

Le test de Turing est un concept très important dans le domaine de l'intelligence artificielle. Le processus de test de Turing comprend trois parties : le testeur, le testé et la machine, et la séparation entre le testeur et le testé (une personne et une machine). Ensuite, à travers certains appareils (comme les claviers), on pose des questions aléatoires aux testés.Après de nombreux tests, si la machine permet à chaque participant de faire plus de 30% d'erreurs de jugement en moyenne, alors cette machine a réussi le test et a été primée je pense qu'il a une intelligence humaine, mais ce n'est pas absolu. Cela ne signifie pas qu'une machine est une intelligence artificielle tant qu'elle réussit le test de Turing. Le test de Turing est juste une référence et une norme très, très importantes. Doit être jugé sur de nombreux fronts

1.2 Trois éléments fondamentaux de l'intelligence artificielle

Les trois éléments fondamentaux de l'intelligence artificielle : données, algorithme, puissance de calcul

données

L'un des éléments de l'intelligence artificielle - les données, fait référence aux données que nous entrons dans la machine, et la machine émet des jugements et des prédictions correspondants en fonction de nos données d'entrée.Avec le développement de l'Internet des objets, des informations et des données sur le monde entier sont de plus en plus nombreux, cela fournit une nutrition suffisamment riche et continue pour l'intelligence artificielle, afin que la machine dispose de suffisamment de données pour apprendre, puis restitue les résultats que nous voulons

Le cœur de la technologie des mégadonnées consiste à utiliser la valeur des données, et l'apprentissage automatique est la technologie clé pour utiliser la valeur des données

algorithme

Une fois que nous avons fourni des données à la machine, la machine vient de recevoir les données, et la chose la plus importante est l'algorithme. Le concept de l'algorithme est très simple. Lorsque nous confions une tâche à l'ordinateur, nous devons non seulement lui dire quoi faire, mais aussi lui dire comment le faire, et un algorithme est une série d'instructions sur "comment le faire"

Puissance de calcul

La puissance de calcul correspond à certaines installations matérielles qui aident les ordinateurs à fonctionner rapidement et à traiter rapidement les images, telles que le CPU, le GPU et le NPU (accélérateur d'apprentissage en profondeur) et d'autres installations matérielles. Ces installations matérielles sont la clé de la réalisation d'algorithmes, ce qui rend la réalisation d'algorithmes rapide et précis

Percée dans la puissance de calcul - processeur traditionnel et technologie d'accélération informatique émergente + puce intelligente

En ce qui concerne la relation entre CPU et GPU, nous pouvons simplement la comprendre comme suit : CPU + calcul parallèle = GPU, et le GPU ne peut pas être modifié après sa construction. À l'heure actuelle, le FPGA semble résoudre nos problèmes de conception matérielle. Une fois terminé, les utilisateurs peuvent le modifier à tout moment, ce qui réduit considérablement le risque de développement

Il y a un autre concept très important que nous devons comprendre : l'informatique distribuée, si chaque ordinateur est un module, tous les ordinateurs attribuent des tâches selon certaines règles puis effectuent des calculs séparés, et enfin combinent les résultats des calculs, c'est l'informatique distribuée.

insérez la description de l'image ici

(La photo vient de Badou Artificial Intelligence —— Wang Xiaotian de Badou Academy)

1.3 Cercle relationnel de l'intelligence artificielle

Dans le développement de l'intelligence artificielle, l'essor du machine learning et la percée du deep learning sont des jalons. Quelle est la relation entre eux et l'intelligence artificielle ? Le cercle relationnel de l'intelligence artificielle est le navigateur le plus important qui nous amène à comprendre le monde de l'IA

Machine Learning - Un moyen de réaliser l'intelligence artificielle

L'apprentissage automatique est au cœur de l'intelligence artificielle et le moyen fondamental de rendre les ordinateurs intelligents. Son application couvre tous les domaines de l'intelligence artificielle. Il utilise principalement l'induction et la synthèse plutôt que la déduction.

Deep Learning - Une technique pour mettre en œuvre l'apprentissage automatique

L'apprentissage en profondeur est l'utilisation de réseaux de neurones profonds pour traiter les modules de manière plus complexe, afin que le modèle puisse comprendre les données plus en profondeur. C'est une méthode basée sur l'apprentissage représentatif des données dans l'apprentissage automatique. Sa motivation est d'établir et de simuler le cerveau humain pour analyse et apprentissage. Un réseau de neurones qui imite les mécanismes du cerveau humain pour interpréter des données telles que des images, des sons et du texte.

L'essence de l'apprentissage en profondeur est d' apprendre des fonctionnalités plus utiles en créant un modèle d'apprentissage automatique avec de nombreuses couches cachées et des données de formation massives, afin d'améliorer finalement la précision de la classification ou de la prédiction.

Réseaux de neurones artificiels - Un algorithme pour l'apprentissage automatique

Un réseau de neurones a généralement une couche d'entrée-> couche cachée-> couche de sortie. De manière générale, un réseau de neurones avec plus de deux couches cachées est appelé un réseau de neurones profond. L'apprentissage profond est une machine qui utilise une architecture profonde comme un neurone profond méthode d'étude du réseau

L'apprentissage automatique consiste à atteindre l'intelligence artificielle, l'apprentissage en profondeur est une sorte d'apprentissage automatique

insérez la description de l'image ici

Processus d'apprentissage automatique classique

Tout d'abord, nous devons préparer les données de formation (y compris de nombreuses étiquettes de catégories, c'est-à-dire certains ensembles de fonctionnalités qui peuvent mieux représenter ces choses), puis nous devons concevoir l'algorithme d'apprentissage en fonction de nos besoins souhaités, et utiliser l'algorithme d'apprentissage pour former les données. Il devient l'un de nos modèles (tels que l'arbre de décision, le réseau de neurones, etc.), après avoir passé de nouveaux échantillons de données (données de prédiction) dans le modèle, le modèle nous donnera des données de rétroaction basées sur sa capacité apprise

Comprendre les réseaux de neurones (Thinking Humans - Biological Neural Networks)

Ce que le réseau neuronal humain peut accomplir peut être grossièrement expliqué comme suit : après avoir reçu un stimulus externe , le neurone convertira le stimulus en information et le transmettra à d'autres cellules fonctionnelles, et ces cellules feront des sorties correspondantes après avoir reçu l'information.

Le réseau de neurones artificiels est une structure de réseau établie en simulant le réseau de neurones biologiques. Chaque neurone qu'il contient doit d'abord avoir des données d'entrée (stimuli), et un capteur qui reçoit et traite ces données , et finalement fait une sortie . Ces neurones sont croisés et mélangés ensemble pour former notre réseau de neurones artificiels. La structure logique du réseau de neurones artificiels comprend : la couche d'entrée, la couche cachée et la couche de sortie. La fonction de chaque couche est le processus que nous avons mentionné ci-dessus. Ces processus Après avoir coopéré et communiqué les uns avec les autres, nous pouvons obtenir l'effet désiré

Mais il y a plus d'une couche cachée. Lorsqu'un réseau neuronal artificiel a plusieurs couches cachées, on l'appelle un réseau neuronal profond . L'apprentissage automatique basé sur un réseau neuronal profond est un apprentissage profond.

2. Vision par ordinateur

2.1 Apprendre à connaître CV pour la première fois

Wan Jian revient dans la secte ! Avant d'apprendre la vision par ordinateur, nous devons d'abord comprendre ce qu'est la vision par ordinateur. Pour résumer en une phrase, la vision par ordinateur consiste à permettre aux ordinateurs d'avoir la capacité de voir, de comprendre et de penser. On peut l'appeler Les ordinateurs ont une vision, vision par ordinateur ! (Il convient de noter que non seulement l'ordinateur doit avoir la capacité de "voir", mais aussi la capacité de "reconnaître" et de "penser")

2.2 Apprentissage en profondeur et CV et application du CV

La vision par ordinateur basée sur l'apprentissage en profondeur consiste à permettre à la vision par ordinateur d'avoir la capacité de "reconnaissance" pour atteindre l'objectif de l'intelligence artificielle, alors comment lui faire avoir cette capacité ? De toute évidence, l'apprentissage automatique est utilisé pour permettre aux machines de reconnaître des images. Le CV est un concept qui recoupe l'IA, le ML et le DL. Nous utiliserons l'apprentissage automatique et l'apprentissage en profondeur pour réaliser la fonction de notre CV.

CV a 5 applications principales :

1. Classification des images (à l'aide du réseau de neurones convolutifs CNN) - couche de rectification linéaire RELU (fonction f=max(0,x)) et couche de regroupement POOL (selon les paramètres d'entrée pour obtenir la valeur maximale de chaque partie)

2. Détection de cible (à l'aide de R-CNN) - extrayez la région d'intérêt, puis effectuez ConvNet (convolution)

3. Segmentation sémantique (à l'aide du réseau FCN) - segmenter les objets de différentes catégories , puis les colorer (pour les catégories approximatives)

4. Segmentation d'instance - Segmentez et coloriez les objets de différentes instances (par exemple des objets)


Déclaration de droit d'auteur : le contenu d'apprentissage et les images ci-dessus proviennent de ou font référence à - Badou Artificial Intelligence
Si l'article vous est utile, n'oubliez pas de le soutenir en un seul clic ~

Je suppose que tu aimes

Origine blog.csdn.net/qq_50587771/article/details/124109105
conseillé
Classement