L'ancien magasin accueille de nouveaux clients : des choses que personne ne vous dit sur la sélection de bases de données vectorielles et les paris

‍Original : Tan Jing‍

(1) Mots clés : les anciens magasins « accueillent » les nouveaux clients

Un employé d'un fabricant de cloud computing m'a dit que lorsqu'il rendait visite à un client, la première phrase qu'il prononçait était :

"Vous me recommandez d'abord une base de données vectorielle."

Le grand modèle est en feu et la base de données vectorielle est en feu.

La base de données vectorielles est une technologie de niche, et c'est aussi une technologie mature existante, qui est soudainement sortie du cercle.

En effet, la technologie des bases de données est de très bas niveau et elle attrape rarement la chaleur.

Après tout, il y avait du trafic venu du ciel.

C'est un coup dur, sinon comment peut-il être digne de comptes marketing enthousiastes et de riches investisseurs.

Les clients sont impatients de choisir des modèles et de financer l'huile de cuisson.

Mais je pense toujours que je ne connais pas la profondeur, et c'est ennuyeux de ne regarder que l'argent.

C'est l'histoire "d'un ancien magasin qui reçoit de nouveaux clients".

La base de données vectorielle n'est pas une nouvelle technologie, mais les nouveaux défis auxquels elle est confrontée sont :

Comment bien servir le « nouveau client » du grand modèle.

27b8757cf848fbdf0d42a05c12881080.png

Toute personne connaissant la base de données vectorielles,

Il y a quelques années, il fallait connaître l'algorithme Faiss de Facebook.

Il y a quelques mois, il était impossible de ne pas connaître la société Pinecone.

Pomme de pin est devenue célèbre en vertu de sa "relation ambiguë" avec le grand modèle, ce qui a fait grimper sa valorisation.

Je vais commencer par une commande, Pinecone a fait du très bon travail.

Il a expliqué l'utilité de la base de données vectorielles au monde en une phrase,

Résumez la relation entre le grand modèle et la base de données vectorielles en un mot :

"Fournit une mémoire à long terme pour les grands modèles."

Cette affirmation est très ingénieuse, surtout face aux investisseurs et aux consommateurs de melons.

Il est recommandé aux fondateurs de startups rondes d'y jeter un coup d'œil.

Ne vous contentez pas d'enterrer votre tête et de travailler dur, le marché de l'éducation est important.

Bien sûr, il doit y avoir une sortie.

Suivez la logique de la mémoire.

En conséquence, la base de données vectorielles a été propulsée à une position élevée dans l'importante infrastructure de l'intelligence artificielle.

Ainsi, certains affirment : « La combinaison de grands modèles et de bases de données vectorielles aura un impact sur les bases de données traditionnelles.

A première vue, c'est logique.

Avant l'arrivée du grand modèle, si la base de données vectorielles était une "petite affaire", elle était "indispensable".

Laissez-moi vous dire que ce n'est pas le champ de bataille principal de l'IA. Trois mille Yuejia peuvent avaler Wu, et vingt soldats d'élite peuvent également l'arrêter.

Qui aurait pu s'attendre à ce que le grand modèle vienne.

Sa compréhension est recherchée et sa mémoire est dénoncée.

Si vous avez interagi avec lui la dernière fois, ce ne sera pas un arrière-plan connu la prochaine fois.

L'inconvénient est que les grands modèles n'ont pas de mémoire à long terme.

C'est une maladie qui doit être guérie.

Certaines personnes pensent que l'antidote est les bases de données vectorielles.

Il y a une autre déclaration qui serait reconnue par les investisseurs de Sequoia :

Les bases de données vectorielles sont en mémoire pour les grands modèles.

289cf725b4e760b350ace97ffded8b7d.png

(2) Mots clés : Origination dépendante

Disons que la base de données vectorielles était à l'origine une arme secrète chez les géants de l'Internet.

Quand je l'ai découvert, il existait déjà dans les grandes sociétés Internet depuis de nombreuses années.

Professeur Tan, comment ai-je connu la base de données vectorielles ?

C'était l'hiver 2021 et je me suis accidentellement cassé l'os de l'orteil.

Il était très difficile de visiter les maîtres de la science et de la technologie dans le vent froid avec des béquilles, j'ai donc dû trouver un emploi dans une grande usine Internet avec mon corps et mon esprit, et je suis resté environ deux mois.

Pendant ce temps, j'ai visité et appris des armes secrètes telles que la pile logicielle d'IA, la plate-forme intermédiaire, le middleware et le compilateur. Après un long moment, je me suis familiarisé avec leur équipe R&D de fond en comble.

Alors, j'ai annoncé haut et fort, allez, montrez.

Quelle est votre arme secrète ?

Avec le style de faire les choses discret et bien élevé du professeur Tan,

J'ai personnellement vu les documents internes et les armes secrètes de nombreuses piles logicielles majeures d'IA.

Une base de données vectorielles m'a fait briller les yeux, et elle est toujours open source.

Le système d'exploitation dans mon cœur est cette phrase :

8754c8ad4847d8bd215ffe3b3f14cda5.png

Comme toutes les bonnes armes secrètes, cela a commencé comme un développement discret à usage interne uniquement.

Lorsque la base de données vectorielles est née dans une grande entreprise de commerce électronique, elle avait une exigence de scénario claire : l'auto-utilisation.

Techniquement, il est développé pour les besoins de recherche de similarité en entreprise.

Dans le cadre de cette demande, un outil utile peut permettre aux fabricants d'économiser d'énormes coûts économiques.

Vous faites quelque chose avec 20 GPU, j'ai fait la même chose avec 2 GPU.

Juan Wang Monologue : J'ai obtenu une promotion et une augmentation de salaire, mais vous avez démissionné et êtes parti.

Les deux questions suivantes sont plus importantes :

En demande réelle, pourquoi les gens utilisent-ils des graphiques pour effectuer des recherches ?

En implémentation technique, pourquoi utiliser des vecteurs pour rechercher ?

La réponse à la demande réelle a été donnée par la partie de hachage, et elle a déjà été répondue par une fonction commune de l'application Taobao, c'est-à-dire que Pailitao, qui est sorti en 2014, est la caméra dans le champ de recherche en haut de la page d'accueil de Taobao.

De la position où il apparaît, vous pouvez savoir à peu près à quel point il est facile à utiliser. Avec Polaroid, M. Tan, je n'ai plus à me soucier de retrouver le même style que le roi Bai Baihe et Yang Mi.

Je voudrais paraphraser le point de vue de M. Hua Xiansheng : la recherche d'images a grandement libéré le potentiel de la technologie grâce aux opportunités commerciales créées par Pailitao (recherche d'achat de photos de commerce électronique).

Derrière Pailitao se trouve un moteur de recherche vectoriel appelé Proxima, qui a des milliards d'images dans sa base de données. Plus que cela, Proxima est également utilisé dans de nombreuses entreprises de "l'ancien groupe" d'Alibaba, comme la recherche vidéo Youku.

Bien que JD Retail soit arrivé en retard, début 2018, un système de recherche d'images distribué en temps réel à l'échelle d'un milliard a été construit et la base de données vectorielle Vearch est sortie. Né avec un physique de "travailleur modèle", beaucoup de travail l'attend :

Résolvez le problème de la distribution répétée de marchandises, de la recommandation du même article dans l'application du centre commercial, de la déduplication des pages de détails du produit, etc.

À l'échelle mondiale, la base de données vectorielles n'est pas la première à être réalisée par les deux principales sociétés de commerce électronique en Chine.

C'est une société appelée Meta (Facebook) dans la Silicon Valley, aux États-Unis.

Ce fou d'algorithme d'IA open source, les gens qui font la base de données vectorielle lui en sont très reconnaissants.

Parce que le groupe de recherche fondamentale sur l'IA de l'entreprise a ouvert FAISS (nom complet Facebook AI Similarity Search) au monde entier.

Les geeks croient que FAISS lui-même est un excellent algorithme, et c'est un prédécesseur "clair" dans le domaine des bases de données vectorielles.

Certaines personnes ne pouvaient même pas s'empêcher de penser de cette façon :

"Cet algorithme résout si bien ce problème, pourquoi ne pas l'utiliser pour l'encapsulation?"

(3) Mots clés : emballage

Je ne peux pas m'empêcher de tapoter la cuisse bien droite, qui a dit que ce n'était pas une bonne façon ?

Certaines start-up nationales de bases de données vectorielles encapsulent des bibliothèques ANN telles que Faiss, Nmslib et Annoy.

Cependant, ni Alibaba ni JD Retail ne résolvent le problème en encapsulant les algorithmes "d'autres personnes".

Le noyau de récupération de vecteurs d'Alibaba, Proxima, est purement auto-développé, et la base de données de vecteurs de vente au détail de JD, Vearch, est basée sur l'auto-développement de Faiss, qui ont tous deux réalisé des scénarios à grande échelle à l'échelle industrielle, des performances élevées, une haute disponibilité et un faible coût.

Ce n'est pas compliqué de s'en tenir à son propre métier, mais c'est compliqué si on veut être généraliste et le proposer à l'extérieur, et supporter des scénarios de niveau industriel.

Alibaba et JD Retail ne sont destinés qu'à leur propre usage et y investissent depuis de nombreuses années.

Il va de soi qu'une base de données vectorielles qui peut fournir des fonctions efficaces de stockage vectoriel, d'indexation et de recherche de similarité est un produit très puissant.

Cependant, ceux qui coupent les coins ronds semblent être plus agressifs.

Ici, je peux parler d'une blague très célèbre du Jianghu,

Le dark poke pointe vers la "méthodologie" de la startup de base de données vectorielles Chroma qui a levé des dizaines de millions de dollars :

En dessous se trouve la base de données d'analyse en temps réel ClickHouse, avec un algorithme de récupération de vecteur open source, qui nécessite des milliers de lignes de code Python pour se connecter.

Prochaine étape : le financement.

La raison de l'utilisation de ClickHouse au lieu d'une base de données de graphes est qu'elle n'est pas nécessaire et que les arêtes des points augmenteront trop la complexité.

Quel genre de logique est-ce?

Le seuil pour implémenter une version OK de la base de données vectorielles n'est pas trop élevé.

Je ne lui demande pas d'être le plus rapide au monde dans des domaines tels que les systèmes de recommandation, la recherche d'images et le traitement du langage naturel,

Il n'est pas non plus nécessaire de servir le plus grand modèle à grande échelle du monde.

Tant qu'il peut être utilisé.

Je ne veux pas rabaisser Chroma,

Une start-up d'amorçage,

Quelles sont les exigences strictes du produit ?

3c7787303dcde945e7c17276c1f42127.png

(4) Mots clés : essence et concurrence

Répondez à la question "Pourquoi utiliser des vecteurs pour rechercher".

Il y a une expression élégante : tout peut être vectorisé.

La technologie d'apprentissage en profondeur permet aux ordinateurs de « comprendre » les images. Le principe est que le programme extrait d'abord les caractéristiques de l'image.

Je comprends simplement le vecteur comme une caractéristique de l'image.

La racine de la récupération d'images est la récupération vectorielle, c'est-à-dire en recherchant des caractéristiques, pour trouver des images avec des caractéristiques similaires.

Le dicton professionnel est que la correspondance de similarité est effectuée après la vectorisation des données non structurées.

Si vous voulez que je dise une expression simple, c'est : un tendon.

Que vous soyez des images, des textes, des données audio ou vidéo,

Ils en extraient tous des caractéristiques représentées par des vecteurs.

Système d'exploitation interne : je vectorise la base de données, je ne vous donne que de l'amour simple et brut, et toutes les données sont vectorisées pour vous.

Quelle est la nature de la base de données vectorielles ?

95dc3139abc317f72d6c1f168fb75f08.png

Derrière la fonction de récupération de vecteur se trouve la capacité de récupération de similarité vectorielle.

Stockez les données dans une base de données sous forme de vecteurs et retrouvez-les par correspondance de similarité vectorielle.

Il existe de nombreux produits de base de données sur le marché qui peuvent faire des choses similaires et peuvent étendre des capacités similaires.

Regardez Alibaba Cloud, il y a jusqu'à sept produits avec cette fonction sur le cloud, à savoir :

Base de données d'analyse en temps réel Alibaba Cloud AnalyticDB,

Alibaba Cloud PostgreSQL,

Version d'Alibaba Cloud Redis,

Hologres, le produit d'analyse interactive d'Alibaba Cloud,

Alibaba Cloud OpenSearch,

Base de données multimode Alibaba Cloud Lindor,

Alibaba Cloud héberge la recherche élastique.

Ces bases de données avec cette fonction ne sont pas uniques à Alibaba Cloud, et AWS (Amazon Cloud) aura également cette capacité.

Ces bases de données ne sont pas conçues pour faire de la récupération vectorielle, ni après avoir eu un grand modèle, elles ont cette capacité plus tôt.

Sous la tendance du grand modèle,

Il n'y a pas beaucoup de bases de données qui prennent en charge la fonction de recherche vectorielle.

Et il y aura plus de bases de données allant dans cette direction.

La base de données du moteur de recherche Elastic Search en est un bon exemple,

J'ai également dit de manière responsable : "Il veut aussi manger le gâteau de la base de données vectorielles."

Observez la version haute d'Elastic Search (version 8.8 et 8.9),

Beaucoup de choses dans ce domaine ont été itérées.

La base de données Elastic Search a "l'ambition" d'améliorer sa capacité dans ce domaine dans la piste originale,

Sur la base des capacités de stock existantes, augmenter le poids des nouvelles capacités.

Qu'il s'agisse de la dynamique des grands modèles ou de l'attitude des investisseurs, la concurrence dans ce domaine ne fera que s'intensifier, pas s'affaiblir. De plus, les concurrents ne sont pas mal préparés et ils se concentreront sur la manière d'envisager et de concevoir comment servir le "grand modèle".

Il s'agit d'un nouveau marché incrémental, un champ de bataille pour les stratèges militaires.

(5) Mots clés : mettre la technologie en pratique

Combien de documents une entreprise possède-t-elle ? S'il existe 1 million d'exemplaires, le savoir de toute l'entreprise est déposé sur le document et stocké dans la base de données vectorielles.En fait, un seul serveur suffit.

Il nous est impossible d'utiliser les ressources et la puissance de calcul du monde pour avoir un modèle omniscient et omnipotent. La situation normale sera qu'un grand modèle avec des "qualités de base" continuera à être testé par de nouvelles connaissances à l'avenir.

Nous avons deux façons d'améliorer l'effet des grands modèles, en les affinant avec de nouveaux ensembles de données de connaissances ou en les équipant de bases de données vectorielles pour récupérer de nouvelles connaissances.

Le coût de la mise au point d'un grand modèle est très élevé. En prenant un grand modèle avec 100 milliards de paramètres comme exemple, une mise au point complète prend environ deux mois, et 50T de données peuvent être nécessaires dans le processus, et cela peut prendre deux semaines pour télécharger uniquement les données de gros tonnage.

Mise au point et bases de données vectorielles, ces deux approches ne sont pas exclusives l'une de l'autre.

Certaines personnes pensent que peu importe la qualité du réglage, il est possible d'ajouter une autre base de données vectorielles pour obtenir de meilleurs résultats.

Il existe de nombreux modèles de vectorisation de données sur le marché, les clients anxieux ne peuvent pas attendre pour vectoriser les données, puis demandent conseil pour choisir une base de données vectorielles. Cela a également amené les fournisseurs de cloud à rendre visite aux clients lors des ventes, et les clients sont impatients de sélectionner des bases de données vectorielles.

Les geeks ont déjà retroussé leurs manches, ils utilisent des données vectorielles pour stocker des vecteurs, puis utilisent des requêtes de similarité pour obtenir des résultats, puis utilisent LangChain pour transmettre des invites (Prompts) en entrée à de grands modèles afin de générer un meilleur contenu.

En d'autres termes, les geeks utilisent LangChain pour ajouter de la mémoire aux gros modèles.

LangChain était à l'origine un projet open source, créé par l'ingénieur en intelligence artificielle Harrison Chase, et s'est rapidement transformé en une start-up après avoir attiré beaucoup d'attention sur GitHub.

LangChain utilise le grand modèle comme contrôleur pour connecter divers outils afin d'élargir les limites des capacités.

Développer une nouvelle application sur un grand modèle est bien plus qu'un simple appel d'API.

Lors du développement d'une application basée sur un grand modèle, il y a beaucoup de "travail manuel" à faire.

Les geeks se sont déjà lancés, et les gros modèles seront plus exigeants dans un environnement de production.

À ce stade du texte, je ne peux m'empêcher de ressentir :

LangChain est vraiment une bonne chose, et sa mise en œuvre ne nécessite pas trop de code, ce qui est très pratique.

Il semble que le grand modèle a changé par rapport au passé, et l'atmosphère a changé, et une nouvelle pile logicielle prend forme.

178630dd7b43a1000a5186412e09c697.jpeg

Par exemple, LangChain est la couche d'orchestration dans la pile technologique des grands modèles d'IA.

Par exemple, laissez ChatGPT faire le travail pour moi (traduction),

Pour de meilleurs résultats, ajoutez diverses invites (Invite) comme des pets arc-en-ciel :

"vous êtes un traducteur utile" (vous êtes un traducteur utile),

"ne rien répondre au-delà de ce qui est prévu",

"assurez-vous que les choses sont exactes" etc.,

La gestion et l'arrangement rapides ici sont effectués par LangChain.

Un bon outil, apparemment simple, est en fait la clé.

Comparé à la concurrence homogène des équipes nationales de modèles à grande échelle, ce type d'outil ingénieux est rafraîchissant.

Les grands modèles, les bases de données vectorielles et LangChain sont étroitement liés.

La communauté étrangère a même inventé un nouveau mot : OPL.

Tiré des initiales d'OpenAI, Pinecone et LangChain.

Même l'analogie, j'ai pensé au "béton armé".

Ajouter un treillis d'acier et une plaque d'acier au béton pour former un matériau composite,

L'accent est mis sur la collaboration pour améliorer les propriétés mécaniques du béton.

Beaucoup de gens pensent que l'investissement dans les bases de données vectorielles est en surchauffe.

L'une des raisons est :

Divisez le grand modèle en trois couches,

L'augmentation de la concurrence dans la couche applicative supérieure est trop importante,

On dit qu'il y a 100 applications supplémentaires après avoir dormi ;

L'investissement dans le modèle de base est trop lourd et certaines institutions d'investissement ne peuvent pas suivre ;

L'investissement dans la couche intermédiaire ne peut se faire qu'avec une capacité modérée.

Maintenant, il y a deux écoles de pensée :

Un groupe pense que ce n'est pas compliqué techniquement, et d'autres bases de données sont faites d'ailleurs ;

L'autre école pense que les grands modèles de langage sont très perturbateurs et que les bases de données vectorielles deviendront des bases de données courantes en raison des grands modèles.

Nous n'avons pas compris les limites du grand modèle.

Nous n'avons pas non plus réussi à déterminer les limites de la base de données vectorielles.

Il est peut-être trop tôt pour tirer des conclusions sur l'avenir des bases de données vectorielles à ce stade.

Ce qui m'inquiète le plus, c'est

Quel grand modèle domestique traverse la "base de données grand modèle + vecteur" ?

Quelle grande entreprise utilisatrice de modèles a utilisé la base de données vectorielles dans l'environnement de production ? Comment utiliser?

Après tout, les tout nouveaux matériaux composites, qu'ils fonctionnent bien ou non, ne peuvent être connus qu'après leur utilisation.

Bienvenue, pionniers des bases de données vectorielles à me contacter.

Bye Bye.

(sur)

Encore une chose

("J'ai vu la tempête" le nouveau livre de Teacher Tan, disponible sur JD.com)

632e2a7aa8c2b01f19167dc118dc6b20.jpeg

4fbf1fcf878b5d76b507ea50235200b7.png

En savoir plus

Grand modèle AI et série ChatGPT :

1. ChatGPT est en feu, comment créer une société AIGC et gagner de l'argent ?

2.  ChatGPT : ne jamais intimider les étudiants en arts

3.  Comment ChatGPT apprend-il par analogie ? 

4.  Exclusif丨Depuis le départ des grands maîtres Alex Smola et Li Mu, le financement de la startup AWS s'est déroulé sans encombre, revenant sur l'évolution des "armes sous-jacentes" à l'ère des modèles à grande échelle ChatGPT

5.  Exclusif 丨 L'ancien co-fondateur de Meituan, Wang Huiwen, "acquiert" le cadre d'IA national OneFlow, cherchant à ajouter un nouveau général à des années-lumière

6.  Le grand modèle ChatGPT utilisé dans les enquêtes criminelles et la résolution d'affaires n'est-il qu'une histoire fictive ?

7.  Game of Thrones du Grand Modèle "Economie sur le Cloud"

8.   Modèle à grande échelle de CloudWalk : quelle est la relation entre le grand modèle et la plateforme d'IA ? Pourquoi construire un modèle métier ?

9.  Discussion approfondie avec 4Paradigm Chen Yuqiang 丨Comment utiliser les grands modèles d'IA pour ouvrir le marché des logiciels traditionnels à l'échelle d'un billion?

10. Discussion approfondie avec He Xiaodong de JD Technology 丨Un "départ" il y a neuf ans : jeter les bases de la multimodalité et concourir pour les modèles à grande échelle

Grand modèle d'IA et série d'articles académiques :

1. L'"imitation" open source de ChatGPT fonctionne réellement ? Thèse UC Berkeley, persuasion ou aller de l'avant?

2. Discussion approfondie avec Wang Jinqiao 丨Zidong Taichu : Combien de papiers de haute qualité sont nécessaires pour construire un modèle domestique à grande échelle ? (deux)

3. Discussion approfondie avec Zhang Jiajun 丨Quels articles valent la peine d'être lus derrière le grand modèle de "Zidong Taichu" (1)

série comique

1.  Est-ce de la joie ou de la peine ? L'IA nous a en fait aidés à terminer le travail de bureau

2.  L'algorithme d'IA est un frère, l'exploitation et la maintenance de l'IA ne sont-elles pas un frère ?

3.  Comment l'optimisme social du big data est-il arrivé ?

4.  AI for Science, est-ce "science ou pas" ?

5.  Si vous voulez aider les mathématiciens, quel âge a l'IA ? 

6.  La personne qui a appelé Wang Xinling s'est avérée être l'entrepôt magique du lac intelligent

7.  Il s'avère que la carte des connaissances est une vache à lait pour "trouver des relations" ?

8.  Pourquoi l'informatique graphique peut-elle pousser positivement la laine de l'industrie noire ?

9.  AutoML : Économiser de l'argent pour acheter un "robot Shan Xia" ?

10.  AutoML : Votre base de fondue préférée est automatiquement achetée par les robots

11. Apprentissage par renforcement : l'intelligence artificielle joue aux échecs, faites un pas, combien de pas pouvez-vous voir ?

12.  Base de données de séries chronologiques : bon risque, n'a presque pas pénétré dans la fabrication industrielle haut de gamme

13.  Apprentissage actif : l'intelligence artificielle était-elle réellement une PUA ?

14.  Cloud Computing Serverless : Une flèche perçant les nuages, des milliers de soldats vont se rencontrer

15.  Réseau data center : les données arrivent sur le champ de bataille en 5 nanosecondes

16.   Réseau de centres de données : ce n'est pas effrayant d'être en retard, ce qui est effrayant, c'est que personne d'autre n'est en retard

Série de cadres d'IA :

1. Le groupe de personnes qui s'engagent dans des cadres d'apprentissage en profondeur sont soit des fous, soit des menteurs (1)

2. Le groupe de personnes qui s'engagent dans des cadres d'IA 丨 Liaoyuanhuo, Jia Yangqing (2)

3. Ceux qui s'engagent dans les frameworks d'IA (3) : le fanatique AlphaFold et les scientifiques chinois silencieux

4. Le groupe de personnes qui s'engagent dans le cadre de l'IA (4): la préquelle du cadre de l'IA, le passé du système de données volumineuses

Remarque : (3) et (4) ne sont inclus que dans "J'ai vu la tempête".

58cc092df75ee43937e40de1409bdf8e.jpeg

Je suppose que tu aimes

Origine blog.csdn.net/weixin_39640818/article/details/131606519
conseillé
Classement