Il est non seulement « gros »! L'analyse des grandes données derrière les détails techniques

Nous savons tous que parler de gros volumes de données, l'un des plus caractéristique notable est le « grand », ce simplement un « grand » mot, il rend l'entreprise face à des gros volumes de données commencent a dû utiliser le mode distribué de calcul, il y a un certain nombre de méthodes pour simplifier les calculs.

 

Il est non seulement « gros »! L'analyse des grandes données derrière les détails techniques

Lorsque vous traitez des informations à grande échelle, beaucoup de grandes applications de données à prendre en considération pour les applications élastiques, vous devez copier les données sur un certain nombre de positions différentes qui, si la quantité d'information a commencé à grossir, même de façon exponentielle la croissance.

 

L'attribut le plus important est que les grandes données ne sont pas sa taille, mais grand travail est qu'il est divisé en capacités de nombreuses petites opérations, sa capacité à gérer une des ressources de travail à travers plusieurs positions pour le traitement parallèle. Quand nous sommes confrontés à de grandes applications de données et l'architecture d'applications distribuées, quelles questions ont besoin d'attention? Cette question, nous craignons que. >>

 

Nous savons que si un ensemble de ressources informatiques distribuées doivent être collusion et de la coordination à travers l'Internet, leur disponibilité des applications devient très important, une fois que l'un des aspects de communication du réseau du problème, les données conduiront à des résultats inimaginables catastrophe.

 

En fait, pour l'instant de nombreuses grandes applications de données, la plupart de la sécurité et la stabilité de l'infrastructure réseau est très élevé, bien sûr, les ressources réseau et de données entre les échecs sont inévitables, même si la haute disponibilité du réseau est également très important, mais veulent concevoir la facilité d'utilisation parfaite est impossible.

 

Pour les architectes d'entreprise, la solution de la résilience du réseau est une solution très efficace, la résilience et la diversité réseau dépend chemin basculement de deux catégories. En plus des méthodes traditionnelles de temps moyen entre pannes, très grands critères de conception du réseau de données doivent inclure ces caractéristiques.

problème « Congestion » de gros volumes de données

Comme nous le savons tous, il est appelé une grande technologie de données, l'énorme quantité de données est certain, cependant, pour les grandes applications de données, et pas seulement à grande échelle, les données pour les situations d'urgence permettent également de nombreuses entreprises un mal de tête.

 

En période de grande circulation, la congestion est un problème grave. Cependant, la congestion peut conduire à plus de retard de mise en attente de temps et le taux de perte de paquets. En outre, la congestion peut également déclencher le transfert de poids, ce qui pourrait se permettre un réseau très chargé ne peut pas se permettre.

 

l'architecture de réseau doit être conçu pour réduire les points de congestion que possible. Conformément aux critères de conception de la disponibilité, réduire la congestion du réseau a besoin d'une diversité de parcours supérieur, afin de permettre la dispersion du trafic réseau sur un certain nombre de chemins différents. >>

Telle est l'opinion des experts de l'industrie senior, il a souligné, pour la plupart des applications de gros volumes de données, le retard de réseau est en fait pas une grosse affaire, si le temps calculé est de l'ordre de quelques secondes ou minutes, même si le réseau un retard plus important est insignifiant.

 

Cependant, les grandes applications de données généralement besoin d'avoir une synchronisation de données plus élevé, une caractéristique pour une grande expérience des services de données est très important, car cela signifie que les emplois sont exécutés en parallèle, alors que la plus grande entre chaque emploi les différences de performance peuvent conduire à l'échec de l'application.

évolutivité future jour de pluie, les données

Le regard de déposons sur un ensemble de nombres, beaucoup de gens savent Yahoo gère plus de 42.000 noeuds dans son grand environnement de données, mais à partir des données Hadoop Assistant, le nombre moyen d'un grand cluster de données noeuds 2013 seulement 100.

 

En d'autres termes, même si chaque serveur est configuré avec double redondance, puis soutenir le cluster ne nécessite que quatre commutateur d'accès, l'évolutivité est pas à un cluster maintenant Quelle est maintenant, mais comment l'équilibre déploiements futurs de support étendu échelle.

 

Si la conception de l'infrastructure est maintenant ne convient que pour les déploiements à petite échelle, alors comment cette architecture avec l'augmentation du nombre de noeuds et en constante évolution, l'évolutivité est pas la taille absolue, mais plus préoccupés par le chemin pour trouver des solutions à grande échelle suffisantes. >>

la segmentation du réseau est une partie importante composée de grands environnements de données, tout simplement, les techniques de segmentation du réseau peut signifier que vous avez besoin d'une grande quantité de données et le trafic réseau séparé de flux sur les avantages de le faire est à éviter en raison d'un coup découlant le fonctionnement normal de certains services clés.

 

De plus, les utilisateurs doivent également répondre à des locataires multiples exécutant plusieurs emplois, pour répondre à la performance ou les exigences de conformité de vérification. Le travail nécessaire pour obtenir la séparation logique de la charge du réseau , dans certains cas, également de réaliser un certain nombre d'occasions de celui - ci la séparation physique. Vous voulez en savoir le système de grandes données, vous pouvez vous joindre à la grande technologie de données d' apprentissage boutonnée Junyang: 522 189 307

Tout est inséparable de l'application-aware

Big Data est devenu l'un des mots emblématiques environnement cluster, à travers les différents besoins des différentes applications, de nombreux aspects des exigences de sensibilité des données de l'application pour commencer à augmenter, cela signifie un réseau pour supporter de multiples applications et multi-locataires, il il doit être en mesure de distinguer leur charge de travail et être en mesure de gérer correctement diverses charges de travail, cela est en fait très difficile.

 

Bonne expérience de l'application se compose d'une variété de facteurs, la congestion du réseau, l'évolutivité du réseau, de grandes compétences d'application de données, et tant de façons, la demande des utilisateurs et en avant pour ces applications et de grandes compétences de données, mais aussi pour améliorer l'expérience des indicateurs importants elle

Publié 181 articles originaux · a gagné les éloges 3 · vues 30000 +

Je suppose que tu aimes

Origine blog.csdn.net/mnbvxiaoxin/article/details/104909273
conseillé
Classement