méthode de comparaison multiple post hoc

1. Présentation du cas

Dans le cas de l'analyse de variance à un facteur, afin d'étudier l'effet du curcuma sur le temps de survie des souris hypotoniques hypoxiques, 36 souris ont été générées aléatoirement en trois groupes A, B et C, 12 dans chaque groupe, moitié mâle et moitié mâle, respectivement Trois doses différentes de curcuma, 10g/kg, 20g/kg et 40g/kg, ont été administrées par voie orale.Les souris de chaque groupe ont été placées dans des bocaux hermétiques de 250ml avec de la chaux sodée en même temps, et le temps de survie des souris a été observé et enregistré. Je veux étudier si le temps de survie des souris sous différentes doses de curcuma est différent.Après analyse, on constate qu'il y a une différence significative dans le modèle, indiquant que les moyennes globales des deux groupes ne sont pas toutes égales, mais si les moyennes globales des trois groupes A, B et C sont différentes. Que tous les nombres soient différents ou que deux d'entre eux aient des moyennes globales différentes, des recherches supplémentaires sont nécessaires (source de données de cas : Yan Hong, Xu Yongyong. Statistiques médicales [J ]. Maison d'édition de la santé populaire, 2015.).

2. Analyse du problème

Après une analyse de variance à un facteur, on constate que le modèle a une différence significative, indiquant que les moyennes globales de la paire ne sont pas toutes égales, mais si les moyennes globales des trois groupes A, B et C sont toutes inégales , ou deux des moyennes globales sont inégales, il est nécessaire d'effectuer en outre des comparaisons par paires de moyennes multiples, en utilisant la méthode de comparaison multiple.

3. Fonctionnement du logiciel et interprétation des résultats

(1) Importation de données

1. Format des données

Tout d'abord, organisez les données dans le format correct. Généralement, X est une colonne et Y est un exemple. Si les données analysées comportent des étiquettes de données, un autre tableau doit être ajouté pour l'explication. Le format des données est le suivant :

2. Importer des données

Téléchargez les données organisées dans le système SPSSAU comme suit :

Les résultats du téléchargement sont les suivants :

(2) Analyse de comparaison multiple post-hoc

Pour le processus d'analyse de variance à facteur unique, vous pouvez vous référer à l'article précédent, et le processus associé ne sera pas répété ici.

  1. Fonctionnement du logiciel
    Après l'analyse unidirectionnelle de la variance, effectuez des comparaisons par paires pour une recherche plus approfondie. Le chemin d'analyse consiste à cliquer sur [Méthode générale] → [Analyse de la variance], puis à analyser :

  1. Description de la méthode de comparaison multiple post-hoc

Il existe de nombreuses méthodes de comparaisons multiples, que l'on peut généralement trouver en fonction de la distribution de probabilité et du processus de développement utilisé dans son développement, comprenant généralement des méthodes dérivées du test t et du test q. À l'heure actuelle, ces deux méthodes sont largement utilisées. De plus, il existe quelques méthodes basées sur F La méthode de distribution est décrite en détail comme suit :

(1) Méthode LSD

LSD est la première méthode de comparaison multiple. LSD est très similaire au test t pour échantillon indépendant. La principale différence est que la méthode LSD satisfait d'abord le test F pour atteindre la signification, et utilise le carré moyen de l'erreur du test F comme variance combinée. La méthode LSD est simple en raison de son calcul , l'efficacité du test est élevée, elle est donc largement utilisée. Certains chercheurs ont comparé différentes méthodes de comparaison multiple post-événement par le biais d'expériences de simulation et ont constaté que lorsque le test F de la variance est significatif, la méthode LSD est la méthode de comparaison multiple avec l'efficacité de test la plus élevée, mais la méthode LSD a également des insuffisances évidentes, comme impliquer trop de moyens pour comparer des paires, ont une probabilité plus élevée de faire des erreurs de type I. Sa formule de calcul est la suivante :

tα/2 est la valeur critique de la distribution t, obtenue en vérifiant la table de distribution t, son degré de liberté est nk, n est le nombre total d'échantillons, k est le nombre de niveaux différents dans le facteur ; MSE est la variance au sein du groupe ; ni et nj sont respectivement la taille de l'échantillon du ième et du jième échantillon.
4. Prendre une décision basée sur le niveau de signification α, si la valeur absolue de la différence moyenne est supérieure à LSD, alors rejeter H0, sinon ne pas rejeter H0.

(2) Chefs

Le test de Scheffe définit toutes les combinaisons linéaires possibles. La valeur critique du test de Scheffe est de multiplier le degré de liberté entre les groupes par la valeur critique du test F. Cette méthode est plus efficace pour les conceptions déséquilibrées, mais le calcul de Scheffe est plus compliqué. que d'autres méthodes. La formule de calcul est la suivante :

(3) Correction de Bonferroni

L'inégalité de Bonferroni stipule que la probabilité totale qu'un ou plusieurs événements se produisent n'est pas supérieure à la somme des probabilités individuelles de ces événements. Cependant, on pense généralement que cette méthode est trop conservatrice (il est plus difficile d'obtenir la conclusion de rejeter l'hypothèse nulle), et la méthode de Bonferroni convient aux comparaisons multiples où le nombre de comparaisons n'est pas trop élevé (plus le nombre de comparaisons, le plus conservateur). Calculé comme suit :

(4) observation

L'idée de base de Sidak est proche de la méthode de Bonferroni. Généralement, sidak est meilleur que la méthode de Bonferroni. Il utilise un cas particulier dans la correction de Bonferroni pour estimer le niveau significatif commun entre tous les tests d'hypothèse.

(5) Tamhane T2 (variance non homogène)

Si la variance n'est pas homogène, mais que vous souhaitez effectuer plusieurs comparaisons, utilisez cette méthode. Le principe de son utilisation est que les données doivent respecter la normalité, mais pas l'homogénéité de la variance.

(6) test SNKQ

L'objectif fondamental de la méthode SNK est de diviser les moyens de traitement en sous-ensembles de traitements différents. Ces sous-ensembles sont homogènes en interne, mais il existe des différences entre les différents sous-ensembles, de sorte que SNK est également appelé test stratifié, qui utilise différentes normes de test pour déterminer la signification selon différentes portées. Comme sa statistique est q, on l'appelle aussi test q. Ses statistiques sont calculées comme suit :

Dans la formule, le numérateur est la différence entre les moyennes d'échantillon de deux groupes de comparaison A et B ; le dénominateur est l'erreur type de la différence ; dans la formule et dans �� et �� sont les cas des échantillons A et B respectivement, MS _ L'erreur est le carré moyen de l'erreur calculée dans l'analyse de variance susmentionnée.

(7) Essai de Duncan

La nouvelle méthode à plages multiples de Duncan, actuellement plus de littérature statistique, ne recommande pas l'utilisation de cette méthode, car la dérivation du taux d'erreur du test de comparaison multiple de Duncan est basée sur la condition monotone (croissance monotone ou décroissance monotone sans choc), qui est également Il existe de nombreuses raisons pour lesquelles la nouvelle méthode à plages multiples de Duncan est utilisée dans de nombreux résultats de tests sur les animaux.

3. Faites des comparaisons par paires

Dans cet exemple, le test SNK Q est utilisé pour les comparaisons par paires. Le résultat est le suivant :

Tableau ANOVA :

Le test SNK Q est le suivant :

  1. Lorsque la valeur moyenne
    est comparée entre le groupe A et le groupe B, la valeur moyenne est la valeur moyenne des données du groupe A et du groupe B respectivement. Le reste est pareil.
  2. Valeur absolue de la différence

(I) Valeur moyenne - (J) Valeur absolue de la valeur moyenne = valeur absolue de la différence, telle que |40,083-52,985|=12,875, et ainsi de suite.

3)K

La valeur limite du test Q doit non seulement tenir compte du degré de liberté, mais doit également tenir compte de la différence de rang R, qui est représentée ici par K

Les classements du Groupe A, du Groupe B et du Groupe C sont les suivants :

Par exemple, Groupe A et Groupe B : K=|1-2|+1=2 ; et ainsi de suite.

4)df

df est le degré de liberté. Le degré de liberté ici est le degré de liberté d'erreur. Il y a 3 ensembles de données, chacun avec 12 échantillons, donc le degré de liberté total est 12 × 3-1 = 25, et le degré de liberté de la variable indépendante est 3-1= 3, donc le degré de liberté d'erreur est 35-2=33 ;

5) 5% et 1%

En fonction de K et des degrés de liberté, consultez le tableau des valeurs limites du test q pour déterminer la valeur p.

6) avec

Se est l'erreur type de la différence, calculée comme suit :

7) Valeur LSR

valeur LSR=valeur critique Q*se, telle que 2,887*1,665=4,792 ; et ainsi de suite ;

4. Conclusion

Après une analyse de variance unidirectionnelle, il a été constaté qu'il y avait une différence significative dans le modèle, indiquant que les moyennes des deux groupes n'étaient pas égales.Après la méthode du test SNK Q pour des comparaisons multiples après l'événement, il a été constaté que le groupe A et le groupe B étaient significatifs au niveau de 0,01, ce qui indique qu'il existe des différences, et que le groupe A et le groupe C, le groupe B et le groupe C sont tous significatifs au niveau de 0,01, ce qui indique qu'il existe des différences significatives entre les trois groupes .

5. Conseils de connaissances

1. Comment faire les comparaisons multiples post hoc de Dunnett ?

Si le test post hoc de Dunnett est requis, vous pouvez utiliser le test non paramétrique dans la méthode générale SPSSAU et sélectionner la méthode de comparaison multiple comme méthode t de Dunn.

2. Comment résoudre l'invite « Qualité des données anormale » ?

Si le nombre de Y est inférieur à 2 sous un certain groupe de X, une situation anormale se produira à ce moment. Il est recommandé d'utiliser la classification et le résumé pour vérifier. Après avoir confirmé la situation anormale, utilisez la fonction d'échantillon de filtre pour traiter et analyser à nouveau.

Je suppose que tu aimes

Origine blog.csdn.net/m0_37228052/article/details/131978278
conseillé
Classement