Le dernier aperçu de 2022 Knowledge Tracking——Une enquête sur DLKT

Une enquête sur le traçage des connaissances basé sur l'apprentissage profond

L'article sera inclus dans la revue Knowledge-Based Systems en octobre 2022 - le lien d'origine
Dans l'article suivant, j'utiliserai DLKT au lieu du traçage des connaissances basé sur l'apprentissage en profondeur

Résumé

Il s'agit d'un article de synthèse évaluant divers modèles d'anciens DLKT.

  1. Classification fine des méthodes techniques proposées par les modèles DLKT traditionnels
  2. Analyse détaillée de la technologie KT
  3. Analyse des solutions techniques et principales améliorations de chaque modèle de DLKT
  4. Domaines de recherche possibles du DLKT à l'avenir

1. Introduction

De l'apprentissage en ligne → système de guidage intelligent → KT. Le KT permet non seulement aux apprenants de mieux comprendre leur apprentissage, mais permet également aux plateformes et aux enseignants de mieux comprendre et même d'intervenir. Ensuite, le KT traditionnel est introduit, à partir de BKT (présentant ses variantes de concept et ses avantages et inconvénients), puis les avantages de DKT, mais en raison de sa faible interprétabilité, de sa dépendance à long terme et de ses quelques fonctionnalités d'apprentissage, il existe des variations et des mises à jour constantes. Les revues précédentes n'ont pas approfondi l'analyse des contributions uniques et des orientations d'amélioration de chaque modèle DLKT. Contribuez comme suit

  1. Proposer une taxonomie claire et comparer l'architecture, la conception, la représentation des connaissances de chaque modèle
  2. Étude approfondie et résumé avec quatre ensembles de données, comparant les performances des DLKT
  3. Fournit des informations et discute des problèmes et des limites importants pour les recherches futures

2. Examen de l'AC

définition du problème

Le système d'éducation intelligent comprend principalement trois parties : les étudiants, les exercices (sujets) et les concepts de connaissances (compétences).

Définition du suivi des connaissances (KT) : séquence donnée de l'historique de l'élève s = { X 0 , . . . , X t } = { ( e 0 , a 0 ) , . . . , ( et , at ) } s=\{X_0,...,X_t\}=\{(e_0,a_0),...,(e_t,a_t)\}s={ X0,... ,Xt}={( e0,un0) ,... ,( et,unt)} , prédit le prochain ensemble d'interactionsX t + 1 X_{t+1}Xt + 1(Prédire précisément à + 1 a_{t+1}unt + 1

paradigme public

Différents modèles et méthodes utilisent presque la même conception : log-vraisemblance négative, donc l'objectif de KT est d'apprendre la log-vraisemblance négative d'un processus de pratique d'étudiant 1-t à un moment donné à travers des séquences historiques

insérez la description de l'image ici

Parmi eux, at et a ^ t a_t et \hat a_tuntetun^treprésentent respectivement les valeurs réelles et prédites.

3. Classification des modèles DLKT

Ces modèles DLKT sont résumés dans le tableau 1. Les techniques spécifiques sont divisées en DKT et ses variantes, basées sur le réseau de mémoire, basées sur le mécanisme d'attention et basées sur la structure des graphes.

insérez la description de l'image ici

DKT et ses variantes

DKT en 2015, en utilisant le modèle de séquence (RNN, LSTM, GRU) comme modèle de base, X t X_t via un codage à chaudXtLe problème de la conversion en vecteur d'entrée
insérez la description de l'image ici
insérez la description de l'image ici
DKT est, 1. ht h_thtReprésente l'état global 2. Incapable de simuler le lien entre les concepts 3. Tous les exercices ont la même importance. Les différentes extensions de DKT sont présentées dans le tableau, et ne seront pas décrites en détail

KT basé sur le réseau de mémoire

Développez la structure de la mémoire externe pour suivre des concepts complexes.Le plus classique est DKVMN en 2017. L'accent est mis sur la matrice clé pour stocker la représentation des compétences, et la matrice de valeurs pour stocker la situation des étudiants pour chaque compétence. Plus précisément, calculez le poids de l'attention du sujet et de la compétence → calculez la maîtrise du sujet par l'élève → combinez la difficulté du sujet et les informations sur la maîtrise de l'élève → prédisez.

SKVMN utilise un LSTM modifié (Hop-LSTM) pour la modélisation séquentielle, voir ces deux articles pour plus de détails.

KT basé sur le mécanisme de l'attention

En raison du manque d'interprétabilité de DKT, l'interprétabilité est directement incorporée dans une structure de modèle spécifique. Le point commun est le suivant : le poids du sujet dans l'interaction est appris grâce au mécanisme d'attention pour indiquer l'importance du sujet lors de la prédiction.

La plus classique est SAKT , qui applique pour la première fois le modèle du transformateur à KT. D'autres variantes sont présentées dans le tableau. Pour plus de détails, voir leurs articles respectifs.

KT basé sur la structure graphique

En raison de l'existence de divers modèles relationnels dans KT, certaines études utilisent l'apprentissage de la représentation graphique pour capturer ces capacités.

Le plus classique est le modèle GKT, d'autres variantes sont également présentées dans le tableau, voir les documents respectifs pour plus de détails

4. Comparaison et analyse des modèles DLKT

base de données

Il existe 6 ensembles de données couramment utilisés dans les ensembles de données de simulation KT, A09, A12, A15, ASSISTChall, Statique2011, Simulé-5, les différences spécifiques sont indiquées dans le tableau 2
insérez la description de l'image ici

Indice d'évaluation

AUC, plus la valeur est grande, meilleure est la capacité prédictive

Résultats expérimentaux et discussion

insérez la description de l'image ici

Il existe des différences dans les ensembles de données principaux de chaque modèle, et de nombreuses nouvelles structures ont joué un rôle positif (Bi-CLKT), et ont également amélioré les limites et les problèmes des modèles existants.

5. Conclusions et perspectives d'avenir

Dans l'environnement actuel de mégadonnées et de problèmes éducatifs, la demande d'enseigner aux étudiants en fonction de leurs aptitudes et la puissance de l'apprentissage en profondeur font progressivement du KT une technologie importante. Cet article passe en revue les modèles précédents et divise le modèle DLKT en quatre catégories, et présente en détail les avantages et les inconvénients de chaque modèle et les améliorations correspondantes pour les trois premiers problèmes. Parmi eux, le problème de dépendance est résolu par le mécanisme d'auto-attention, et le problème d'interprétabilité est toujours un défi dans l'apprentissage en profondeur.Les trois principales méthodes (intégration, fonction de perte contrainte et nouvelle structure) qui manquent de problèmes de caractéristiques ont leurs propres avantages et inconvénients.

De plus, il reste encore plusieurs défis :

  • Limitations des problèmes binaires, incapable de résoudre des problèmes subjectifs
  • Il est difficile d'introduire de nouvelles fonctionnalités d'apprentissage, obligeant les utilisateurs à extraire la modélisation et à fournir des données
  • Améliorez la capacité du modèle à identifier la structure des connaissances et développez le graphe de connexion des points de connaissance en un graphe de connaissances

Le contenu de l'article s'arrête ici. Personnellement, je trouve que cet article n'a pas trop de points innovants (pour les revues du district 1, il semble un peu liquide). Ici, DLKT est divisé en 4 catégories, ce que je crois que la plupart des chercheurs ont déjà fait tacitement. De plus, par rapport à la revue chinoise précédente, cet article présente différents modèles de manière plus complète et détaillée, mais il n'y a pas beaucoup d'extensions.Seuls les cas les plus classiques sont cités.L'avantage est que les débutants peuvent comprendre et s'y prendre plus rapidement. De plus, pour la comparaison et l'analyse des différents modèles, aucune conclusion exacte quantitative ou qualitative n'a été obtenue, et il n'y a pas de cadre de comparaison faisant autorité, et le contenu est relativement divergent.Bien sûr, les opinions varient d'une personne à l'autre.
À la fin de l'article, le suivi des connaissances est également proposé comme une technologie clé dans le système d'orientation intelligent.Dans l'environnement actuel du big data éducatif, il reste encore de nombreuses questions dignes de recherche (améliorer les performances prédictives, être plus explicable et mettre en œuvre des problèmes pratiques).

Je suppose que tu aimes

Origine blog.csdn.net/weixin_44546100/article/details/127758975
conseillé
Classement