Utilité de MemTrax et de la modélisation de l'apprentissage automatique dans la classification des troubles cognitifs légers

article de recherche

Auteurs : Bergeron, Michael F. | Landset, Sara | Zhou, Xianbo | Ding, Tao | Khoshgoftaar, Taghi M. | Zhao, Feng | Du, Bo | Chen, Xinjie | Wang, Xuan | Zhong, Lianmei | Liu, Xiaolei | Ashford, J. Wesson

DOI : 10.3233/JAD-191340

Revue : Revue de La maladie d'Alzheimer, vol. 77, non. 4, pp. 1545-1558, 2020

Abstract

Contexte:

L'incidence et la prévalence généralisées de La maladie d'Alzheimer et la déficience cognitive légère (MCI) a suscité un appel urgent à la recherche pour valider le dépistage et l'évaluation cognitifs de détection précoce.

Objectif:

Notre principal objectif de recherche était de déterminer si les mesures de performance MemTrax sélectionnées et les caractéristiques démographiques et de profil de santé pertinentes peuvent être utilisées efficacement dans des modèles prédictifs développés avec l'apprentissage automatique pour classer la santé cognitive (normale par rapport à MCI), comme l'indiquerait le Évaluation cognitive de Montréal (MoCA).

Méthodologie:

Nous avons mené une étude transversale sur 259 patients adultes en neurologie, clinique de la mémoire et médecine interne recrutés dans deux hôpitaux en Chine. Chaque patient a reçu le MoCA en chinois et s'est auto-administré la reconnaissance continue épisodique en ligne MemTrax test de mémoire en ligne le même jour. Des modèles de classification prédictifs ont été construits à l'aide de l'apprentissage automatique avec validation croisée 10 fois, et les performances du modèle ont été mesurées à l'aide de l'aire sous la courbe caractéristique de fonctionnement du récepteur (AUC). Les modèles ont été construits à l'aide de deux mesures de performance MemTrax (pourcentage correct, temps de réponse), ainsi que des huit caractéristiques démographiques et d'historique personnel courantes.

Résultats:

En comparant les apprenants à travers des combinaisons sélectionnées de scores et de seuils MoCA, Naïve Bayes était généralement l'apprenant le plus performant avec une performance de classification globale de 0.9093. De plus, parmi les trois premiers apprenants, les performances globales de classification basées sur MemTrax étaient supérieures en utilisant uniquement les quatre fonctionnalités les mieux classées (0.9119) par rapport à l'utilisation des 10 fonctionnalités communes (0.8999).

Conclusion:

Les performances de MemTrax peuvent être utilisées efficacement dans un modèle prédictif de classification d'apprentissage automatique application de dépistage pour détecter une déficience cognitive à un stade précoce.

INTRODUCTION

L'incidence et la prévalence reconnues (quoique sous-diagnostiquées) et l'escalade médicale, sociale et publique parallèle décomposition cellulaire les coûts et le fardeau de la maladie d'Alzheimer (MA) et des troubles cognitifs légers (MCI) pèsent de plus en plus sur toutes les parties prenantes [1, 2]. Ce scénario affligeant et en plein essor a suscité un appel urgent à la recherche pour valider précoce de violation de données instruments de dépistage et d'évaluation cognitifs pour une utilité pratique régulière dans des contextes personnels et cliniques pour les patients âgés dans diverses régions et populations [3]. Ces instruments doivent également permettre une traduction transparente des résultats informatifs dans les dossiers de santé électroniques. Les avantages seront réalisés en informant les patients et en aidant les médecins à reconnaître plus tôt les changements importants et ainsi permettre une stratification, une mise en œuvre et un suivi plus rapides et plus opportuns d'un traitement et de soins aux patients appropriés et plus rentables pour ceux qui commencent à éprouver déclin cognitif [3, 4].

L'outil informatisé MemTrax (https://memtrax.com) est une évaluation de reconnaissance continue simple et brève qui peut être auto-administrée en ligne pour mesurer les performances difficiles de la mémoire épisodique chronométrée où l'utilisateur répond à des images répétées et non à une présentation initiale [5, 6]. Des recherches récentes et les implications pratiques qui en découlent commencent à démontrer progressivement et collectivement l'efficacité clinique de MemTrax dans le dépistage précoce de la MA et du MCI [5–7]. Cependant, la comparaison directe de l'utilité clinique avec les santé cognitive L'évaluation et les normes conventionnelles sont justifiées pour éclairer la perspective professionnelle et corroborer l'utilité de MemTrax dans la détection précoce et l'aide au diagnostic. van der Hoek et al. [8] ont comparé des mesures de performance MemTrax sélectionnées (vitesse de réaction et pourcentage correct) au statut cognitif tel que déterminé par le Montreal Évaluation cognitive (MoCA). Cependant, cette étude s'est limitée à associer ces mesures de performance à la caractérisation de l'état cognitif (tel que déterminé par le MoCA) et à définir les plages relatives et les valeurs seuils. Par conséquent, pour approfondir cette enquête et améliorer les performances et l'efficacité de la classification, notre principale question de recherche était la suivante :

  • Les mesures de performance MemTrax sélectionnées d'un individu et les données démographiques et de santé pertinentes peuvent-elles profil caractéristiques soient utilisées efficacement dans un modèle prédictif développé avec l'apprentissage automatique pour classer la santé cognitive de manière dichotomique (normal versus MCI), comme l'indiquerait son score MoCA ?

Secondairement à cela, nous voulions savoir :

  • Avec les mêmes fonctionnalités, un modèle d'apprentissage automatique basé sur les performances MemTrax peut-il être appliqué efficacement à un patient pour prédire la gravité (légère ou sévère) dans certaines catégories de troubles cognitifs, comme cela serait déterminé par un diagnostic clinique indépendant ?

L'avènement et l'évolution de l'application pratique de l'intelligence artificielle et de l'apprentissage automatique dans le dépistage/la détection ont déjà démontré des avantages pratiques distincts, la modélisation prédictive guidant efficacement les cliniciens dans l'évaluation difficile de la santé cognitive/cerveau et de la gestion des patients. Dans notre étude, nous avons choisi une approche similaire dans la modélisation de la classification MCI et la discrimination de la gravité des troubles cognitifs, comme confirmé par le diagnostic clinique de trois ensembles de données représentant des patients hospitalisés et externes volontaires sélectionnés dans deux hôpitaux en Chine. À l'aide de la modélisation prédictive de l'apprentissage automatique, nous avons identifié les apprenants les plus performants à partir des différentes combinaisons ensemble de données/apprenant et classé les fonctionnalités pour nous guider dans la définition des applications de modèles les plus pratiques sur le plan clinique.

Nos hypothèses étaient qu'un modèle validé basé sur MemTrax peut être utilisé pour classer la santé cognitive de manière dichotomique (normale ou MCI) sur la base du critère de seuil de score global MoCA, et qu'un modèle prédictif MemTrax similaire peut être utilisé efficacement pour distinguer la gravité dans certaines catégories de diagnostiqué cliniquement déficience cognitive. La démonstration des résultats attendus serait essentielle pour soutenir l'efficacité de MemTrax en tant qu'écran de détection précoce du déclin cognitif et de la classification des troubles cognitifs. Une comparaison favorable avec une prétendue norme de l'industrie, complétée par une facilité et une rapidité d'utilisation beaucoup plus grandes, aiderait les cliniciens à adopter cet outil simple, fiable et accessible comme dépistage initial pour détecter les déficits cognitifs au stade précoce (y compris prodromique). Une telle approche et une telle utilité pourraient donc inciter des soins et des interventions plus opportuns et mieux stratifiés pour les patients. Ces informations avant-gardistes et ces mesures et modèles améliorés pourraient également être utiles pour atténuer ou arrêter la progression de la démence, y compris la MA et les démences liées à la MA (ADRD).

Matériels et méthodes

Population étudiée

Entre janvier 2018 et août 2019, une recherche transversale a été réalisée sur des patients recrutés dans deux hôpitaux en Chine. L'administration de MemTrax [5] à des personnes âgées de 21 ans et plus et la collecte et l'analyse de ces données ont été examinées, approuvées et administrées conformément aux normes éthiques de la Humain Comité de protection des sujets de l'Université de Stanford. MemTrax et tous les autres tests de cette étude globale ont été effectués conformément à la déclaration d'Helsinki de 1975 et approuvés par le comité d'examen institutionnel du premier hôpital affilié de l'université médicale de Kunming à Kunming, Yunnan, Chine. Chaque utilisateur a reçu un consentement éclairé formulaire à lire/réviser, puis accepter volontairement de participer.

Les participants ont été recrutés parmi le groupe de patients externes de la clinique de neurologie de l'hôpital de Yanhua (sous-ensemble de données YH) et le clinique de la mémoire au premier hôpital affilié de Kunming Medical Université (sous-ensemble de données XL) à Pékin, Chine. Les participants ont également été recrutés parmi les patients hospitalisés en neurologie (sous-ensemble de données XL) et en médecine interne (sous-ensemble de données KM) au premier hôpital affilié de l'Université médicale de Kunming. Les critères d'inclusion comprenaient 1) les hommes et les femmes âgés d'au moins 21 ans, 2) la capacité de parler chinois (mandarin) et 3) la capacité de comprendre les instructions verbales et écrites. Les critères d'exclusion étaient les déficiences visuelles et motrices empêchant les participants de terminer le Test Mem Trax, ainsi que l'incapacité de comprendre les instructions de test spécifiques.

Version chinoise de MemTrax

La ligne La plateforme de test MemTrax a été traduite en chinois (URL : https://www.memtrax.com.cn) et adapté pour être utilisé via WeChat (Shenzhen Tencent Computer Systems Co. LTD., Shenzhen, Guangdong, Chine) pour l'auto-administration. Les données ont été stockées sur un serveur cloud (Ali Cloud) situé en Chine et sous licence d'Alibaba (Alibaba Technology Co. Ltd., Hangzhou, Zhejiang, Chine) par SJN Biomed LTD (Kunming, Yunnan, Chine). Des détails spécifiques sur MemTrax et les critères de validité des tests utilisés ici ont été décrits précédemment [6]. Le test a été fourni gratuitement aux patients.

Procédures d'étude

Pour les patients hospitalisés et ambulatoires, un questionnaire papier général permettant de recueillir des informations démographiques et personnelles telles que l'âge, le sexe, les années d'études, la profession, vivant seules ou avec la famille, et les antécédents médicaux ont été administrés par un membre de l'équipe de l'étude. Après avoir rempli le questionnaire, les tests MoCA [12] et MemTrax ont été administrés (MoCA en premier) avec un maximum de 20 minutes entre les tests. Le pourcentage correct de MemTrax (MTx-% C), le temps de réponse moyen (MTx-RT) et la date et l'heure du test ont été enregistrés sur papier par un membre de l'équipe d'étude pour chaque participant testé. Le questionnaire rempli et les résultats du MoCA ont été téléchargés dans une feuille de calcul Excel par le chercheur qui a administré les tests et vérifiés par un collègue avant que les fichiers Excel ne soient enregistrés pour les analyses.

Test Mem Trax

Le test en ligne MemTrax comprenait 50 images (25 uniques et 25 répétitions ; 5 séries de 5 images de scènes ou d'objets courants) présentées dans un ordre pseudo-aléatoire spécifique. Le participant devait (selon les instructions) toucher le bouton Démarrer sur l'écran pour commencer le test et commencer à visualiser la série d'images et toucher à nouveau l'image sur l'écran aussi rapidement que possible chaque fois qu'une image répétée apparaissait. Chaque image est apparue pendant 3 s ou jusqu'à ce que l'image sur l'écran soit touchée, ce qui a provoqué la présentation immédiate de l'image suivante. À l'aide de l'horloge interne de l'appareil local, MTx-RT pour chaque image a été déterminée par le temps écoulé entre la présentation de l'image et le moment où l'écran a été touché par le participant en réponse à l'indication de la reconnaissance de l'image comme une image déjà affichée. pendant le test. MTx-RT a été enregistré pour chaque image, avec 3 s complètes enregistrées indiquant aucune réponse. MTx-% C a été calculé pour indiquer le pourcentage d'images répétées et initiales auxquelles l'utilisateur a répondu correctement (vrai positif + vrai négatif divisé par 50). Des détails supplémentaires sur l'administration et la mise en œuvre de MemTrax, la réduction des données, les données invalides ou « sans réponse » et les analyses de données primaires sont décrits ailleurs [6].

Le test MemTrax a été expliqué en détail et un test pratique (avec des images uniques autres que celles utilisées dans le test pour enregistrer les résultats) a été fourni aux participants en milieu hospitalier. Les participants aux sous-ensembles de données YH et KM ont passé le test MemTrax sur un smartphone chargé avec l'application sur WeChat ; alors qu'un nombre limité de patients du sous-ensemble de données XL utilisaient un iPad et que les autres utilisaient un smartphone. Tous les participants ont passé le test MemTrax sous la surveillance discrète d'un enquêteur de l'étude.

Évaluation cognitive de Montréal

La version de Pékin du MoCA chinois (MoCA-BC) [13] a été administrée et notée par des chercheurs formés conformément aux instructions officielles du test. De manière appropriée, le MoCA-BC s'est avéré être un outil fiable test cognitif dépistage à tous les niveaux d'éducation chez les adultes âgés chinois [14]. Chaque test prenait environ 10 à 30 minutes à administrer en fonction des capacités cognitives du participant respectif.

Modélisation de la classification MoCA

Il y avait un total de 29 fonctionnalités utilisables, dont deux MemTrax tester les mesures de performance et 27 fonctionnalités liées à la démographie et à la santé informations pour chaque participant. Le résultat global du test MoCA de chaque patient a été utilisé comme dépistage cognitif « benchmark » pour entraîner nos modèles prédictifs. Par conséquent, étant donné que MoCA a été utilisé pour créer l'étiquette de classe, nous ne pouvions pas utiliser le score agrégé (ou l'un des scores du sous-ensemble MoCA) en tant que caractéristique indépendante. Nous avons effectué des expériences préliminaires dans lesquelles nous avons modélisé (classification de la santé cognitive définie par le MoCA) les trois sous-ensembles de données d'origine des hôpitaux/cliniques individuellement, puis combinés à l'aide de toutes les fonctionnalités. Cependant, tous les mêmes éléments de données n'ont pas été recueillis dans chacune des quatre cliniques représentant les trois sous-ensembles de données ; ainsi, bon nombre de nos fonctionnalités dans l'ensemble de données combiné (lors de l'utilisation de toutes les fonctionnalités) avaient une incidence élevée de valeurs manquantes. Nous avons ensuite construit des modèles avec l'ensemble de données combiné en utilisant uniquement des caractéristiques communes, ce qui a permis d'améliorer les performances de classification. Cela s'explique probablement par une combinaison d'avoir plus d'instances avec lesquelles travailler en combinant les trois sous-ensembles de données de patients et aucune caractéristique avec une prévalence indue de valeurs manquantes (une seule caractéristique dans l'ensemble de données combiné, le type de travail, avait des valeurs manquantes, affectant seulement trois cas de patients), car seules les caractéristiques communes enregistrées sur les trois sites ont été incluses. Notamment, nous n'avions pas de critère de rejet spécifique pour chaque caractéristique qui n'a finalement pas été incluse dans l'ensemble de données combiné. Cependant, dans notre modélisation préliminaire des ensembles de données combinées, nous avons d'abord utilisé toutes les caractéristiques de chacun des trois sous-ensembles de données distincts sur les patients. Cela a largement abouti à des performances du modèle nettement inférieures à la modélisation préliminaire initiale sur chaque sous-ensemble de données individuel. De plus, alors que les performances de classification des modèles construits à l'aide de toutes les caractéristiques étaient encourageantes, pour tous les apprenants et tous les schémas de classification, les performances se sont améliorées pour deux fois plus de modèles en utilisant uniquement les caractéristiques communes. En fait, parmi ceux qui ont fini par être nos meilleurs apprenants, tous les modèles sauf un se sont améliorés en éliminant les fonctionnalités non courantes.

L'ensemble de données agrégé final (YH, XL et KM combinés) comprenait 259 instances, chacune représentant un participant unique qui a passé les tests MemTrax et MoCA. Il y avait 10 fonctionnalités indépendantes partagées : Mesures de performance MemTrax : MTx-% C et MTx-RT moyen ; informations démographiques et sur les antécédents médicaux : âge, sexe, années d'études, type de travail (cols bleus/cols blancs), soutien social (si le candidat vit seul ou avec sa famille), et réponses oui/non indiquant si l'utilisateur avait un antécédents de diabète, d'hyperlipidémie ou de traumatisme crânien. Deux mesures supplémentaires, le score agrégé MoCA et le score agrégé MoCA ajusté en fonction des années d'études [12], ont été utilisées séparément pour développer des étiquettes de classification dépendantes, créant ainsi deux schémas de modélisation distincts à appliquer à notre ensemble de données combiné. Pour chaque version (ajustée et non ajustée) du score MoCA, les données ont de nouveau été modélisées séparément pour la classification binaire en utilisant deux seuils de critères différents - celui initialement recommandé [12] et une autre valeur utilisée et promue par d'autres [8, 15]. Dans le schéma de classification à seuil alternatif, un patient était considéré comme ayant une santé cognitive normale s'il obtenait un score ≥23 au test MoCA et un MCI si le score était de 22 ou moins ; alors que, dans le format de classification initial recommandé, le patient devait obtenir un score de 26 ou mieux sur le MoCA pour être étiqueté comme ayant une santé cognitive normale.

Données filtrées pour la modélisation de la classification MoCA

Nous avons examiné plus en détail la classification MoCA à l'aide de quatre techniques de classement des caractéristiques couramment utilisées : le chi carré, le rapport de gain, le gain d'information et l'incertitude symétrique. Pour une perspective intermédiaire, nous avons appliqué les classeurs à l'ensemble de données combinées en utilisant chacun de nos quatre schémas de modélisation. Tous les classeurs se sont mis d'accord sur les mêmes caractéristiques principales, c'est-à-dire l'âge, le nombre d'années d'études et les deux mesures de performance MemTrax (MTx-% C, moyenne MTx-RT). Nous avons ensuite reconstruit les modèles en utilisant chaque technique de sélection de caractéristiques pour entraîner les modèles uniquement sur les quatre principales caractéristiques (voir Sélection de fonctionnalité ci-dessous).

Les huit variantes finales résultantes des schémas de modélisation de la classification des scores MoCA sont présentées dans le tableau 1.

Tableau 1

Résumé des variations du schéma de modélisation utilisé pour la classification MoCA (Normal Santé cognitive versus MCI)

Schéma de modélisationSanté cognitive normale (classe négative)MCI (classe positive)
Ajusté-23 non filtré/filtré101 (% 39.0)158 (% 61.0)
Ajusté-26 non filtré/filtré49 (% 18.9)210 (% 81.1)
Non ajusté-23 Non filtré/Filtré92 (% 35.5)167 (% 64.5)
Non ajusté-26 Non filtré/Filtré42 (% 16.2)217 (% 83.8)

Le nombre et le pourcentage respectifs du nombre total de patients dans chaque classe sont différenciés par l'ajustement du score pour l'éducation (ajusté ou non ajusté) et le seuil de classification (23 ou 26), appliqué aux deux ensembles de fonctionnalités (non filtré et filtré).

Modélisation d'évaluation clinique basée sur MemTrax

De nos trois sous-ensembles de données d'origine (YH, XL, KM), seuls les patients du sous-ensemble de données XL ont été indépendamment cliniquement diagnostiqués pour une déficience cognitive (c'est-à-dire que leurs scores MoCA respectifs n'ont pas été utilisés pour établir une classification entre normal et altéré). Plus précisément, les patients XL ont été diagnostiqués avec soit Test de la maladie d'Alzheimer (MA) ou démence vasculaire (VaD). Dans chacune de ces catégories de diagnostic principal, il y avait une autre désignation pour MCI. Les diagnostics de MCI, de démence, de trouble neurocognitif vasculaire et de trouble neurocognitif dû à la MA étaient basés sur des critères diagnostiques spécifiques et distinctifs décrits dans le Manuel diagnostique et statistique des troubles mentaux : DSM-5 [16]. Compte tenu de ces diagnostics raffinés, deux schémas de modélisation de classification ont été appliqués séparément au sous-ensemble de données XL pour distinguer le niveau de gravité (degré de déficience) pour chaque catégorie de diagnostic principal. Les données utilisées dans chacun de ces schémas de modélisation de diagnostic (AD et VaD) comprenaient des informations démographiques et sur les antécédents du patient, ainsi que les performances de MemTrax (MTx-% C, moyenne MTx-RT). Chaque diagnostic était étiqueté léger s'il était désigné MCI ; sinon, il était considéré comme grave. Nous avons initialement envisagé d'inclure le score MoCA dans les modèles de diagnostic (léger versus sévère) ; mais nous avons déterminé que cela irait à l'encontre de l'objectif de notre schéma de modélisation prédictive secondaire. Ici, les apprenants seraient formés en utilisant d'autres caractéristiques du patient facilement disponibles pour le fournisseur et les mesures de performance du test MemTrax plus simple (au lieu du MoCA) par rapport à la référence «gold standard», le diagnostic clinique indépendant. Il y avait 69 cas dans l'ensemble de données de diagnostic AD et 76 cas de VaD (tableau 2). Dans les deux ensembles de données, il y avait 12 caractéristiques indépendantes. En plus des 10 caractéristiques incluses dans la classification du score MoCA, les antécédents du patient comprenaient également des informations sur les antécédents d'hypertension et d'accident vasculaire cérébral.

Tableau 2

Résumé des variations du schéma de modélisation utilisé pour la classification de la gravité du diagnostic (léger contre sévère)

Schéma de modélisationLéger (classe négative)Sévère (classe positive)
MCI-AD contre AD12 (% 17.4)57 (% 82.6)
MCI-VaD contre VaD38 (% 50.0)38 (% 50.0)

Le nombre et le pourcentage respectifs du nombre total de patients dans chaque classe sont différenciés par catégorie de diagnostic principal (AD ou VaD).

Statistique

La comparaison des caractéristiques des participants et d'autres caractéristiques numériques entre les sous-ensembles de données pour chaque stratégie de classification de modèle (pour prédire la santé cognitive MoCA et la gravité du diagnostic) a été réalisée à l'aide du langage de programmation Python (version 2.7.1) [17]. Les différences de performance du modèle ont été initialement déterminées à l'aide d'une ANOVA à un ou deux facteurs (selon le cas) avec un intervalle de confiance de 95 % et le test de différence significative honnête (HSD) de Tukey pour comparer les moyennes de performance. Cet examen des différences entre les performances des modèles a été effectué en utilisant une combinaison de Python et R (version 3.5.1) [18]. Nous avons utilisé cette approche (bien que sans doute moins qu'optimale) uniquement comme une aide heuristique à ce stade. stade précoce pour les comparaisons initiales des performances du modèle dans l'anticipation d'une application clinique potentielle. Nous avons ensuite utilisé le test bayésien des rangs signés en utilisant une distribution a posteriori pour déterminer la probabilité des différences de performance du modèle [19]. Pour ces analyses, nous avons utilisé l'intervalle -0.01, 0.01, ce qui signifie que si deux groupes avaient une différence de performance inférieure à 0.01, ils étaient considérés comme identiques (dans la zone d'équivalence pratique), ou sinon ils étaient différents (un meilleur que L'autre). Pour effectuer la comparaison bayésienne des classificateurs et calculer ces probabilités, nous avons utilisé la bibliothèque baycomp (version 1.0.2) pour Python 3.6.4.

Modélisation prédictive

Nous avons construit des modèles prédictifs en utilisant les dix variations totales de nos schémas de modélisation pour prédire (classer) le résultat du test MoCA de chaque patient ou la gravité du diagnostic clinique. Tous les apprenants ont été appliqués et les modèles ont été construits à l'aide de la plate-forme logicielle open source Weka [20]. Pour notre analyse préliminaire, nous avons utilisé 10 algorithmes d'apprentissage couramment utilisés : 5-Nearest Neighbors, deux versions de l'arbre de décision C4.5, Logistic Regression, Multilayer Perceptron, Naïve Bayes, deux versions de Random Forest, Radial Basis Function Network et Support Vector. Machine. Les principaux attributs et contrastes de ces algorithmes ont été décrits ailleurs [21] (voir l'annexe respective). Ceux-ci ont été choisis parce qu'ils représentent une variété de différents types d'apprenants et parce que nous avons démontré le succès de leur utilisation dans des analyses précédentes sur des données similaires. Les paramètres d'hyperparamètres ont été choisis à partir de nos recherches précédentes, ce qui indique qu'ils sont robustes sur une variété de données différentes [22]. Sur la base des résultats de notre analyse préliminaire utilisant le même ensemble de données combinées avec des caractéristiques communes qui ont été utilisées par la suite dans l'analyse complète, nous avons identifié trois apprenants qui ont fourni des performances solides et constantes dans toutes les classifications : régression logistique, Bayes naïf et machine à vecteur de support.

Validation croisée et métrique de performance du modèle

Pour toutes les modélisations prédictives (y compris les analyses préliminaires), chaque modèle a été construit à l'aide d'une validation croisée 10 fois, et les performances du modèle ont été mesurées à l'aide de l'aire sous la courbe caractéristique de fonctionnement du récepteur (AUC). La validation croisée a commencé par la division aléatoire de chacun des 10 ensembles de données du schéma de modélisation en 10 segments égaux (plis), en utilisant neuf de ces segments respectifs pour former le modèle et le segment restant pour les tests. Cette procédure a été répétée 10 fois, en utilisant un segment différent comme jeu de test à chaque itération. Les résultats ont ensuite été combinés pour calculer le résultat/performance du modèle final. Pour chaque combinaison apprenant/ensemble de données, tout ce processus a été répété 10 fois, les données étant réparties différemment à chaque fois. Cette dernière étape a réduit le biais, assuré la réplicabilité et aidé à déterminer la performance globale du modèle. Au total (pour les schémas de classification du score MoCA et de la gravité du diagnostic combinés), 6,600 1,800 modèles ont été construits. Cela comprenait 6 3 modèles non filtrés (10 schémas de modélisation appliqués à l'ensemble de données × 10 apprenants × 1,800 exécutions × 4,800 plis = 4 3 modèles) et 4 10 modèles filtrés (10 schémas de modélisation appliqués à l'ensemble de données × 4,800 apprenants × XNUMX techniques de sélection de caractéristiques × XNUMX exécutions × XNUMX plis = XNUMX XNUMX modèles).

Sélection de fonctionnalité

Pour les modèles filtrés, la sélection des caractéristiques (à l'aide des quatre méthodes de classement des caractéristiques) a été effectuée dans le cadre de la validation croisée. Pour chacun des 10 plis, étant donné que 10 % différents de l'ensemble de données étaient les données de test, seules les quatre principales caractéristiques sélectionnées pour chaque ensemble de données d'apprentissage (c'est-à-dire les neuf autres plis ou les 90 % restants de l'ensemble de données) ont été utilisées. pour construire les modèles. Nous n'avons pas été en mesure de confirmer quelles étaient les quatre fonctionnalités utilisées dans chaque modèle, car ces informations ne sont ni stockées ni mises à disposition dans la plateforme de modélisation que nous avons utilisée (Weka). Cependant, étant donné la cohérence de notre sélection initiale des principales caractéristiques lorsque les classements ont été appliqués à l'ensemble de données combinées et la similitude ultérieure des performances de modélisation, ces mêmes caractéristiques (âge, années d'études, MTx-% C et moyenne MTx-RT ) sont probablement les quatre éléments les plus fréquemment utilisés en même temps que la sélection des caractéristiques dans le cadre du processus de validation croisée.

RÉSULTATS

Les caractéristiques numériques des participants (y compris les scores MoCA et les mesures de performance MemTrax) des ensembles de données respectifs pour chaque stratégie de classification de modèle pour prédire la santé cognitive indiquée par MoCA (normale par rapport à MCI) et la gravité du diagnostic (léger par rapport à sévère) sont présentées dans le tableau 3.

Tableau 3

Caractéristiques des participants, scores MoCA et performances MemTrax pour chaque stratégie de classification de modèle

Stratégie de classementÂgeÉducationMoCA ajustéMoCA non ajustéMTx-%CMTx-RT
Catégorie MoCA61.9 ans (13.1)9.6 ans (4.6)19.2 (6.5)18.4 (6.7)74.8% (15.0)1.4 s (0.3)
Gravité du diagnostic65.6 ans (12.1)8.6 ans (4.4)16.7 (6.2)15.8 (6.3)68.3% (13.8)1.5 s (0.3)

Les valeurs indiquées (moyenne, SD) différenciées par les stratégies de classification de modélisation sont représentatives de l'ensemble de données combiné utilisé pour prédire la santé cognitive indiquée par MoCA (MCI versus normal) et le sous-ensemble de données XL utilisé uniquement pour prédire la gravité du diagnostic (léger versus sévère).

Pour chaque combinaison de score MoCA (ajusté/non ajusté) et de seuil (26/23), il y avait une différence statistique (p = 0.000) dans chaque comparaison par paires (santé cognitive normale versus MCI) pour l'âge, l'éducation et la performance MemTrax (MTx-% C et MTx-RT). Chaque sous-ensemble de données de patients dans la classe MCI respective pour chaque combinaison avait en moyenne environ 9 à 15 ans de plus, faisait état d'environ cinq années d'études de moins et avait des performances MemTrax moins favorables pour les deux mesures.

Les résultats des performances de modélisation prédictive pour les classifications de score MoCA utilisant les trois meilleurs apprenants, la régression logistique, Naïve Bayes et la machine à vecteur de support, sont présentés dans le tableau 4. Ces trois ont été choisis en fonction de la performance absolue la plus élevée de l'apprenant dans tous les différents modèles. appliqué aux jeux de données pour tous les schémas de modélisation. Pour l'ensemble de données non filtré et la modélisation, chacune des valeurs de données du tableau 4 indique la performance du modèle en fonction de la moyenne respective de l'AUC dérivée des 100 modèles (10 exécutions × 10 fois) construits pour chaque combinaison apprenant/schéma de modélisation, avec la valeur la plus élevée respective. apprenant performant indiqué en gras. Alors que pour la modélisation de l'ensemble de données filtré, les résultats rapportés dans le tableau 4 reflètent les performances moyennes globales du modèle à partir de 400 modèles pour chaque apprenant utilisant chacune des méthodes de classement des caractéristiques (4 méthodes de classement des caractéristiques × 10 exécutions × 10 plis).

Tableau 4

Résultats dichotomiques des performances de classification des scores MoCA (AUC; 0.0 à 1.0) pour chacun des trois apprenants les plus performants pour tous les schémas de modélisation respectifs

Ensemble de fonctionnalités utiliséNote MoCASeuil de coupureRégression logistiqueBayes naïfsSoutenir la machine vectorielle
Non filtré (10 fonctionnalités)Ajusté230.88620.89130.8695
260.89710.92210.9161
Non corrigé230.91030.90850.8995
260.88340.91530.8994
Filtré (4 fonctionnalités)Ajusté230.89290.89540.8948
260.91880.92470.9201
Non corrigé230.91350.91340.9122
260.91590.92360.9177

En utilisant des variations de l'ensemble de fonctionnalités, du score MoCA et du seuil de coupure du score MoCA, les performances les plus élevées pour chaque schéma de modélisation sont indiquées dans goupille (pas nécessairement statistiquement différent de tous les autres goupille pour le modèle respectif).

En comparant les apprenants à travers toutes les combinaisons de versions et de seuils de score MoCA (ajustés / non ajustés et 23/26, respectivement) dans l'ensemble de données combiné non filtré (c'est-à-dire en utilisant les 10 caractéristiques communes), Naïve Bayes était généralement l'apprenant le plus performant avec un performance de classification de 0.9093. En considérant les trois premiers apprenants, les tests de rang signé corrélés bayésiens ont indiqué que la probabilité (Pr) de Naïve Bayes surperformant la régression logistique était de 99.9 %. De plus, entre Naïve Bayes et Support Vector Machine, une probabilité de 21.0 % d'équivalence pratique dans la performance de l'apprenant (donc, une probabilité de 79.0 % que Naïve Bayes surpasse Support Vector Machine), couplée à la probabilité de 0.0 % que Support Vector Machine fonctionne mieux, de manière mesurable renforce l'avantage de performance de Naïve Bayes. Une comparaison plus poussée de la version du score MoCA pour tous les apprenants/seuils a suggéré un léger avantage de performance en utilisant les scores MoCA non ajustés par rapport aux scores ajustés (0.9027 contre 0.8971, respectivement ; Pr (non ajusté > ajusté) = 0.988). De même, une comparaison du seuil de coupure entre tous les apprenants et les versions de score MoCA a indiqué un petit avantage de performance de classification en utilisant 26 comme seuil de classification par rapport à 23 (0.9056 contre 0.8942, respectivement ; Pr (26 > 23) = 0.999). Enfin, en examinant les performances de classification pour les modèles utilisant uniquement les résultats filtrés (c'est-à-dire les quatre fonctionnalités les mieux classées uniquement), Naïve Bayes (0.9143) était numériquement l'apprenant le plus performant sur toutes les versions/seuils de score MoCA. Cependant, pour toutes les techniques de classement des caractéristiques combinées, tous les apprenants les plus performants ont obtenu des résultats similaires. Les tests bayésiens de classement signé ont montré une probabilité de 100 % d'équivalence pratique entre chaque paire d'apprenants filtrés. Comme pour les données non filtrées (utilisant les 10 caractéristiques communes), il y avait à nouveau un avantage de performance pour la version non ajustée du score MoCA (Pr (non ajusté > ajusté) = 1.000), ainsi qu'un avantage tout aussi net pour le seuil de classification de 26 (Pr (26 > 23) = 1.000 0.9119). Notamment, la performance moyenne de chacun des trois meilleurs apprenants sur toutes les versions/seuils de score MoCA en utilisant uniquement les quatre fonctionnalités les mieux classées a dépassé la performance moyenne de tout apprenant sur les données non filtrées. Sans surprise, les performances de classification des modèles filtrés (utilisant les quatre caractéristiques les mieux classées) étaient globalement supérieures (0.8999) aux modèles non filtrés (10), quels que soient les modèles de méthode de classement des caractéristiques qui ont été comparés à ces modèles respectifs utilisant les 100 caractéristiques communes. Caractéristiques. Pour chaque méthode de sélection de caractéristiques, il y avait XNUMX % de probabilité d'un avantage en termes de performances par rapport aux modèles non filtrés.

Avec les patients pris en compte pour la classification de la gravité du diagnostic de MA, les différences entre les groupes (MCI-MA versus MA) pour l'âge (p = 0.004), éducation (p = 0.028), score MoCA ajusté/non ajusté (p = 0.000), et MTx-% C (p = 0.008) étaient statistiquement significatifs ; alors que pour MTx-RT ce n'était pas (p = 0.097). Avec les patients pris en compte pour la classification de la gravité du diagnostic VaD, les différences entre les groupes (MCI-VaD versus VaD) pour le score MoCA ajusté/non ajusté (p = 0.007) et MTx-% C (p = 0.026) et MTx-RT (p = 0.001) étaient statistiquement significatifs ; alors que pour l'âge (p = 0.511) et l'éducation (p = 0.157) il n'y avait pas de différences significatives entre les groupes.

Les résultats des performances de la modélisation prédictive pour les classifications de gravité du diagnostic à l'aide des trois apprenants précédemment sélectionnés, Régression logistique, Naïve Bayes et Support Vector Machine, sont présentés dans le tableau 5. Alors que d'autres apprenants examinés ont démontré des performances légèrement plus fortes individuellement avec l'une des deux catégories de diagnostic clinique , les trois apprenants que nous avions identifiés comme les plus favorables dans notre modélisation précédente offraient les performances les plus cohérentes avec les deux nouveaux schémas de modélisation. En comparant les apprenants dans chacune des principales catégories de diagnostic (AD et VaD), il n'y avait pas de différence de performance de classification cohérente entre les apprenants pour MCI-VaD par rapport à VaD, bien que la machine à vecteur de support ait généralement obtenu des résultats plus importants. De même, il n'y avait pas de différences significatives entre les apprenants pour la classification MCI-AD par rapport à AD, bien que Naïve Bayes (NB) ait eu un léger avantage de performance sur la régression logistique (LR) et juste une pluralité négligeable sur la machine à vecteur de support, avec des probabilités de 61.4 %. et 41.7 % respectivement. Dans les deux ensembles de données, il y avait un avantage de performance global pour Support Vector Machine (SVM), avec Pr (SVM > LR) = 0.819 et Pr (SVM > NB) = 0.934. Notre performance globale de classification parmi tous les apprenants pour prédire la gravité du diagnostic dans le sous-ensemble de données XL était meilleure dans la catégorie de diagnostic VaD par rapport à AD (Pr (VAD > AD) = 0.998).

Tableau 5

Résultats dichotomiques de la classification de la gravité du diagnostic clinique (ASC ; 0.0 à 1.0) pour chacun des trois apprenants les plus performants pour les deux schémas de modélisation respectifs

Schéma de modélisationRégression logistiqueBayes naïfsSoutenir la machine vectorielle
MCI-AD contre AD0.74650.78100.7443
MCI-VaD contre VaD0.80330.80440.8338

Les performances les plus élevées pour chaque schéma de modélisation sont indiquées dans goupille (pas nécessairement statistiquement différent des autres goupille).

DISCUSSION

La détection précoce des changements dans la santé cognitive est importante utilité pratique dans la gestion de la santé personnelle et la santé publique. En effet, il s'agit également d'une priorité élevée dans les milieux cliniques pour les patients du monde entier. L'objectif commun est d'alerter les patients, les soignants et les prestataires et d'inciter à un traitement plus tôt approprié et rentable et à des soins longitudinaux pour ceux qui commencent à connaître un déclin cognitif. En fusionnant nos trois sous-ensembles de données d'hôpitaux/cliniques, nous avons identifié trois apprenants distinctement préférables (avec un remarquable -Naïve Bayes) pour construire des modèles prédictifs utilisant Mesures de performance MemTrax qui pourraient classer de manière fiable l'état de santé cognitive de manière dichotomique (santé cognitive normale ou MCI) comme l'indiquerait un score global MoCA. Notamment, les performances de classification globales pour les trois apprenants se sont améliorées lorsque nos modèles n'utilisaient que les quatre fonctionnalités les mieux classées qui englobaient principalement ces mesures de performance MemTrax. De plus, nous avons révélé le potentiel étayé d'utiliser les mêmes mesures de performance des apprenants et de MemTrax dans un schéma de modélisation de la classification de l'aide au diagnostic pour distinguer la gravité de deux catégories de diagnostic de démence : AD et VaD.

Test de mémoire est au cœur de la détection précoce de la MA [23, 24]. Ainsi, il est opportun que MemTrax soit un outil en ligne acceptable, engageant et facile à mettre en œuvre. test de dépistage de la mémoire épisodique dans la population générale [6]. La précision de la reconnaissance et les temps de réponse de cette tâche de performance continue sont particulièrement révélateurs pour identifier la détérioration précoce et évolutive et les déficits conséquents dans les processus neuroplastiques liés à l'apprentissage, à la mémoire et à la cognition. Autrement dit, les modèles basés ici en grande partie sur les mesures de performance MemTrax sont sensibles et sont plus susceptibles de révéler facilement et à un coût minimal des déficits neuropathologiques biologiques au cours de la phase transitoire asymptomatique bien avant une perte fonctionnelle plus importante [25]. Ashford et al. ont examiné de près les modèles et les comportements de la précision de la mémoire de reconnaissance et du temps de réponse chez les utilisateurs en ligne qui ont participé seuls à MemTrax [6]. En respectant le fait que ces distributions sont essentielles à la modélisation optimale et au développement d'applications de soins aux patients valides et efficaces, la définition de profils de reconnaissance et de temps de réponse cliniquement applicables est essentielle pour établir une référence fondamentale précieuse pour l'utilité clinique et de recherche. La valeur pratique de MemTrax dans le dépistage de la MA pour les troubles cognitifs à un stade précoce et le soutien au diagnostic différentiel doit ensuite être examinée de plus près dans le contexte d'un contexte clinique où les comorbidités et les capacités cognitives, sensorielles et motrices affectant les performances du test peuvent être prises en compte. Et pour éclairer la perspective professionnelle et encourager l'utilité clinique pratique, il est d'abord impératif de démontrer la comparaison avec un test d'évaluation de la santé cognitive établi, même si ce dernier peut être clairement limité par la lourdeur de la logistique des tests, les facteurs dissuasifs de l'éducation et de la langue et les influences culturelles [26] . À cet égard, la comparaison favorable de MemTrax en termes d'efficacité clinique avec le MoCA qui est communément présenté comme une norme de l'industrie est significative, en particulier lorsque l'on considère la plus grande facilité d'utilisation et l'acceptation de MemTrax par les patients.

Une exploration antérieure comparant MemTrax à MoCA met en évidence la justification et les preuves préliminaires justifiant notre étude de modélisation [8]. Cependant, cette comparaison préalable associait simplement les deux mesures de performance clés de MemTrax que nous avons examinées à l'état cognitif tel que déterminé par le MoCA et définissait les plages respectives et les valeurs seuils. Nous avons approfondi l'évaluation de l'utilité clinique de MemTrax en explorant une approche basée sur la modélisation prédictive qui fournirait une considération plus individualisée d'autres paramètres spécifiques au patient potentiellement pertinents. Contrairement à d'autres, nous n'avons pas trouvé d'avantage dans la performance du modèle en utilisant une correction de l'éducation (ajustement) du score MoCA ou en faisant varier le seuil du score global MoCA discriminant la santé cognitive des 26 à 23 recommandés à l'origine [12, 15]. En fait, l'avantage des performances de classification favorisait l'utilisation du score MoCA non ajusté et du seuil supérieur.

Points clés de la pratique clinique

L'apprentissage automatique est souvent mieux utilisé et plus efficace dans la modélisation prédictive lorsque les données sont étendues et multidimensionnelles, c'est-à-dire lorsqu'il existe de nombreuses observations et un large éventail concomitant d'attributs de grande valeur (contributifs). Pourtant, avec ces données actuelles, les modèles filtrés avec seulement quatre fonctionnalités sélectionnées ont obtenu de meilleurs résultats que ceux utilisant les 10 fonctionnalités communes. Cela suggère que notre ensemble de données hospitalières agrégées ne possédait pas les caractéristiques les plus appropriées sur le plan clinique (valeur élevée) pour classer de manière optimale les patients de cette manière. Néanmoins, l'accent mis sur le classement des caractéristiques sur les mesures de performance clés de MemTrax - MTx-% C et MTx-RT - soutient fortement la création de modèles de dépistage précoce des déficits cognitifs autour de ce test qui est simple, facile à administrer, peu coûteux et révélateur pertinent concernant performance de la mémoire, du moins en ce moment comme écran initial pour une classification binaire de l'état de santé cognitif. Compte tenu de la pression croissante sur les prestataires et les systèmes de santé, les processus de dépistage des patients et les applications cliniques doivent être développés de manière appropriée en mettant l'accent sur la collecte, le suivi et la modélisation des caractéristiques des patients et des paramètres de test les plus utiles, avantageux et efficaces dans le diagnostic. et soutien à la gestion des patients.

Les deux mesures clés MemTrax étant au cœur de la classification MCI, notre apprenant le plus performant (Naïve Bayes) avait une performance prédictive très élevée dans la plupart des modèles (AUC supérieur à 0.90) avec un rapport vrai positif/faux positif proche ou légèrement supérieur à 4 : 1. Une application clinique translationnelle utilisant cet apprenant permettrait ainsi de capturer (classer correctement) de loin la plupart des personnes ayant un déficit cognitif, tout en minimisant le coût associé à la classification erronée d'une personne ayant une santé cognitive normale comme ayant un déficit cognitif (faux positif) ou manque cette classification chez ceux qui ont un déficit cognitif (faux négatif). L'un ou l'autre de ces scénarios de classification erronée pourrait imposer un fardeau psychosocial excessif au patient et aux soignants.

Alors que dans les analyses préliminaires et complètes, nous avons utilisé les dix apprenants dans chaque schéma de modélisation, nous avons concentré nos résultats sur les trois classificateurs affichant les performances les plus cohérentes. Il s'agissait également de mettre en évidence, sur la base de ces données, les apprenants qui, selon les prévisions, fonctionneraient de manière fiable à un niveau élevé dans une application clinique pratique pour déterminer la classification de l'état cognitif. De plus, parce que cette étude était conçue comme une enquête introductive sur l'utilité de l'apprentissage automatique sur le dépistage cognitif et ces défis cliniques opportuns, nous avons pris la décision de garder les techniques d'apprentissage simples et généralisées, avec un réglage minimal des paramètres. Nous apprécions que cette approche ait pu limiter le potentiel de capacités prédictives spécifiques au patient plus étroitement définies. De même, alors que la formation des modèles en utilisant uniquement les principales caractéristiques (approche filtrée) nous informe davantage sur ces données (spécifiques aux lacunes des données collectées et soulignant la valeur de l'optimisation du temps et des ressources cliniques précieux), nous reconnaissons qu'il est prématuré de restreindre la portée des modèles et, par conséquent, toutes (et d'autres caractéristiques) devraient être prises en compte dans les recherches futures jusqu'à ce que nous ayons un profil plus définitif des caractéristiques prioritaires qui seraient applicables à l'ensemble de la population. Ainsi, nous reconnaissons également pleinement que des données plus inclusives et largement représentatives et une optimisation de ces modèles et d'autres seraient nécessaires avant de les intégrer dans une application clinique efficace, en particulier pour tenir compte des comorbidités affectant les performances cognitives qui devraient être prises en compte dans une évaluation clinique ultérieure.

L'utilité de MemTrax a été davantage édifiée par la modélisation de la gravité de la maladie basée sur un diagnostic clinique distinct. Une meilleure performance de classification globale pour prédire la gravité de la VAD (par rapport à la DA) n'a pas été surprenant compte tenu des caractéristiques du profil des patients dans les modèles spécifiques à la santé vasculaire et le risque d'AVC, c'est-à-dire l'hypertension, l'hyperlipidémie, le diabète et (évidemment) les antécédents d'AVC. Bien qu'il aurait été plus souhaitable et approprié que la même évaluation clinique soit menée sur des patients appariés ayant une santé cognitive normale pour former les apprenants avec ces données plus inclusives. Ceci est particulièrement justifié, car MemTrax est destiné à être utilisé principalement pour la détection précoce d'un déficit cognitif et le suivi ultérieur des changements individuels. Il est également plausible que la distribution plus souhaitable des données dans l'ensemble de données VaD ait contribué en partie aux performances de modélisation comparativement meilleures. L'ensemble de données VaD était bien équilibré entre les deux classes, alors que l'ensemble de données AD avec beaucoup moins de patients MCI ne l'était pas. En particulier dans les petits ensembles de données, même quelques instances supplémentaires peuvent faire une différence mesurable. Les deux perspectives sont des arguments raisonnables qui sous-tendent les différences dans les performances de modélisation de la gravité de la maladie. Cependant, il est prématuré d'attribuer proportionnellement l'amélioration des performances aux caractéristiques numériques de l'ensemble de données ou aux caractéristiques inhérentes à la présentation clinique considérée. Néanmoins, ce roman a démontré l'utilité d'un modèle de classification prédictive MemTrax dans le rôle de soutien au diagnostic clinique offre une perspective précieuse et affirme la poursuite d'un examen supplémentaire avec les patients à travers le continuum du MCI.

La mise en œuvre et l'utilité démontrée de MemTrax et de ces modèles en Chine, où la langue et la culture sont radicalement différentes des autres régions d'utilité établie (par exemple, la France, les Pays-Bas et les États-Unis) [7, 8, 27], souligne encore le potentiel pour l'acceptation mondiale généralisée et la valeur clinique d'une plate-forme basée sur MemTrax. Il s'agit d'un exemple démontrable d'efforts vers l'harmonisation des données et le développement de normes internationales pratiques et de ressources de modélisation pour le dépistage cognitif qui sont standardisées et facilement adaptables pour une utilisation dans le monde entier.

Prochaines étapes de la modélisation et de l'application du déclin cognitif

Le dysfonctionnement cognitif dans la MA se produit en effet sur un continuum, et non par étapes ou étapes discrètes [28, 29]. Cependant, à cette première phase, notre objectif était d'abord d'établir notre capacité à construire un modèle incorporant MemTrax qui peut fondamentalement distinguer « normal » de « non normal ». Des données empiriques plus inclusives (p. ex., imagerie cérébrale, caractéristiques génétiques, biomarqueurs, comorbidités et marqueurs fonctionnels de activités nécessitant des capacités cognitives contrôle) [30] dans diverses régions du monde, populations et groupes d'âge pour former et développer des modèles d'apprentissage automatique plus sophistiqués (y compris des ensembles correctement pondérés) prendront en charge un plus grand degré de classification améliorée, c'est-à-dire la capacité de catégoriser des groupes de patients avec MCI en sous-ensembles plus petits et plus définitifs le long du continuum du déclin cognitif. De plus, des diagnostics cliniques concomitants pour des individus appartenant à des populations de patients de diverses régions sont essentiels pour former efficacement ces modèles plus inclusifs et prévisibles robustes. Cela facilitera une gestion de cas stratifiée plus spécifique pour ceux qui ont des antécédents, des influences et des profils cognitifs caractéristiques plus étroitement définis et optimisera ainsi l'aide à la décision clinique et les soins aux patients.

Une grande partie de la recherche clinique pertinente à ce jour a porté sur des patients atteints de démence au moins légère ; et, en pratique, trop souvent l'intervention du patient n'est tentée qu'à des stades avancés. Cependant, étant donné que le déclin cognitif commence bien avant que les critères cliniques de la démence ne soient remplis, un dépistage précoce basé sur MemTrax appliqué efficacement pourrait encourager une éducation appropriée des individus sur la maladie et ses progressions et inciter des interventions plus précoces et plus opportunes. Ainsi, la détection précoce pourrait soutenir des implications appropriées allant de l'exercice, de l'alimentation, du soutien émotionnel et de la socialisation améliorée à l'intervention pharmacologique et renforcer les changements de comportement et de perception liés au patient qui, seuls ou ensemble, pourraient atténuer ou potentiellement arrêter la progression de la démence [31, 32] . De plus, avec une efficacité dépistage précoce, les individus et leurs familles peuvent être incités à envisager des essais cliniques ou à obtenir des conseils et d'autres services sociaux pour aider à clarifier les attentes et les intentions et à gérer les tâches quotidiennes. Une validation supplémentaire et une utilité pratique généralisée de ces manières pourraient contribuer à atténuer ou à arrêter la progression du MCI, AD et ADRD pour de nombreuses personnes.

En effet, l'extrémité inférieure de la tranche d'âge des patients dans notre étude ne représente pas la population traditionnellement concernée par la MA. Néanmoins, l'âge moyen de chaque groupe utilisé dans les schémas de modélisation de classification basés sur le score/seuil MoCA et la gravité du diagnostic (tableau 3) souligne qu'une nette majorité (plus de 80 %) a au moins 50 ans. Cette distribution est donc très appropriée à la généralisation, soutenant l'utilité de ces modèles dans la population caractérisant les personnes typiquement affectées par début précoce et les maladies neurocognitives en plein essor dues à la MA et à la VAD. De plus, des preuves et des perspectives récentes mettent l'accent sur les facteurs reconnus (p. ex., l'hypertension, l'obésité, le diabète et le tabagisme) susceptibles de contribuer à une les scores de risque vasculaire de l'adulte et de la quarantaine et les lésions cérébrales vasculaires subtiles qui en résultent qui se développent insidieusement avec des effets évidents même chez les jeunes adultes [33–35]. Par conséquent, l'opportunité de dépistage initial la plus optimale pour détecter stadifier les déficits cognitifs et lancer des stratégies de prévention et d'intervention efficaces pour lutter avec succès contre la démence émergeront de l'examen des facteurs contributifs et des indicateurs antécédents à travers le spectre d'âge, y compris le début de l'âge adulte et potentiellement même l'enfance (en notant la pertinence des facteurs génétiques tels que l'apolipoprotéine E dès le début de la gestation).

Dans la pratique, des diagnostics cliniques valides et des procédures coûteuses d'imagerie avancée, de profilage génétique et de mesure de biomarqueurs prometteurs ne sont pas toujours facilement disponibles ni même réalisables pour de nombreux prestataires. Ainsi, dans de nombreux cas, la classification initiale de l'état de santé cognitif global peut devoir être dérivée de modèles utilisant d'autres paramètres simples fournis par le patient (p. problèmes de mémoire, les médicaments actuels et les limitations d'activités de routine) et les caractéristiques démographiques communes [7]. Registres tels que l'Université de Californie La santé du cerveau Registre (https://www.brainhealthregistry.org/) [27] et d'autres avec une plus grande étendue inhérente de symptômes autodéclarés, de mesures qualitatives (par exemple, le sommeil et la cognition quotidienne), les médicaments, l'état de santé et les antécédents, et des données démographiques plus détaillées seront déterminantes pour développer et valider l'application pratique de ces modèles plus primitifs dans la clinique. En outre, un test tel que MemTrax, qui a démontré son utilité dans l'évaluation de la fonction de la mémoire, peut en fait fournir une estimation sensiblement meilleure de la pathologie de la MA que les marqueurs biologiques. Étant donné que la principale caractéristique de la pathologie de la MA est la perturbation de la neuroplasticité et une perte extrêmement complexe des synapses, qui se manifeste sous forme épisodique dysfonctionnement de la mémoire, une mesure qui évalue la mémoire épisodique peut en fait fournissent une meilleure estimation du fardeau pathologique de la MA que les marqueurs biologiques chez le patient vivant [36].

Avec tous les modèles prédictifs, qu'ils soient complétés par des données complexes et inclusives issues d'une technologie de pointe et d'informations cliniques raffinées dans plusieurs domaines ou limités à des informations plus basiques et facilement disponibles caractéristiques des profils de patients existants, l'avantage reconnu de l'intelligence artificielle et l'apprentissage automatique est que les modèles résultants peuvent synthétiser et «apprendre» par induction à partir de nouvelles données et perspectives pertinentes fournies par l'utilisation continue des applications. Suite au transfert de technologie pratique, à mesure que les modèles ici (et à développer) sont appliqués et enrichis avec plus de cas et de données pertinentes (y compris les patients présentant des comorbidités qui pourraient présenter un déclin cognitif consécutif), les performances de prédiction et la classification de la santé cognitive seront plus robustes, résultant en une utilité d'aide à la décision clinique plus efficace. Cette évolution sera plus complètement et pratiquement réalisée avec l'intégration de MemTrax dans des plates-formes personnalisées (ciblées sur les capacités disponibles) que les prestataires de soins de santé pourraient utiliser en temps réel dans la clinique.

Des données longitudinales significatives très recherchées sont indispensables à la validation et à l'utilité du modèle MemTrax pour le soutien au diagnostic et les soins aux patients. En observant et en enregistrant les changements concomitants (le cas échéant) de l'état clinique dans une gamme adéquate de MCI normal à précoce, les modèles d'évaluation et de classification continues appropriées peuvent être formés et modifiés à mesure que les patients vieillissent et sont traités. Autrement dit, une utilité répétée peut aider au suivi longitudinal des changements cognitifs légers, à l'efficacité de l'intervention et au maintien de soins stratifiés informés. Cette approche s'aligne plus étroitement sur la pratique clinique et la gestion des patients et des cas.

Limites

Nous apprécions le défi et la valeur de la collecte de données cliniques propres dans un cadre clinique/hospitalier contrôlé. Néanmoins, cela aurait renforcé notre modélisation si nos ensembles de données incluaient plus de patients présentant des caractéristiques communes. De plus, spécifique à notre modélisation diagnostique, il aurait été plus souhaitable et plus approprié que la même évaluation clinique soit menée sur des patients appariés ayant une santé cognitive normale pour former les apprenants. Et comme le soulignent les performances de classification plus élevées à l'aide de l'ensemble de données filtré (uniquement les quatre fonctionnalités les mieux classées), plus générales et les mesures/indicateurs de santé cognitive se seraient probablement améliorés modélisation des performances avec un plus grand nombre de caractéristiques communes à tous les patients.

Certains participants pourraient avoir souffert de manière concomitante d'autres maladies qui auraient pu entraîner des déficiences cognitives transitoires ou chroniques. En dehors du sous-ensemble de données XL où les patients ont été classés par diagnostic comme ayant soit la MA, soit la VAD, les données de comorbidité n'ont pas été collectées/rapportées dans le groupe de patients YH, et la comorbidité prédominante rapportée de loin dans le sous-ensemble de données KM était le diabète. On peut toutefois soutenir que l'inclusion de patients dans nos schémas de modélisation présentant des comorbidités susceptibles d'entraîner ou d'exacerber un niveau de déficit cognitif et une baisse conséquente des performances de MemTrax serait plus représentative de la population de patients ciblée dans le monde réel pour ce dépistage cognitif précoce plus généralisé. et approche de modélisation. À l'avenir, un diagnostic précis des comorbidités affectant potentiellement les performances cognitives est largement bénéfique pour optimiser les modèles et les applications de soins aux patients qui en résultent.

Enfin, les patients des sous-ensembles de données YH et KM ont utilisé un smartphone pour passer le test MemTrax, tandis qu'un nombre limité de patients des sous-ensembles de données XL ont utilisé un iPad et les autres ont utilisé un smartphone. Cela aurait pu introduire une différence mineure liée à l'appareil dans les performances de MemTrax pour la modélisation de la classification MoCA. Cependant, les différences (le cas échéant) de MTx-RT, par exemple, entre les appareils seraient probablement négligeables, en particulier si chaque participant recevait un test de "pratique" juste avant la performance du test enregistré. Néanmoins, l'utilité de ces deux appareils portables compromet potentiellement la comparaison directe et/ou l'intégration avec d'autres résultats MemTrax où les utilisateurs ont répondu à des images répétées en touchant la barre d'espace sur un clavier d'ordinateur.

Points clés sur l'utilitaire de modélisation prédictive MemTrax

  • • Nos modèles prédictifs les plus performants englobant des mesures de performance MemTrax sélectionnées pourraient classer de manière fiable l'état de santé cognitive (santé cognitive normale ou MCI) comme l'indiquerait le test MoCA largement reconnu.
  • • Ces résultats soutiennent l'intégration de mesures de performance MemTrax sélectionnées dans une application de dépistage de modèle prédictif de classification pour les troubles cognitifs à un stade précoce.
  • • Notre modélisation de classification a également révélé le potentiel d'utilisation des performances de MemTrax dans des applications pour distinguer la gravité du diagnostic de démence.

Ces nouvelles découvertes établissent des preuves définitives à l'appui de l'utilité de l'apprentissage automatique dans la construction de modèles de classification robustes et améliorés basés sur MemTrax pour l'aide au diagnostic dans la gestion efficace des cas cliniques et les soins aux patients pour les personnes souffrant de troubles cognitifs.

REMERCIEMENTS

Nous reconnaissons le travail de J. Wesson Ashford, Curtis B. Ashford et leurs collègues pour le développement et la validation de la tâche et de l'outil de reconnaissance continue en ligne (MemTrax) utilisés ici et nous sommes reconnaissants aux nombreux patients atteints de démence qui ont contribué à la recherche fondamentale critique . Nous remercions également Xianbo Zhou et ses collègues de SJN Biomed LTD, ses collègues et collaborateurs dans les hôpitaux/cliniques, en particulier les Drs. M. Luo et M. Zhong, qui ont aidé au recrutement des participants, à la planification des tests et à la collecte, l'enregistrement et la gestion frontale des données, et les participants bénévoles qui ont donné de leur temps précieux et se sont engagés à passer les tests et à fournir les précieuses données que nous devons évaluer dans cette étude. Cette l'étude a été financée en partie par le MD Scientific Research Programme de l'Université médicale de Kunming (subvention n° 2017BS028 à XL) et programme de recherche du département des sciences et technologies du Yunnan (subvention n° 2019FE001 (-222) à XL).

J. Wesson Ashford a déposé une demande de brevet pour l'utilisation du paradigme de reconnaissance continue spécifique décrit dans cet article à des fins générales. test de mémoire.

MemTrax, LLC est une société détenue par Curtis Ashford, et cette société gère le test de mémoire système décrit dans cet article.

Divulgations des auteurs disponibles en ligne (https://www.j-alz.com/manuscript-disclosures/19-1340r2).

test de mémoire test de démence test de perte de mémoire test de perte de mémoire à court terme ram tester l'esprit alimentation variété de livres test cognitif en ligne
Curtis Ashford – Coordonnateur de la recherche cognitive

Références

 Alzheimer's Association (2016) Faits sur la maladie d'Alzheimer en 2016 et chiffres. Démence d'Alzheimer 12, 459–509.
[2] Gresenz CR , Mitchell JM , Marrone J , Federoff HJ (2019) Effet du stade précoce La maladie d'Alzheimer sur les résultats financiers des ménages. Éco Santé 29, 18–29.
 Foster NL , Bondi MW , Das R , Foss M , Hershey LA , Koh S , Logan R , Poole C , Shega JW , Sood A , Thothala N , Wicklund M , Yu M , Bennett A , Wang D (2019) neurologie : ensemble de mesure de la qualité des troubles cognitifs légers. Neurologie 93, 705–713.
[4] Tong T , Thokala P , McMillan B , Ghosh R , Brazier J (2017) Rentabilité de l'utilisation tests de dépistage cognitif pour détecter la démence et les troubles cognitifs légers en soins primaires. Int J Geriatr Psychiatrie 32, 1392-1400.
[5] Ashford JW, Gere E, Bayley PJ (2011) Mémoire de mesure en grand groupe à l'aide d'un test de reconnaissance continue. J Alzheimers Dis 27, 885–895.
 Ashford JW, Tarpin-Bernard F, Ashford CB, Ashford MT (2019) Une tâche informatisée de reconnaissance continue pour la mesure de la mémoire épisodique. J Alzheimers Dis 69, 385–399.
 Bergeron MF , Landset S , Tarpin-Bernard F , Ashford CB , Khoshgoftaar TM , Ashford JW (2019) Performance de la mémoire épisodique dans la modélisation de l'apprentissage automatique pour prédire la classification de l'état de santé cognitif. J Alzheimers Dis 70, 277–286.
[8] van der Hoek MD , Nieuwenhuizen A , Keijer J , Ashford JW (2019) Test Mem Trax par rapport à l'estimation montréalaise de l'évaluation cognitive des troubles cognitifs légers. J Alzheimer Dis 67, 1045-1054.
 Falcone M, Yadav N, Poellabauer C, Flynn P (2013) Utilisation de voyelles isolées pour la classification des lésions cérébrales traumatiques légères. En 2013, Conférence internationale IEEE sur l'acoustique, la parole et le traitement du signal, Vancouver, BC, pp. 7577–7581.
 Dabek F, Caban JJ (2015) Tirer parti des mégadonnées pour modéliser la probabilité de développer des troubles psychologiques après une commotion cérébrale. Procedia Comput Sci 53, 265–273.
 Climent MT , Pardo J , Munoz-Almaraz FJ , Guerrero MD , Moreno L (2018) Arbre de décision pour la détection précoce des troubles cognitifs par les pharmaciens communautaires. Avant Pharmacol 9, 1232.
 Nasreddine ZS , Phillips NA , Bedirian V , Charbonneau S , Whitehead V , Collin I , Cummings JL , Chertkow H (2005) L'évaluation cognitive de Montréal, MoCA : Un bref outil de dépistage des troubles cognitifs légers. J Am Geriatr Soc 53, 695–699.
 Yu J , Li J , Huang X (2012) La version de Pékin de l'évaluation cognitive montréalaise comme outil de dépistage bref de la déficience cognitive légère : une étude communautaire. BMC Psychiatrie 12, 156.
 Chen KL , Xu Y , Chu AQ , Ding D , Liang XN , Nasreddine ZS , Dong Q , Hong Z , Zhao QH , Guo QH (2016) Validation de la version chinoise de l'évaluation cognitive de base de Montréal pour le dépistage des troubles cognitifs légers. J Am Geriatr Soc 64, e285–e290.
 Carson N , Leach L , Murphy KJ (2018) Un réexamen des scores seuils de l'évaluation cognitive de Montréal (MoCA). Int J Geriatr Psychiatrie 33, 379-388.
 American Psychiatric Association (2013) Task Force Manuel diagnostique et statistique des troubles mentaux : DSM-5™, American Psychiatric Publishing, Inc., Washington, DC.
 Python. Python Software Foundation, http://www.python.org, consulté le 15 novembre 2019.
 R Core Group, R : Un langage et un environnement pour le calcul statistique R Foundation for Statistical Computing, Vienne, Autriche. https://www.R-project.org/, 2018, consulté le 15 novembre 2019.
 Benavoli A , Corani G , Demšar J , Zaffalon M (2017) Il est temps de changer : un didacticiel pour comparer plusieurs classificateurs grâce à l'analyse bayésienne. J Mach Learn Res 18, 1–36.
 Frank E , Hall MA , Witten IH (2016) L'établi WEKA. Dans Exploration de données: outils et techniques pratiques d'apprentissage automatique, Frank E, Hall MA, Witten IH, Pal CJ, éds. Morgan Kaufmann https://www.cs.waikato.ac.nz/ml/weka/Witten_et_al_2016_appendix.pdf
 Bergeron MF, Landset S, Maugans TA, Williams VB, Collins CL, Wasserman EB, Khoshgoftaar TM (2019) Apprentissage automatique dans la modélisation de la résolution des symptômes de commotion cérébrale sportive au lycée. Med Sci Sports Exercice 51, 1362–1371.
 Van Hulse J , Khoshgoftaar TM , Napolitano A (2007) Perspectives expérimentales sur l'apprentissage à partir de données déséquilibrées. Dans Actes de la 24e conférence internationale sur l'apprentissage automatique, Corvalis, Oregon, États-Unis, p. 935-942.
 Ashford JW, Kolm P, Colliver JA, Bekian C, Hsu LN (1989) Évaluation du patient Alzheimer et mini-état mental : analyse de la courbe caractéristique des éléments.P. J Gerontol 44, 139–146.
[24] Ashford JW, Jarvik L (1985) La maladie d'Alzheimer: La plasticité neuronale prédispose-t-elle à la dégénérescence neurofibrillaire axonale ? N Engl J Med 313, 388–389.
[25] Jack CR Jr , Therneau TM , Weigand SD , ​​Wiste HJ , Knopman DS , Vemuri P , Lowe VJ , Mielke MM , Roberts RO , Machulda MM , Graff-Radford J , Jones DT , Schwarz CG , Gunter JL , Senjem ML , Rocca WA , Petersen RC (2019) Prévalence des entités du spectre de la maladie d'Alzheimer biologiquement et cliniquement définies à l'aide du National Institute on Aging-Alzheimer's Recherche associative cadre. JAMA Neurol 76, 1174–1183.
[26] Zhou X, Ashford JW (2019) Advances in screening instruments for La maladie d'Alzheimer. Vieillissement Med 2, 88-93.
[27] Weiner MW, Nosheny R, Camacho M, Truran-Sacrey D, Mackin RS, Flenniken D, Ulbricht A, Insel P, Finley S, Fockler J, Veitch D (2018) La santé du cerveau Registre : une plateforme Internet pour le recrutement, l'évaluation et le suivi longitudinal des participants aux études en neurosciences. Démence d'Alzheimer 14, 1063–1076.
[28] Ashford JW , Schmitt FA (2001) Modeling the time-course of Démence d'Alzheimer. Curr Psychiatrie Rep 3, 20-28.
 Li X , Wang X , Su L , Hu X , Han Y (2019) Sino Longitudinal Study on Cognitive Decline (SILCODE) : protocole d'une étude observationnelle longitudinale chinoise visant à développer des modèles de prédiction du risque de conversion en troubles cognitifs légers chez les personnes présentant des troubles cognitifs subjectifs déclin. BMJ Ouvert 9, e028188.
[30] Tarnanas I, Tsolaki A, Wiederhold M, Wiederhold B, Tsolaki M (2015) Variabilité de la progression des biomarqueurs sur cinq ans pour démence de la maladie d'Alzheimer prédiction : un marqueur d'activités instrumentales complexes de la vie quotidienne peut-il combler les lacunes ? Démence d'Alzheimer (Amst) 1, 521–532.
[31] McGurran H, Glenn JM, Madero EN, Bott NT (2019) Prévention et traitement de la maladie d'Alzheimer : Mécanismes biologiques de l'exercice. J Alzheimer Dis 69, 311–338.
[32] Mendiola-Precoma J, Berumen LC, Padilla K, Garcia-Alcocer G (2016) Thérapies pour prévention et traitement de la maladie d'Alzheimer. Biomed Res Int 2016, 2589276.
 Lane CA , Barnes J , Nicholas JM , Sudre CH , Cash DM , Malone IB , Parker TD , Keshavan A , Buchanan SM , Keuss SE , James SN , Lu K , Murray-Smith H , Wong A , Gordon E , Coath W , Modat M, Thomas D, Richards M, Fox NC, Schott JM (2020) Associations entre le risque vasculaire à l'âge adulte et la pathologie cérébrale en fin de vie : preuves d'une cohorte de naissance britannique. JAMA Neurol 77, 175–183.
 Seshadri S (2020) Prévention de la démence-pensée au-delà de l'âge et boîtes amyloïdes. JAMA Neurol 77, 160–161.
 Maillard P , Seshadri S , Beiser A , Himali JJ , Au R , Fletcher E , Carmichael O , Wolf PA , DeCarli C (2012) Effets de la pression artérielle systolique sur l'intégrité de la substance blanche chez les jeunes adultes dans la Framingham Heart Study: A cross -étude en coupe. Lancet Neurol 11, 1039–1047.
[36] Fink HA , Linskens EJ , Silverman PC , McCarten JR , Hemmy LS , Ouellette JM , Greer NL , Wilt TJ , Butler M (2020) Accuracy of biomarker testing for neuropathologically defined La maladie d'Alzheimer chez les personnes âgées atteintes de démence. Ann Intern Med 172, 669-677.

Affiliations : [a] SIVOTEC Analytics, Boca Raton, Floride, États-Unis | [b] Département de génie informatique et électrique et d'informatique, Florida Atlantic University, Boca Raton, Floride, États-Unis | [c] SJN Biomed LTD, Kunming, Yunnan, Chine | [d] Centre de Recherche sur la maladie d'Alzheimer, Institut de recherche clinique de Washington, Washington, DC, États-Unis | [e] Département de médecine de réadaptation, Premier hôpital affilié à l'Université médicale de Kunming, Kunming, Yunnan, Chine | [f] Département de neurologie, Hôpital populaire de Dehong, Dehong, Yunnan, Chine | [g] Département de neurologie, premier hôpital affilié à l'université médicale de Kunming, district de Wuhua, Kunming, province du Yunnan, Chine | [h] Centre d'étude des maladies et blessures liées à la guerre, VA Palo Alto Soins de santé System, Palo Alto, Californie, États-Unis | [i] Département de psychiatrie et des sciences du comportement, École de médecine de l'Université de Stanford, Palo Alto, Californie, États-Unis

Correspondance : [*] Correspondance à : Michael F. Bergeron, PhD, FACSM, SIVOTEC Analytics, Boca Raton Innovation Campus, 4800 T-Rex Avenue, Suite 315, Boca Raton, FL 33431, États-Unis. Courriel : mbergeron@sivotecanalytics.com. ; Xiaolei Liu, MD, Département de neurologie, Premier hôpital affilié de l'Université médicale de Kunming, 295 Xichang Road, Wuhua District, Kunming, Yunnan Province 650032, Chine. Courriel : ring@vip.163.com.

Mots-clés : Vieillissement, La maladie d'Alzheimer, démence, dépistage de masse