Nützlichkeit von MemTrax und Modellierung maschinellen Lernens bei der Klassifizierung leichter kognitiver Beeinträchtigungen

Forschungsartikel

Autoren: Bergeron, Michael F. | Landset, Sara | Zhou, Xianbo | Ding, Tao | Khoshgoftaar, Taghi M. | Zhao, Feng | Du, Bo | Chen, Xinjie | Wang, Xuan | Zhong, Lianmei | Liu, Xiaolei| Ashford, J. Wesson

DOI: 10.3233/JAD-191340

Zeitschrift: Zeitschrift für Alzheimer-Krankheit, vol. 77, nein. 4, S. 1545-1558, 2020

Abstrakt

Hintergrund:

Die weite Verbreitung und Prävalenz von Alzheimer-Krankheit und leichter kognitiver Beeinträchtigung (MCI) hat zu einem dringenden Forschungsaufruf geführt, um kognitive Früherkennungsscreenings und -bewertungen zu validieren.

Ziel:

Unser primäres Forschungsziel war es festzustellen, ob ausgewählte MemTrax-Leistungsmetriken und relevante demografische Daten und Merkmale des Gesundheitsprofils effektiv in Vorhersagemodellen genutzt werden können, die mit maschinellem Lernen entwickelt wurden, um die kognitive Gesundheit (normal versus MCI) zu klassifizieren, wie dies angezeigt würde Montreal kognitive Bewertung (MoCA).

Methoden:

Wir führten eine Querschnittsstudie mit 259 erwachsenen Patienten aus den Bereichen Neurologie, Gedächtnisklinik und Innere Medizin durch, die aus zwei rekrutiert wurden Krankenhäuser in China. Jeder Patient erhielt das chinesischsprachige MoCA und verabreichte sich selbst episodisch die fortlaufende Erkennung MemTrax online Gedächtnistest online am selben Tag. Prädiktive Klassifizierungsmodelle wurden mithilfe von maschinellem Lernen mit 10-facher Kreuzvalidierung erstellt, und die Modellleistung wurde mithilfe der Area Under the Receiver Operating Characteristic Curve (AUC) gemessen. Die Modelle wurden unter Verwendung von zwei MemTrax-Leistungsmetriken (Prozent korrekt, Antwortzeit) zusammen mit den acht allgemeinen demografischen und persönlichen Verlaufsmerkmalen erstellt.

Ergebnisse:

Beim Vergleich der Lernenden über ausgewählte Kombinationen von MoCA-Ergebnissen und Schwellenwerten war Naive Bayes im Allgemeinen der leistungsstärkste Lernende mit einer Gesamtklassifizierungsleistung von 0.9093. Darüber hinaus war die MemTrax-basierte Klassifikationsleistung unter den drei besten Lernenden insgesamt überlegen, wenn nur die vier am besten bewerteten Merkmale (0.9119) verwendet wurden, verglichen mit der Verwendung aller 10 gemeinsamen Merkmale (0.8999).

Fazit:

Die Leistung von MemTrax kann effektiv in einem Vorhersagemodell für die Klassifikation durch maschinelles Lernen genutzt werden Screening-Anwendung zur Erkennung kognitiver Beeinträchtigungen im Frühstadium.

EINFÜHRUNG

Die anerkannte (wenn auch unterdiagnostizierte) weit verbreitete Inzidenz und Prävalenz und die parallele Eskalation in medizinischen, sozialen und öffentlichen Bereichen der Knochen und des Bewegungsapparates Kosten und Belastung durch die Alzheimer-Krankheit (AD) und leichte kognitive Beeinträchtigung (MCI) belasten zunehmend alle Beteiligten [1, 2]. Dieses beunruhigende und aufkeimende Szenario hat einen dringenden Ruf nach Forschung zur Validierung ausgelöst Früherkennung kognitive Screening- und Bewertungsinstrumente für den regelmäßigen praktischen Nutzen in persönlichen und klinischen Umgebungen für ältere Patienten in verschiedenen Regionen und Bevölkerungsgruppen [3]. Diese Instrumente müssen auch eine nahtlose Übersetzung aussagekräftiger Ergebnisse in elektronische Patientenakten ermöglichen. Die Vorteile werden realisiert, indem Patienten informiert und Ärzte dabei unterstützt werden, signifikante Veränderungen früher zu erkennen und somit eine schnellere und rechtzeitigere Stratifizierung, Implementierung und Verfolgung einer angemessenen individualisierten und kostengünstigeren Behandlung und Patientenversorgung für diejenigen zu ermöglichen, die beginnen, Erfahrungen zu machen kognitivem Verfall [3, 4].

Das computergestützte MemTrax-Tool (https://memtrax.com) ist eine einfache und kurze kontinuierliche Wiedererkennungsbewertung, die online selbst durchgeführt werden kann, um die herausfordernde zeitgesteuerte episodische Gedächtnisleistung zu messen, bei der der Benutzer auf wiederholte Bilder und nicht auf eine anfängliche Präsentation reagiert [5, 6]. Jüngste Forschungsergebnisse und die daraus resultierenden praktischen Implikationen beginnen allmählich, die klinische Wirksamkeit von MemTrax beim frühen AD- und MCI-Screening zu demonstrieren [5–7]. Allerdings direkter Vergleich des klinischen Nutzens mit bestehenden kognitive Gesundheit Beurteilung und konventionellen Standards ist gewährleistet, um die professionelle Perspektive zu informieren und den Nutzen von MemTrax bei der Früherkennung und diagnostischen Unterstützung zu bestätigen. van der Hoeket al. [8] verglichen ausgewählte MemTrax-Leistungsmetriken (Reaktionsgeschwindigkeit und Prozent richtig) mit dem kognitiven Status, wie er vom Montreal bestimmt wurde Kognitive Bewertung (MoCA). Diese Studie beschränkte sich jedoch darauf, diese Leistungsmetriken mit der Charakterisierung des kognitiven Status (wie von MoCA bestimmt) in Verbindung zu bringen und die relativen Bereiche und Grenzwerte zu definieren. Dementsprechend lautete unsere primäre Forschungsfrage, um diese Untersuchung auszuweiten und die Klassifikationsleistung und -wirksamkeit zu verbessern:

  • Kann die ausgewählten MemTrax-Leistungsmetriken einer Person sowie relevante demografische und gesundheitliche Daten anzeigen profile Eigenschaften effektiv in einem Vorhersagemodell genutzt werden, das mit maschinellem Lernen entwickelt wurde, um die kognitive Gesundheit dichotom (normal versus MCI) zu klassifizieren, wie dies durch den eigenen MoCA-Score angezeigt würde?

Nebenbei wollten wir wissen:

  • Kann ein leistungsbasiertes maschinelles Lernmodell von MemTrax mit den gleichen Funktionen effektiv auf einen Patienten angewendet werden, um den Schweregrad (leicht oder schwer) innerhalb ausgewählter Kategorien kognitiver Beeinträchtigungen vorherzusagen, wie er durch eine unabhängige klinische Diagnose bestimmt würde?

Das Aufkommen und die sich entwickelnde praktische Anwendung von künstlicher Intelligenz und maschinellem Lernen beim Screening/Erkennung haben bereits deutliche praktische Vorteile gezeigt, wobei die prädiktive Modellierung Kliniker bei der anspruchsvollen Beurteilung der kognitiven/gehirnbezogenen Gesundheit und des Patientenmanagements effektiv anleitet. In unserer Studie haben wir einen ähnlichen Ansatz bei der Modellierung der MCI-Klassifikation und der Diskriminierung des Schweregrads kognitiver Beeinträchtigungen gewählt, wie durch klinische Diagnosen aus drei Datensätzen bestätigt wurde, die ausgewählte freiwillige stationäre und ambulante Patienten aus zwei Krankenhäusern in China repräsentieren. Mithilfe von Vorhersagemodellen für maschinelles Lernen haben wir die leistungsstärksten Lernenden aus den verschiedenen Datensatz-/Lerner-Kombinationen identifiziert und die Merkmale eingestuft, um uns bei der Definition der klinisch praktischsten Modellanwendungen zu unterstützen.

Unsere Hypothesen waren, dass ein validiertes MemTrax-basiertes Modell verwendet werden kann, um die kognitive Gesundheit dichotom (normal oder MCI) basierend auf dem MoCA-Gesamtpunktzahl-Schwellenkriterium zu klassifizieren, und dass ein ähnliches MemTrax-Vorhersagemodell effektiv zur Unterscheidung des Schweregrads in ausgewählten Kategorien von eingesetzt werden kann klinisch diagnostiziert kognitive Beeinträchtigung. Der Nachweis der erwarteten Ergebnisse wäre entscheidend für die Unterstützung der Wirksamkeit von MemTrax als Früherkennungsscreening für kognitiven Verfall und die Klassifizierung kognitiver Beeinträchtigungen. Ein günstiger Vergleich mit einem angeblichen Industriestandard, ergänzt durch eine weitaus einfachere und schnellere Anwendbarkeit, würde Klinikern dabei helfen, dieses einfache, zuverlässige und zugängliche Tool als ersten Screen zur Erkennung kognitiver Defizite im Frühstadium (einschließlich Prodromalstadium) einzusetzen. Ein solcher Ansatz und Nutzen könnte daher eine zeitnahere und besser stratifizierte Patientenversorgung und -intervention veranlassen. Diese zukunftsweisenden Erkenntnisse und verbesserten Metriken und Modelle könnten auch hilfreich sein, um das Fortschreiten der Demenz, einschließlich AD und AD-assoziierter Demenz (ADRD), zu mildern oder zu stoppen.

Material und Methoden

Studienpopulation

Zwischen Januar 2018 und August 2019 wurde eine Querschnittsforschung an Patienten durchgeführt, die aus zwei Krankenhäusern in China rekrutiert wurden. Die Verabreichung von MemTrax [5] an Personen ab 21 Jahren und die Erhebung und Analyse dieser Daten wurden von überprüft und genehmigt und in Übereinstimmung mit den ethischen Standards der durchgeführt Human Subjektschutzausschuss der Stanford University. MemTrax und alle anderen Tests für diese Gesamtstudie wurden gemäß der Helsinki-Erklärung von 1975 durchgeführt und vom Institutional Review Board des First Affiliated Hospital of Kunming Medical University in Kunming, Yunnan, China, genehmigt. Jedem Benutzer wurde eine bereitgestellt Einverständniserklärung Formular zum Lesen/Überprüfen und dann freiwillig der Teilnahme zustimmen.

Die Teilnehmer wurden aus dem Pool von ambulanten Patienten in der neurologischen Klinik des Yanhua-Krankenhauses (YH-Unterdatensatz) und der rekrutiert Gedächtnisklinik am First Affiliated Hospital of Kunming Medical Universität (XL-Teildatensatz) in Peking, China. Die Teilnehmer wurden auch aus stationären Patienten der Neurologie (XL-Unterdatensatz) und der Inneren Medizin (KM-Unterdatensatz) am First Affiliated Hospital der Medizinischen Universität Kunming rekrutiert. Zu den Einschlusskriterien gehörten 1) Männer und Frauen im Alter von mindestens 21 Jahren, 2) die Fähigkeit, Chinesisch (Mandarin) zu sprechen, und 3) die Fähigkeit, mündliche und schriftliche Anweisungen zu verstehen. Ausschlusskriterien waren Seh- und motorische Beeinträchtigungen, die die Teilnehmer daran hinderten, den Test abzuschließen MemTrax-Test, sowie die Unfähigkeit, die spezifischen Testanweisungen zu verstehen.

Chinesische Version von MemTrax

Die Online- MemTrax Testplattform wurde übersetzt ins Chinesische übersetzt (URL: https://www.memtrax.com.cn) und weiter angepasst, um über WeChat (Shenzhen Tencent Computer Systems Co. LTD., Shenzhen, Guangdong, China) zur Selbstverwaltung genutzt zu werden. Die Daten wurden auf einem Cloud-Server (Ali Cloud) gespeichert, der sich in China befindet und von Alibaba (Alibaba Technology Co. Ltd., Hangzhou, Zhejiang, China) von SJN Biomed LTD (Kunming, Yunnan, China) lizenziert wurde. Spezifische Details zu MemTrax und den hier verwendeten Testvaliditätskriterien wurden zuvor beschrieben [6]. Der Test wurde den Patienten kostenlos zur Verfügung gestellt.

Studienabläufe

Für stationäre und ambulante Patienten ein allgemeiner Papierfragebogen zur Erhebung demografischer und persönlicher Informationen wie Alter, Geschlecht, Ausbildungsjahre, Beruf, alleine lebt, oder mit der Familie, und die Krankengeschichte wurde von einem Mitglied des Studienteams erhoben. Nach dem Ausfüllen des Fragebogens wurden die MoCA [12]- und MemTrax-Tests durchgeführt (MoCA zuerst) mit nicht mehr als 20 Minuten zwischen den Tests. MemTrax Prozent korrekt (MTx-% C), mittlere Reaktionszeit (MTx-RT) sowie Datum und Uhrzeit des Tests wurden von einem Mitglied des Studienteams für jeden getesteten Teilnehmer auf Papier aufgezeichnet. Der ausgefüllte Fragebogen und die Ergebnisse des MoCA wurden von dem Forscher, der die Tests durchführte, in eine Excel-Tabelle hochgeladen und von einem Kollegen überprüft, bevor die Excel-Dateien für Analysen gespeichert wurden.

MemTrax-Test

Der MemTrax-Online-Test umfasste 50 Bilder (25 eindeutige und 25 Wiederholungen; 5 Sätze von 5 Bildern üblicher Szenen oder Objekte), die in einer bestimmten pseudozufälligen Reihenfolge gezeigt wurden. Der Teilnehmer würde (gemäß den Anweisungen) die Start-Schaltfläche auf dem Bildschirm berühren, um mit dem Test zu beginnen und mit dem Betrachten der Bildserie zu beginnen, und das Bild auf dem Bildschirm erneut so schnell wie möglich berühren, wenn ein wiederholtes Bild erscheint. Jedes Bild erschien für 3 s oder bis das Bild auf dem Bildschirm berührt wurde, was zur sofortigen Präsentation des nächsten Bildes führte. Unter Verwendung der internen Uhr des lokalen Geräts wurde MTx-RT für jedes Bild durch die verstrichene Zeit von der Präsentation des Bildes bis zur Berührung des Bildschirms durch den Teilnehmer als Reaktion auf die Anzeige der Erkennung des Bildes als eines, das bereits gezeigt wurde, bestimmt während des Tests. MTx-RT wurde für jedes Bild aufgezeichnet, wobei volle 3 s aufgezeichnet wurden, was keine Reaktion anzeigte. MTx-% C wurde berechnet, um den Prozentsatz der Wiederholungs- und Anfangsbilder anzugeben, auf die der Benutzer richtig reagierte (richtig positiv + richtig negativ dividiert durch 50). Weitere Einzelheiten zur MemTrax-Verwaltung und -Implementierung, Datenreduktion, ungültige oder „keine Antwort“-Daten und Primärdatenanalysen werden an anderer Stelle beschrieben [6].

Der MemTrax-Test wurde ausführlich erklärt und ein Übungstest (mit anderen einzigartigen Bildern als denen, die im Test zur Aufzeichnung der Ergebnisse verwendet wurden) wurde den Teilnehmern im Krankenhaus zur Verfügung gestellt. Die Teilnehmer der YH- und KM-Unterdatensätze absolvierten den MemTrax-Test auf einem Smartphone, auf dem die Anwendung auf WeChat geladen war; während eine begrenzte Anzahl der Patienten des XL-Unterdatensatzes ein iPad und der Rest ein Smartphone verwendete. Alle Teilnehmer absolvierten den MemTrax-Test unter unauffälliger Beobachtung durch einen Prüfarzt.

Kognitive Bewertung von Montreal

Die Pekinger Version des chinesischen MoCA (MoCA-BC) [13] wurde von geschulten Forschern gemäß den offiziellen Testanweisungen verwaltet und bewertet. Entsprechend hat sich das MoCA-BC als zuverlässig erwiesen Test für kognitive Screening über alle Bildungsstufen hinweg bei älteren chinesischen Erwachsenen [14]. Die Durchführung jedes Tests dauerte je nach kognitiven Fähigkeiten des jeweiligen Teilnehmers etwa 10 bis 30 Minuten.

MoCA-Klassifizierungsmodellierung

Es gab insgesamt 29 nutzbare Features, darunter zwei MemTrax Testleistungsmetriken und 27 Funktionen in Bezug auf Demografie und Gesundheit Informationen für jeden Teilnehmer. Der MoCA-Gesamttestwert jedes Patienten wurde als der verwendet kognitives Screening „Benchmark“, um unsere Vorhersagemodelle zu trainieren. Da MoCA verwendet wurde, um die Klassenbezeichnung zu erstellen, konnten wir dementsprechend die aggregierte Bewertung (oder eine der MoCA-Untergruppenbewertungen) nicht als unabhängiges Merkmal verwenden. Wir führten vorläufige Experimente durch, in denen wir die ursprünglichen drei Krankenhaus-/Klinik(en)-Unterdatensätze einzeln modellierten (Klassifizierung der kognitiven Gesundheit definiert durch MoCA) und dann unter Verwendung aller Merkmale kombinierten. Allerdings wurden nicht in jeder der vier Kliniken, die die drei Teildatensätze repräsentieren, dieselben Datenelemente erhoben; Daher wiesen viele unserer Features im kombinierten Datensatz (bei Verwendung aller Features) eine hohe Inzidenz fehlender Werte auf. Wir haben dann Modelle mit dem kombinierten Datensatz erstellt, wobei nur gemeinsame Merkmale verwendet wurden, was zu einer verbesserten Klassifizierungsleistung führte. Dies wurde wahrscheinlich durch eine Kombination aus mehr Instanzen, mit denen gearbeitet werden kann, erklärt, indem die drei Patienten-Unterdatensätze kombiniert wurden, und keine Merkmale mit einer übermäßigen Prävalenz fehlender Werte (nur ein Merkmal im kombinierten Datensatz, Arbeitstyp, hatte fehlende Werte, die sich auf nur drei Patienteninstanzen), da nur gemeinsame Merkmale, die an allen drei Standorten erfasst wurden, eingeschlossen wurden. Insbesondere hatten wir kein spezifisches Ablehnungskriterium für jedes Merkmal, das letztendlich nicht in den kombinierten Datensatz aufgenommen wurde. Bei unserer vorläufigen kombinierten Datensatzmodellierung haben wir jedoch zunächst alle Merkmale aus jedem der drei separaten Patientenunterdatensätze verwendet. Dies führte weitgehend zu einer Modellleistung, die messbar niedriger war als die anfängliche vorläufige Modellierung für jeden einzelnen Teildatensatz. Während die Klassifikationsleistung der Modelle, die unter Verwendung aller Merkmale erstellt wurden, über alle Lernenden und Klassifikationsschemata hinweg ermutigend war, verbesserte sich die Leistung außerdem für doppelt so viele Modelle, wenn nur gemeinsame Merkmale verwendet wurden. Tatsächlich verbesserten sich unter unseren Top-Lernenden alle bis auf ein Modell, indem nicht gemeinsame Merkmale eliminiert wurden.

Der endgültige aggregierte Datensatz (YH, XL und KM zusammen) umfasste 259 Instanzen, die jeweils einen eindeutigen Teilnehmer darstellten, der sowohl den MemTrax- als auch den MoCA-Test absolvierte. Es gab 10 gemeinsame unabhängige Merkmale: MemTrax-Leistungskennzahlen: MTx-% C und mittlere MTx-RT; demografische und anamnestische Informationen: Alter, Geschlecht, Ausbildungsjahre, Arbeitsart (Arbeiter/Angestellter), soziale Unterstützung (ob der Testteilnehmer allein oder mit der Familie lebt) und Ja/Nein-Antworten, ob der Benutzer eine hatte Vorgeschichte von Diabetes, Hyperlipidämie oder traumatischer Hirnverletzung. Zwei zusätzliche Metriken, MoCA-Gesamtpunktzahl und MoCA-Gesamtpunktzahl, angepasst an die Bildungsjahre [12], wurden separat verwendet, um abhängige Klassifizierungsetiketten zu entwickeln, wodurch zwei unterschiedliche Modellierungsschemata erstellt wurden, die auf unseren kombinierten Datensatz angewendet werden können. Für jede Version (angepasst und nicht angepasst) des MoCA-Scores wurden die Daten erneut separat für die binäre Klassifizierung modelliert, wobei zwei verschiedene Kriteriumsschwellen verwendet wurden – der ursprünglich empfohlene [12] und ein alternativer Wert, der von anderen verwendet und gefördert wurde [8, 15]. Im alternativen Schwellenwert-Klassifizierungsschema wurde ein Patient als normal kognitiv gesund angesehen, wenn er/sie beim MoCA-Test ≥ 23 Punkte erzielte, und als Patient mit MCI, wenn der Wert 22 oder niedriger war; wohingegen der Patient im ursprünglich empfohlenen Klassifizierungsformat 26 oder besser auf dem MoCA erzielen musste, um als normaler kognitiver Gesundheit zu gelten.

Gefilterte Daten für die MoCA-Klassifizierungsmodellierung

Wir haben die MoCA-Klassifizierung mit vier häufig verwendeten Feature-Ranking-Techniken weiter untersucht: Chi-Quadrat, Verstärkungsverhältnis, Informationsgewinn und symmetrische Unsicherheit. Für eine vorläufige Perspektive haben wir die Rankings auf den gesamten kombinierten Datensatz angewendet, wobei wir jedes unserer vier Modellierungsschemata verwendet haben. Alle Rankings einigten sich auf die gleichen Top-Features, dh Alter, Anzahl der Ausbildungsjahre und beide MemTrax-Leistungsmetriken (MTx-% C, mittlere MTx-RT). Anschließend haben wir die Modelle mit jeder Merkmalsauswahltechnik neu erstellt, um die Modelle nur auf die vier wichtigsten Merkmale zu trainieren (siehe Merkmalsauswahl unten).

Die resultierenden letzten acht Variationen der MoCA-Score-Klassifizierungsmodellierungsschemata sind in Tabelle 1 dargestellt.

Tabelle 1

Zusammenfassung der Variationen des Modellierungsschemas, die für die MoCA-Klassifizierung verwendet werden (Normal Kognitive Gesundheit gegenüber MCI)

ModellierungsschemaNormale kognitive Gesundheit (negative Klasse)MCI (Positive Klasse)
Angepasst-23 Ungefiltert/Gefiltert101 (39.0%)158 (61.0%)
Angepasst-26 Ungefiltert/Gefiltert49 (18.9%)210 (81.1%)
Unbereinigt-23 Ungefiltert/Gefiltert92 (35.5%)167 (64.5%)
Unbereinigt-26 Ungefiltert/Gefiltert42 (16.2%)217 (83.8%)

Die jeweilige Anzahl und der Prozentsatz der Gesamtpatienten in jeder Klasse werden durch die Anpassung der Punktzahl für Bildung (angepasst oder nicht angepasst) und den Klassifizierungsschwellenwert (23 oder 26) differenziert, wie sie auf beide Merkmalssätze (ungefiltert und gefiltert) angewendet werden.

MemTrax-basierte klinische Bewertungsmodellierung

Von unseren drei ursprünglichen Teildatensätzen (YH, XL, KM) wurden nur die Patienten des XL-Teildatensatzes unabhängig klinisch auf kognitive Beeinträchtigung diagnostiziert (dh ihre jeweiligen MoCA-Scores wurden nicht zur Erstellung einer Klassifizierung von normal gegenüber beeinträchtigt verwendet). Insbesondere wurde bei den XL-Patienten beides diagnostiziert Alzheimer-Test (AD) oder vaskuläre Demenz (VaD). Innerhalb jeder dieser primären Diagnosekategorien gab es eine weitere Bezeichnung für MCI. Diagnosen von MCI, Demenz, vaskulärer neurokognitiver Störung und neurokognitiver Störung aufgrund von AD basierten auf spezifischen und unverwechselbaren diagnostischen Kriterien, die im Diagnostic and Statistical Manual of Mental Disorders: DSM-5 [16] beschrieben sind. Unter Berücksichtigung dieser verfeinerten Diagnosen wurden zwei Klassifikationsmodellierungsschemata separat auf den XL-Teildatensatz angewendet, um den Schweregrad (Grad der Beeinträchtigung) für jede primäre Diagnosekategorie zu unterscheiden. Die in jedem dieser diagnostischen Modellierungsschemata (AD und VaD) verwendeten Daten umfassten demografische und anamnestische Informationen sowie die Leistung von MemTrax (MTx-% C, mittlere MTx-RT). Jede Diagnose wurde als mild bezeichnet, wenn sie als MCI bezeichnet wurde; Andernfalls wurde es als schwerwiegend angesehen. Wir haben zunächst überlegt, den MoCA-Score in die Diagnosemodelle (leicht versus schwer) aufzunehmen; Wir haben jedoch festgestellt, dass dies den Zweck unseres sekundären Vorhersagemodellierungsschemas zunichte machen würde. Hier würden die Lernenden unter Verwendung anderer Patientenmerkmale, die dem Anbieter ohne weiteres zur Verfügung stehen, und Leistungsmetriken des einfacheren MemTrax-Tests (anstelle des MoCA) im Vergleich zum Referenz-„Goldstandard“, der unabhängigen klinischen Diagnose, geschult. Es gab 69 Fälle im AD-Diagnosedatensatz und 76 Fälle von VaD (Tabelle 2). In beiden Datensätzen gab es 12 unabhängige Merkmale. Zusätzlich zu den 10 Merkmalen, die in der MoCA-Score-Klassifizierung enthalten sind, enthielt die Patientenanamnese auch Informationen zur Vorgeschichte von Bluthochdruck und Schlaganfall.

Tabelle 2

Zusammenfassung der Variationen des Modellierungsschemas, die für die Klassifizierung des Diagnoseschweregrads verwendet werden (leicht versus schwer)

ModellierungsschemaMild (Negativklasse)Schwer (Positiv-Klasse)
MCI-AD versus AD12 (17.4%)57 (82.6%)
MCI-VaD versus VaD38 (50.0%)38 (50.0%)

Die jeweilige Anzahl und der Prozentsatz aller Patienten in jeder Klasse werden nach primärer Diagnosekategorie (AD oder VaD) unterschieden.

Statistiken

Der Vergleich der Teilnehmermerkmale und anderer numerischer Merkmale zwischen Teildatensätzen für jede Modellklassifizierungsstrategie (um die kognitive Gesundheit des MoCA und den Schweregrad der Diagnose vorherzusagen) wurde unter Verwendung der Programmiersprache Python (Version 2.7.1) [17] durchgeführt. Die Modellleistungsunterschiede wurden anfänglich unter Verwendung einer Ein- oder Zwei-Faktor-ANOVA (je nach Bedarf) mit einem 95-%-Konfidenzintervall und dem Tukey-Test auf ehrliche signifikante Differenz (HSD) bestimmt, um die Leistungsmittelwerte zu vergleichen. Diese Untersuchung der Unterschiede zwischen den Modellleistungen wurde mit einer Kombination aus Python und R (Version 3.5.1) [18] durchgeführt. Wir haben diesen (wenn auch wohl weniger als optimalen) Ansatz nur als heuristische Hilfe dabei verwendet Startup-Gründer für anfängliche Modellleistungsvergleiche bei der Vorwegnahme einer möglichen klinischen Anwendung. Wir haben dann den Bayes'schen Vorzeichen-Rang-Test unter Verwendung einer A-posteriori-Verteilung verwendet, um die Wahrscheinlichkeit von Modellleistungsunterschieden zu bestimmen [19]. Für diese Analysen haben wir das Intervall –0.01, 0.01 verwendet, was bedeutet, dass, wenn zwei Gruppen einen Leistungsunterschied von weniger als 0.01 hatten, sie als gleich angesehen wurden (innerhalb des Bereichs der praktischen Äquivalenz) oder ansonsten unterschiedlich waren (eine besser als das andere). Um den Bayes'schen Vergleich von Klassifikatoren durchzuführen und diese Wahrscheinlichkeiten zu berechnen, haben wir die Baycomp-Bibliothek (Version 1.0.2) für Python 3.6.4 verwendet.

Vorausschauende Modellierung

Wir haben Vorhersagemodelle unter Verwendung der insgesamt zehn Variationen unserer Modellierungsschemata erstellt, um das Ergebnis des MoCA-Tests jedes Patienten oder den Schweregrad der klinischen Diagnose vorherzusagen (zu klassifizieren). Alle Lernenden wurden angewendet und die Modelle wurden mit der Open-Source-Softwareplattform Weka [20] erstellt. Für unsere vorläufige Analyse haben wir 10 häufig verwendete Lernalgorithmen verwendet: 5-Nearest Neighbors, zwei Versionen des C4.5-Entscheidungsbaums, Logistische Regression, Multilayer Perceptron, Naive Bayes, zwei Versionen von Random Forest, Radial Basis Function Network und Support Vector Maschine. Schlüsselattribute und Kontraste dieser Algorithmen wurden an anderer Stelle beschrieben [21] (siehe entsprechenden Anhang). Diese wurden ausgewählt, weil sie eine Vielzahl unterschiedlicher Lerntypen repräsentieren und weil wir bei ihrer Verwendung in früheren Analysen mit ähnlichen Daten Erfolge gezeigt haben. Hyperparametereinstellungen wurden aus unserer früheren Forschung ausgewählt, die darauf hinweist, dass sie bei einer Vielzahl unterschiedlicher Daten robust sind [22]. Basierend auf den Ergebnissen unserer vorläufigen Analyse unter Verwendung desselben kombinierten Datensatzes mit gemeinsamen Merkmalen, die anschließend in der vollständigen Analyse verwendet wurden, haben wir drei Lernende identifiziert, die über alle Klassifikationen hinweg eine konstant starke Leistung erbrachten: Logistische Regression, Naive Bayes und Support Vector Machine.

Kreuzvalidierung und Modellleistungsmetrik

Für die gesamte Vorhersagemodellierung (einschließlich der vorläufigen Analysen) wurde jedes Modell unter Verwendung einer 10-fachen Kreuzvalidierung erstellt, und die Modellleistung wurde anhand der Fläche unter der Receiver Operating Characteristic Curve (AUC) gemessen. Die Kreuzvalidierung begann mit der zufälligen Aufteilung jedes der 10 Modellschema-Datensätze in 10 gleiche Segmente (Folds), wobei neun dieser jeweiligen Segmente zum Trainieren des Modells und das verbleibende Segment zum Testen verwendet wurden. Dieses Verfahren wurde zehnmal wiederholt, wobei bei jeder Iteration ein anderes Segment als Testsatz verwendet wurde. Die Ergebnisse wurden dann kombiniert, um das Ergebnis/die Leistung des endgültigen Modells zu berechnen. Für jede Lerner/Datensatz-Kombination wurde dieser gesamte Prozess 10 Mal wiederholt, wobei die Daten jedes Mal anders aufgeteilt wurden. Dieser letzte Schritt reduzierte Verzerrungen, stellte die Replizierbarkeit sicher und half bei der Bestimmung der Gesamtleistung des Modells. Insgesamt (für MoCA-Score- und Diagnoseschwere-Klassifizierungsschemata kombiniert) wurden 10 Modelle gebaut. Dazu gehörten 6,600 ungefilterte Modelle (1,800 auf den Datensatz angewendete Modellierungsschemata × 6 Lernende × 3 Läufe × 10 Faltungen = 10 Modelle) und 1,800 gefilterte Modelle (4,800 auf den Datensatz angewendete Modellierungsschemata × 4 Lernende × 3 Merkmalsauswahltechniken × 4 Läufe ×). 10 Falten = 10 Modelle).

Merkmalsauswahl

Für die gefilterten Modelle wurde innerhalb der Kreuzvalidierung eine Merkmalsauswahl (unter Verwendung der vier Merkmalsrankingmethoden) durchgeführt. Da unterschiedliche 10 % des Datensatzes die Testdaten waren, wurden für jede der 10 Faltungen nur die obersten vier ausgewählten Merkmale für jeden Trainingsdatensatz (d. h. die anderen neun Faltungen oder die verbleibenden 90 % des gesamten Datensatzes) verwendet um die Modelle zu bauen. Wir konnten nicht bestätigen, welche vier Funktionen in jedem Modell verwendet wurden, da diese Informationen nicht innerhalb der von uns verwendeten Modellierungsplattform (Weka) gespeichert oder verfügbar gemacht werden. Angesichts der Konsistenz in unserer anfänglichen Auswahl der Top-Features, als die Rangliste auf den gesamten kombinierten Datensatz angewendet wurde, und der anschließenden Ähnlichkeit der Modellierungsleistungen, sind dieselben Features (Alter, Ausbildungsjahre, MTx-% C und mittlere MTx-RT ) sind wahrscheinlich die am weitesten verbreiteten Top XNUMX, die gleichzeitig mit der Feature-Auswahl innerhalb des Kreuzvalidierungsprozesses verwendet werden.

ERGEBNISSE

Numerische Merkmale der Teilnehmer (einschließlich MoCA-Scores und MemTrax-Leistungsmetriken) der jeweiligen Datensätze für jede Modellklassifizierungsstrategie zur Vorhersage der MoCA-indizierten kognitiven Gesundheit (normal versus MCI) und des Diagnoseschweregrads (leicht versus schwer) sind in Tabelle 3 dargestellt.

Tabelle 3

Teilnehmermerkmale, MoCA-Ergebnisse und MemTrax-Leistung für jede Modellklassifizierungsstrategie

KlassifizierungsstrategieAlterBildungswesenMoCA angepasstMoCA UnbereinigtMTx-% CMTx-RT
MoCA-Kategorie61.9 Jahre (13.1)9.6 Jahre (4.6)19.2 (6.5)18.4 (6.7)74.8% (15.0)1.4 s (0.3)
Schweregrad der Diagnose65.6 Jahre (12.1)8.6 Jahre (4.4)16.7 (6.2)15.8 (6.3)68.3% (13.8)1.5 s (0.3)

Die gezeigten Werte (Mittelwert, SD), differenziert nach Modellierungsklassifizierungsstrategien, sind repräsentativ für den kombinierten Datensatz, der zur Vorhersage der MoCA-indizierten kognitiven Gesundheit (MCI versus normal) verwendet wird, und den XL-Unterdatensatz, der nur zur Vorhersage des Diagnoseschweregrads verwendet wird (leicht versus schwer).

Für jede Kombination aus MoCA-Score (angepasst/nicht angepasst) und Schwellenwert (26/23) gab es einen statistischen Unterschied (p = 0.000) in jedem paarweisen Vergleich (normale kognitive Gesundheit versus MCI) für Alter, Bildung und MemTrax-Leistung (MTx-% C und MTx-RT). Jeder Patientenunterdatensatz in der jeweiligen MCI-Klasse für jede Kombination war im Durchschnitt etwa 9 bis 15 Jahre älter, berichtete etwa fünf Jahre weniger Ausbildung und hatte eine weniger günstige MemTrax-Leistung für beide Metriken.

Die Ergebnisse der prädiktiven Modellierungsleistung für die MoCA-Score-Klassifizierungen unter Verwendung der drei besten Lernenden, Logistische Regression, Naive Bayes und Support Vector Machine, sind in Tabelle 4 dargestellt. Diese drei wurden basierend auf der konsistentesten absoluten Lernerleistung über alle verschiedenen Modelle hinweg ausgewählt auf die Datensätze für alle Modellierungsschemata angewendet. Für den ungefilterten Datensatz und die Modellierung gibt jeder der Datenwerte in Tabelle 4 die Modellleistung basierend auf dem jeweiligen AUC-Mittelwert an, der aus den 100 Modellen (10 Läufe × 10 Faltungen) abgeleitet wurde, die für jede Lerner/Modellierungsschema-Kombination erstellt wurden, mit dem jeweils höchsten Wert fett gedruckte Lernende. Wohingegen für die Modellierung des gefilterten Datensatzes die in Tabelle 4 angegebenen Ergebnisse die durchschnittlichen Gesamtmodellleistungen von 400 Modellen für jeden Lernenden widerspiegeln, der jede der Feature-Ranking-Methoden verwendet (4 Feature-Ranking-Methoden × 10 Läufe × 10 Falten).

Tabelle 4

Ergebnisse der dichotomen MoCA-Score-Klassifizierungsleistung (AUC; 0.0–1.0) für jeden der drei leistungsstärksten Lernenden für alle jeweiligen Modellierungsschemata

Funktionsumfang verwendetMoCA-PunktzahlAbschaltschwelleLogistische RegressionNaive BayesUnterstützung Vektor Maschine
Ungefiltert (10 Merkmale)Bereinigt230.88620.89130.8695
260.89710.92210.9161
Unangepasst230.91030.90850.8995
260.88340.91530.8994
Gefiltert (4 Merkmale)Bereinigt230.89290.89540.8948
260.91880.92470.9201
Unangepasst230.91350.91340.9122
260.91590.92360.9177

Unter Verwendung von Variationen des Funktionssatzes, des MoCA-Scores und des MoCA-Score-Cutoff-Schwellenwerts wird die höchste Leistung für jedes Modellierungsschema in gezeigt fett (nicht unbedingt statistisch anders als alle anderen nicht in fett für das jeweilige Modell).

Beim Vergleich der Lernenden über alle Kombinationen von MoCA-Score-Versionen und Schwellenwerten (angepasst/nicht angepasst bzw. 23/26) im kombinierten ungefilterten Datensatz (d. h. unter Verwendung der 10 gemeinsamen Merkmale) war Naïve Bayes im Allgemeinen der leistungsstärkste Lernende mit einem Gesamtwert Klassifizierungsleistung von 0.9093. Unter Berücksichtigung der drei besten Lernenden zeigten die Bayes-korrelierten Vorzeichen-Rang-Tests, dass die Wahrscheinlichkeit (Pr) von Naive Bayes, der die logistische Regression übertraf, lag bei 99.9 %. Darüber hinaus besteht zwischen Naive Bayes und Support Vector Machine eine Wahrscheinlichkeit von 21.0 % für eine praktische Äquivalenz der Lernleistung (also eine Wahrscheinlichkeit von 79.0 %, dass Naive Bayes die Leistung von Support Vector Machine übertrifft), gekoppelt mit einer Wahrscheinlichkeit von 0.0 %, dass Support Vector Machine messbar besser abschneidet verstärkt den Leistungsvorteil für Naive Bayes. Ein weiterer Vergleich der MoCA-Score-Version über alle Lernenden/Schwellenwerte hinweg deutete auf einen leichten Leistungsvorteil bei Verwendung nicht angepasster MoCA-Scores gegenüber angepassten (0.9027 gegenüber 0.8971; Pr (unbereinigt > bereinigt) = 0.988). In ähnlicher Weise zeigte ein Vergleich der Cutoff-Schwelle aller Lernenden und MoCA-Score-Versionen einen kleinen Klassifizierungsleistungsvorteil bei Verwendung von 26 als Klassifizierungsschwelle gegenüber 23 (0.9056 bzw. 0.8942; Pr (26 > 23) = 0.999). Bei der Untersuchung der Klassifizierungsleistung für die Modelle, die nur die gefilterten Ergebnisse verwenden (dh nur die vier am besten bewerteten Merkmale), war Naive Bayes (0.9143) zahlenmäßig der leistungsstärkste Lernende über alle MoCA-Score-Versionen/Schwellenwerte hinweg. Über alle Feature-Ranking-Techniken hinweg schnitten jedoch alle leistungsstärksten Lernenden ähnlich ab. Bayes'sche Vorzeichen-Rang-Tests zeigten eine 100-prozentige Wahrscheinlichkeit praktischer Äquivalenz zwischen jedem Paar gefilterter Lernender. Wie bei den ungefilterten Daten (unter Verwendung aller 10 gemeinsamen Merkmale) ergab sich auch hier wieder ein Leistungsvorteil für die unbereinigte Version des MoCA-Scores (Pr (unbereinigt > bereinigt) = 1.000) sowie ein ähnlich deutlicher Vorteil für die Einstufungsschwelle von 26 (Pr (26 > 23) = 1.000). Bemerkenswerterweise übertraf die durchschnittliche Leistung jedes der drei besten Lernenden über alle MoCA-Score-Versionen/Schwellenwerte hinweg die durchschnittliche Leistung aller Lernenden bei den ungefilterten Daten, wenn nur die vier am besten bewerteten Merkmale verwendet wurden. Es überrascht nicht, dass die Klassifizierungsleistung der gefilterten Modelle (unter Verwendung der vier am besten bewerteten Merkmale) insgesamt besser war (0.9119) als die der ungefilterten Modelle (0.8999), unabhängig von den Modellen der Merkmalsrangfolgemethode, die mit den jeweiligen Modellen unter Verwendung aller 10 gemeinsamen verglichen wurden Merkmale. Für jede Merkmalsauswahlmethode gab es eine 100-prozentige Wahrscheinlichkeit eines Leistungsvorteils gegenüber den ungefilterten Modellen.

Bei den Patienten, die für die Schweregradklassifizierung der AD-Diagnose in Betracht gezogen wurden, Unterschiede zwischen den Gruppen (MCI-AD versus AD) für das Alter (p = 0.004), Bildung (p = 0.028), MoCA-Score adjustiert/unadjustiert (p = 0.000) und MTx-% C (p = 0.008) waren statistisch signifikant; während es für MTx-RT nicht war (p = 0.097). Bei den Patienten, die für die Schweregradklassifizierung der VaD-Diagnose in Betracht gezogen wurden, wurden Unterschiede zwischen den Gruppen (MCI-VaD versus VaD) für den MoCA-Score adjustiert/unadjusted (p = 0.007) und MTx-% C (p = 0.026) und MTx-RT (p = 0.001) waren statistisch signifikant; während für das Alter (p = 0.511) und Bildung (p = 0.157) gab es keine signifikanten Unterschiede zwischen den Gruppen.

Die Ergebnisse der prädiktiven Modellierungsleistung für die Diagnoseschwereklassifizierungen unter Verwendung der drei zuvor ausgewählten Lerner, Logistische Regression, Naive Bayes und Support Vector Machine, sind in Tabelle 5 dargestellt. Während zusätzlich untersuchte Lerner individuell etwas stärkere Leistungen bei einer der beiden klinischen Diagnosekategorien zeigten , die drei Lernenden, die wir in unserer vorherigen Modellierung als die günstigsten identifiziert hatten, boten bei beiden neuen Modellierungsschemata die konsistenteste Leistung. Beim Vergleich der Lernenden in jeder der primären Diagnosekategorien (AD und VaD) gab es keinen konsistenten Unterschied in der Klassifikationsleistung zwischen den Lernenden für MCI-VaD und VaD, obwohl Support Vector Machine im Allgemeinen eine stärkere Leistung erbrachte. Ebenso gab es keine signifikanten Unterschiede zwischen den Lernenden für die MCI-AD- versus AD-Klassifizierung, obwohl Naive Bayes (NB) einen leichten Leistungsvorteil gegenüber der logistischen Regression (LR) und nur eine vernachlässigbare Pluralität gegenüber der Support Vector Machine hatte, mit Wahrscheinlichkeiten von 61.4 % bzw. 41.7 %. Über beide Datensätze hinweg gab es einen allgemeinen Leistungsvorteil für Support Vector Machine (SVM). Pr (SVM > LR) = 0.819 und Pr (SVM > NB) = 0.934. Unsere Gesamtklassifizierungsleistung bei allen Lernenden bei der Vorhersage des Schweregrades der Diagnose im XL-Unterdatensatz war in der VaD-Diagnosekategorie besser als bei AD (Pr (VAD > AD) = 0.998).

Tabelle 5

Ergebnisse der dichotomen Klassifikationsleistung der klinischen Diagnose (AUC; 0.0–1.0) für jeden der drei leistungsstärksten Lernenden für beide jeweiligen Modellierungsschemata

ModellierungsschemaLogistische RegressionNaive BayesUnterstützung Vektor Maschine
MCI-AD versus AD0.74650.78100.7443
MCI-VaD versus VaD0.80330.80440.8338

Die höchste Leistung für jedes Modellierungsschema ist in gezeigt fett (nicht unbedingt statistisch anders als andere nicht in fett).

DISKUSSION

Früherkennung von Veränderungen in der kognitiven Gesundheit ist wichtig praktischer Nutzen im persönlichen Gesundheitsmanagement und in der öffentlichen Gesundheit gleichermaßen. In der Tat hat es auch im klinischen Umfeld für Patienten weltweit eine sehr hohe Priorität. Das gemeinsame Ziel ist es, Patienten, Pflegekräfte und Anbieter zu warnen und eine frühere angemessene und kostengünstige Behandlung und Langzeitpflege für diejenigen anzuregen, die beginnen, einen kognitiven Rückgang zu erfahren. Durch die Zusammenführung unserer drei Krankenhaus-/Klinik(en)-Datensubsets identifizierten wir drei eindeutig bevorzugte Lernende (mit einem bemerkenswerten Herausragenden – Naive Bayes), um mithilfe von Vorhersagemodellen zu erstellen MemTrax-Leistungsmetriken, die den kognitiven Gesundheitszustand zuverlässig klassifizieren können dichotom (normale kognitive Gesundheit oder MCI), wie durch einen MoCA-Gesamtwert angezeigt würde. Bemerkenswerterweise verbesserte sich die Gesamtklassifizierungsleistung für alle drei Lernenden, wenn unsere Modelle nur die vier am besten bewerteten Funktionen verwendeten, die hauptsächlich diese MemTrax-Leistungsmetriken umfassten. Darüber hinaus haben wir das begründete Potenzial für die Verwendung derselben Lerner- und MemTrax-Leistungsmetriken in einem Modellierungsschema für die Klassifizierung von diagnostischer Unterstützung aufgezeigt, um den Schweregrad von zwei Kategorien der Demenzdiagnose zu unterscheiden: AD und VaD.

Gedächtnistest ist zentral für die Früherkennung von AD [23, 24]. Daher ist es günstig, dass MemTrax ein akzeptables, ansprechendes und einfach zu implementierendes Online-Tool ist Screening-Test für das episodische Gedächtnis in der Allgemeinbevölkerung [6]. Erkennungsgenauigkeit und Reaktionszeiten bei dieser kontinuierlichen Leistungsaufgabe sind besonders aufschlussreich bei der Identifizierung früher und sich entwickelnder Verschlechterungen und daraus resultierender Defizite in den neuroplastischen Prozessen im Zusammenhang mit Lernen, Gedächtnis und Kognition. Das heißt, die hier vorgestellten Modelle, die weitgehend auf MemTrax-Leistungsmetriken basieren, sind empfindlich und zeigen biologische neuropathologische Defizite während der asymptomatischen Übergangsphase mit größerer Wahrscheinlichkeit leicht und mit minimalen Kosten lange vor einem größeren Funktionsverlust [25]. Ashfordet al. untersuchten die Muster und Verhaltensweisen der Genauigkeit des Erkennungsgedächtnisses und der Reaktionszeit bei Online-Benutzern, die alleine mit MemTrax teilnahmen [6]. In Anbetracht der Tatsache, dass diese Verteilungen für die optimale Modellierung und Entwicklung gültiger und effektiver Patientenversorgungsanwendungen von entscheidender Bedeutung sind, ist die Definition klinisch anwendbarer Erkennungs- und Reaktionszeitprofile unerlässlich, um eine wertvolle grundlegende Referenz für den klinischen und Forschungsnutzen zu schaffen. Der praktische Wert von MemTrax beim AD-Screening auf kognitive Beeinträchtigungen im Frühstadium und zur differenzialdiagnostischen Unterstützung muss dann im Kontext eines klinischen Umfelds genauer untersucht werden, in dem Komorbiditäten und kognitive, sensorische und motorische Fähigkeiten, die die Testleistung beeinflussen, berücksichtigt werden können. Und um die professionelle Perspektive zu informieren und den praktischen klinischen Nutzen zu fördern, ist es zunächst unerlässlich, den Vergleich mit einem etablierten kognitiven Gesundheitsbewertungstest zu demonstrieren, auch wenn letzterer erkennbar durch umständliche Testlogistik, Bildungs- und Sprachabschreckung und kulturelle Einflüsse eingeschränkt sein kann [26]. . In dieser Hinsicht ist der positive Vergleich von MemTrax in der klinischen Wirksamkeit mit MoCA, das allgemein als Industriestandard bezeichnet wird, von Bedeutung, insbesondere wenn man die einfachere Anwendbarkeit und Patientenakzeptanz von MemTrax abwägt.

Frühere Untersuchungen, die MemTrax mit MoCA verglichen haben, heben die Gründe und vorläufigen Beweise hervor, die unsere Modellierungsuntersuchung rechtfertigen [8]. Dieser vorherige Vergleich verknüpfte jedoch lediglich die beiden von uns untersuchten wichtigen MemTrax-Leistungsmetriken mit dem kognitiven Status, wie er vom MoCA bestimmt wurde, und definierte die jeweiligen Bereiche und Grenzwerte. Wir vertieften die Bewertung des klinischen Nutzens von MemTrax, indem wir einen auf Vorhersagemodellen basierenden Ansatz untersuchten, der eine individuellere Berücksichtigung anderer potenziell relevanter patientenspezifischer Parameter ermöglichen würde. Im Gegensatz zu anderen fanden wir keinen Vorteil in der Modellleistung unter Verwendung einer Bildungskorrektur (Anpassung) des MoCA-Scores oder in der Variation des MoCA-Gesamtscore-Schwellenwerts zur Unterscheidung der kognitiven Gesundheit von den ursprünglich empfohlenen 26 auf 23 [12, 15]. Tatsächlich begünstigte der Klassifikationsleistungsvorteil die Verwendung des nicht angepassten MoCA-Scores und des höheren Schwellenwerts.

Schlüsselpunkte in der klinischen Praxis

Maschinelles Lernen wird häufig am besten und am effektivsten bei der Vorhersagemodellierung eingesetzt, wenn die Daten umfangreich und mehrdimensional sind, d. h. wenn zahlreiche Beobachtungen und eine damit einhergehende breite Palette hochwertiger (beitragender) Attribute vorliegen. Mit diesen aktuellen Daten schnitten die gefilterten Modelle mit nur vier ausgewählten Merkmalen jedoch besser ab als diejenigen, die alle 10 gemeinsamen Merkmale verwendeten. Dies deutet darauf hin, dass unser aggregierter Krankenhausdatensatz nicht die klinisch geeignetsten (hochwertigen) Merkmale aufwies, um die Patienten auf diese Weise optimal zu klassifizieren. Nichtsdestotrotz unterstützt die Betonung des Feature-Rankings auf den wichtigsten MemTrax-Leistungsmetriken – MTx-%C und MTx-RT – nachdrücklich den Aufbau von Screening-Modellen für kognitive Defizite im Frühstadium um diesen Test herum, der einfach, leicht zu verwalten, kostengünstig und treffend aufschlussreich ist Gedächtnisleistung, zumindest derzeit als erster Screen für eine binäre Klassifikation des kognitiven Gesundheitszustands. Angesichts der ständig wachsenden Belastung für Anbieter und Gesundheitssysteme sollten Patienten-Screening-Prozesse und klinische Anwendungen angemessen entwickelt werden, wobei der Schwerpunkt auf der Erfassung, Verfolgung und Modellierung der Patientenmerkmale und Testmetriken liegt, die in der Diagnostik am nützlichsten, vorteilhaftesten und nachweislich wirksamsten sind und Unterstützung beim Patientenmanagement.

Da die beiden wichtigsten MemTrax-Metriken für die MCI-Klassifizierung von zentraler Bedeutung sind, hatte unser leistungsstärkster Lernender (Naive Bayes) in den meisten Modellen eine sehr hohe Vorhersageleistung (AUC über 0.90) mit einem Verhältnis von richtig-positiv zu falsch-positiv, das sich 4 näherte oder etwas darüber lag : 1. Eine translationale klinische Anwendung, die diesen Lerner verwendet, würde somit bei weitem die meisten Personen mit einem kognitiven Defizit erfassen (korrekt klassifizieren), während die Kosten minimiert werden, die mit der irrtümlichen Klassifizierung einer Person mit normaler kognitiver Gesundheit als mit einem kognitiven Defizit verbunden sind (falsch positiv) oder Fehlen dieser Klassifizierung bei denen, die ein kognitives Defizit haben (falsch negativ). Jedes dieser Szenarien einer Fehlklassifizierung könnte eine unangemessene psychosoziale Belastung für den Patienten und die Pflegekräfte darstellen.

Während wir in der vorläufigen und vollständigen Analyse alle zehn Lernenden in jedem Modellierungsschema verwendeten, konzentrierten wir unsere Ergebnisse auf die drei Klassifikatoren, die die beständigste starke Leistung zeigten. Dies sollte auch auf der Grundlage dieser Daten die Lernenden hervorheben, die in einer praktischen klinischen Anwendung bei der Bestimmung der kognitiven Statusklassifikation zuverlässig auf hohem Niveau arbeiten würden. Da diese Studie als einführende Untersuchung der Nützlichkeit des maschinellen Lernens beim kognitiven Screening und dieser zeitnahen klinischen Herausforderungen gedacht war, haben wir uns darüber hinaus entschieden, die Lerntechniken einfach und verallgemeinert zu halten, mit minimaler Parameterabstimmung. Wir sind uns bewusst, dass dieser Ansatz möglicherweise das Potenzial für enger definierte patientenspezifische Vorhersagefähigkeiten eingeschränkt hat. Auch wenn uns das Training der Modelle nur mit den Top-Features (gefilterter Ansatz) weitere Informationen zu diesen Daten gibt (spezifisch für die Mängel der gesammelten Daten und den Wert der Optimierung wertvoller klinischer Zeit und Ressourcen hervorhebt), erkennen wir an, dass es verfrüht ist, sie einzuschränken Der Umfang der Modelle und daher alle (und andere Merkmale) sollten bei zukünftigen Forschungen berücksichtigt werden, bis wir ein definitiveres Profil der vorrangigen Merkmale haben, das auf die breite Bevölkerung anwendbar wäre. Daher erkennen wir auch voll und ganz an, dass umfassendere und breiter repräsentative Daten und eine Optimierung dieser und anderer Modelle erforderlich wären, bevor sie in eine effektive klinische Anwendung integriert werden können, insbesondere um Komorbiditäten zu berücksichtigen, die die kognitive Leistungsfähigkeit beeinträchtigen und bei der weiteren klinischen Bewertung berücksichtigt werden müssten.

Die Nützlichkeit von MemTrax wurde durch die Modellierung der Schwere der Erkrankung auf der Grundlage einer separaten klinischen Diagnose weiter untermauert. Eine bessere Gesamtklassifikationsleistung bei der Vorhersage des Schweregrades von VaD (im Vergleich zu AD) war nicht vorhanden überraschend angesichts der Merkmale des Patientenprofils in den Modellen, die für die Gefäßgesundheit spezifisch sind und Schlaganfallrisiko, dh Bluthochdruck, Hyperlipidämie, Diabetes und (natürlich) Schlaganfallgeschichte. Obwohl es wünschenswerter und angemessener gewesen wäre, die gleiche klinische Bewertung an übereinstimmenden Patienten mit normaler kognitiver Gesundheit durchzuführen, um die Lernenden mit diesen umfassenderen Daten zu schulen. Dies ist besonders gerechtfertigt, da MemTrax hauptsächlich für die Früherkennung eines kognitiven Defizits und die anschließende Verfolgung individueller Veränderungen vorgesehen ist. Es ist auch plausibel, dass die wünschenswertere Verteilung der Daten im VaD-Datensatz teilweise zu der vergleichsweise besseren Modellierungsleistung beigetragen hat. Der VaD-Datensatz war zwischen den beiden Klassen gut ausbalanciert, der AD-Datensatz mit weit weniger MCI-Patienten hingegen nicht. Gerade bei kleinen Datensätzen können schon wenige zusätzliche Instanzen einen messbaren Unterschied machen. Beide Perspektiven sind vernünftige Argumente, die den Unterschieden in der Leistungsfähigkeit der Modellierung der Schwere der Erkrankung zugrunde liegen. Es ist jedoch verfrüht, die verbesserte Leistung proportional den numerischen Merkmalen des Datensatzes oder den inhärenten Merkmalen zuzuschreiben, die für die betrachtete klinische Präsentation spezifisch sind. Nichtsdestotrotz bietet dieser neu demonstrierte Nutzen eines prädiktiven Klassifikationsmodells von MemTrax in der Rolle der klinischen diagnostischen Unterstützung eine wertvolle Perspektive und bestätigt das Streben nach zusätzlichen Untersuchungen bei Patienten im gesamten Kontinuum von MCI.

Die Implementierung und der nachgewiesene Nutzen von MemTrax und diesen Modellen in China, wo Sprache und Kultur sich drastisch von anderen Regionen mit etabliertem Nutzen unterscheiden (z. B. Frankreich, Niederlande und Vereinigte Staaten) [7, 8, 27], unterstreicht das Potenzial weiter für die breite globale Akzeptanz und den klinischen Wert einer MemTrax-basierten Plattform. Dies ist ein nachweisbares Beispiel für das Streben nach Datenharmonisierung und die Entwicklung praktischer internationaler Normen und Modellierungsressourcen für das kognitive Screening, die standardisiert und leicht für den weltweiten Einsatz angepasst werden können.

Nächste Schritte bei der Modellierung und Anwendung des kognitiven Rückgangs

Kognitive Dysfunktion bei AD tritt tatsächlich auf einem Kontinuum auf, nicht in diskreten Stadien oder Schritten [28, 29]. In dieser frühen Phase war es jedoch unser Ziel, zunächst unsere Fähigkeit zu etablieren, ein Modell mit MemTrax zu bauen, das grundlegend zwischen „normal“ und „nicht normal“ unterscheiden kann. Umfassendere empirische Daten (z. B. Bildgebung des Gehirns, genetische Merkmale, Biomarker, Komorbiditäten und funktionelle Marker des Komplexes Aktivitäten, die Kognition erfordern Kontrolle) [30] über verschiedene globale Regionen, Bevölkerungsgruppen und Altersgruppen hinweg, um anspruchsvollere (einschließlich passend gewichtete Ensembles) maschinelle Lernmodelle zu trainieren und zu entwickeln, wird ein höheres Maß an verbesserter Klassifizierung unterstützen, d. h. die Fähigkeit, Gruppen von Patienten mit zu kategorisieren MCI in kleinere und eindeutigere Untergruppen entlang des Kontinuums des kognitiven Rückgangs. Darüber hinaus sind begleitende klinische Diagnosen für Einzelpersonen in regional unterschiedlichen Patientenpopulationen unerlässlich effektiv trainieren diese umfassenderen und vorhersagbar robusten Modelle. Dies wird ein spezifischeres stratifiziertes Fallmanagement für Personen mit ähnlichen Hintergründen, Einflüssen und enger definierten charakteristischen kognitiven Profilen erleichtern und somit die klinische Entscheidungsunterstützung und Patientenversorgung optimieren.

Ein Großteil der relevanten klinischen Forschung hat sich bisher mit Patienten mit zumindest leichter Demenz befasst; und in der Praxis wird allzu oft erst in fortgeschrittenen Stadien versucht, Patienten einzugreifen. Da der kognitive Rückgang jedoch lange vor dem Erreichen der klinischen Kriterien für Demenz beginnt, könnte ein effektiv angewandtes MemTrax-basiertes Frühscreening eine angemessene Aufklärung der Personen über die Krankheit und ihren Verlauf fördern und frühere und rechtzeitigere Interventionen veranlassen. Daher könnte die Früherkennung geeignete Maßnahmen unterstützen, die von Bewegung, Ernährung, emotionaler Unterstützung und verbesserter Sozialisation bis hin zu pharmakologischen Interventionen reichen, und patientenbezogene Verhaltens- und Wahrnehmungsänderungen verstärken, die einzeln oder insgesamt das Fortschreiten der Demenz abschwächen oder möglicherweise stoppen könnten [31, 32]. . Darüber hinaus mit effektiv frühes Screening, Einzelpersonen und ihre Familien können aufgefordert werden, klinische Studien in Betracht zu ziehen oder Beratung und andere soziale Dienste in Anspruch zu nehmen, um zu helfen, Erwartungen und Absichten zu klären und tägliche Aufgaben zu bewältigen. Eine weitere Validierung und ein weit verbreiteter praktischer Nutzen auf diese Weise könnten bei vielen Personen dazu beitragen, das Fortschreiten von MCI, AD und ADRD zu mildern oder zu stoppen.

Tatsächlich repräsentiert das untere Ende der Altersspanne der Patienten in unserer Studie nicht die Population, die traditionell von AD betroffen ist. Nichtsdestotrotz unterstreicht das Durchschnittsalter für jede Gruppe, die in den Klassifikationsmodellierungsschemata basierend auf dem MoCA-Score/Schwellenwert und dem Schweregrad der Diagnose (Tabelle 3) verwendet wird, dass eine klare Mehrheit (über 80 %) mindestens 50 Jahre alt ist. Diese Verteilung eignet sich daher sehr gut zur Verallgemeinerung und unterstützt die Nützlichkeit dieser Modelle in der Population, die diejenigen charakterisiert, die typischerweise davon betroffen sind früher Beginn und aufkeimende neurokognitive Erkrankungen aufgrund von AD und VaD. Auch neuere Erkenntnisse und Perspektiven betonen diese anerkannten Faktoren (z. B. Bluthochdruck, Fettleibigkeit, Diabetes und Rauchen), die möglicherweise zu einem höheren Frühstadium beitragen vaskuläre Risikowerte bei Erwachsenen und in der Mitte des Lebens und daraus resultierende subtile vaskuläre Hirnverletzungen, die sich schleichend mit offensichtlichen Auswirkungen sogar in jungen Jahren entwickeln Erwachsene [33–35]. Dementsprechend ist die optimale erste Screening-Möglichkeit für eine frühzeitige Erkennung kognitive Defizite zu inszenieren und effektive Präventions- und Interventionsstrategien zu initiieren, um Demenz erfolgreich zu bekämpfen ergeben sich aus der Untersuchung von beitragenden Faktoren und vorausgehenden Indikatoren im gesamten Altersspektrum, einschließlich des frühen Erwachsenenalters und möglicherweise sogar der Kindheit (unter Berücksichtigung der Relevanz genetischer Faktoren wie Apolipoprotein E aus der frühen Schwangerschaft).

In der Praxis sind gültige klinische Diagnosen und kostspielige Verfahren für fortschrittliche Bildgebung, genetische Profilerstellung und Messung vielversprechender Biomarker nicht immer ohne weiteres verfügbar oder für viele Anbieter nicht einmal durchführbar. Daher muss in vielen Fällen die anfängliche allgemeine Klassifizierung des kognitiven Gesundheitszustands möglicherweise aus Modellen abgeleitet werden, die andere einfache Metriken verwenden, die vom Patienten bereitgestellt werden (z Speicherprobleme, aktuelle Medikamente und Einschränkungen bei routinemäßigen Aktivitäten) und gemeinsame demografische Merkmale [7]. Register wie die University of California Mentale Leistungsfähigkeit Register (https://www.brainhealthregistry.org/) [27] und andere mit einer inhärenten größeren Bandbreite an selbstberichteten Symptomen, qualitativen Maßnahmen (z. B. Schlaf und Alltagswahrnehmung), Medikamenten, Gesundheitszustand und Anamnese und Detailliertere demografische Daten werden bei der Entwicklung und Validierung der praktischen Anwendung dieser primitiveren Modelle in der Klinik von entscheidender Bedeutung sein. Darüber hinaus kann ein Test wie MemTrax, der sich bei der Beurteilung der Gedächtnisfunktion als nützlich erwiesen hat, tatsächlich eine wesentlich bessere Schätzung der AD-Pathologie liefern als biologische Marker. Angesichts der Tatsache, dass das Kernmerkmal der AD-Pathologie eine Störung der Neuroplastizität und ein überwältigend komplexer Verlust von Synapsen ist, der sich als episodisch manifestiert Gedächtnisstörungen, ein Maß, das das episodische Gedächtnis möglicherweise tatsächlich bewertet liefern eine bessere Schätzung der pathologischen AD-Belastung als biologische Marker im lebenden Patienten [36].

Bei allen Vorhersagemodellen – ob ergänzt durch komplexe und umfassende Daten aus modernster Technologie und verfeinerten klinischen Erkenntnissen aus mehreren Bereichen oder solchen, die auf grundlegendere und leicht verfügbare Informationen beschränkt sind, die für bestehende Patientenprofile charakteristisch sind – ist der anerkannte Vorteil der künstlichen Intelligenz und maschinelles Lernen besteht darin, dass die resultierenden Modelle relevante neue Daten und Perspektiven, die durch die laufende Anwendungsnutzung bereitgestellt werden, synthetisieren und induktiv „lernen“ können. Nach dem praktischen Technologietransfer werden die Vorhersageleistung und die Klassifikation der kognitiven Gesundheit robuster sein, da die hier (und zu entwickelnden) Modelle angewendet und mit mehr Fällen und einschlägigen Daten (einschließlich Patienten mit Komorbiditäten, die mit einem anschließenden kognitiven Verfall einhergehen könnten) angereichert werden. was zu einer effektiveren klinischen Entscheidungshilfe führt. Diese Entwicklung wird durch die Einbettung von MemTrax in benutzerdefinierte (auf die verfügbaren Fähigkeiten ausgerichtete) Plattformen, die Gesundheitsdienstleister in Echtzeit in der Klinik nutzen könnten, umfassender und praktischer realisiert.

Unabdingbar für die Validierung und Nützlichkeit des MemTrax-Modells für diagnostische Unterstützung und Patientenversorgung sind sehr begehrte aussagekräftige Längsschnittdaten. Durch die Beobachtung und Aufzeichnung der begleitenden Veränderungen (falls vorhanden) des klinischen Zustands über einen angemessenen Bereich von normal bis MCI im Frühstadium können die Modelle für eine angemessene fortlaufende Bewertung und Klassifizierung trainiert und modifiziert werden, wenn die Patienten altern und behandelt werden. Das heißt, der wiederholte Nutzen kann bei der Längsverfolgung leichter kognitiver Veränderungen, der Interventionswirksamkeit und der Aufrechterhaltung einer informierten stratifizierten Versorgung helfen. Dieser Ansatz ist enger an der klinischen Praxis und dem Patienten- und Fallmanagement ausgerichtet.

Einschränkungen

Wir wissen die Herausforderung und den Wert zu schätzen, saubere klinische Daten in einem kontrollierten Klinik-/Krankenhausumfeld zu sammeln. Nichtsdestotrotz hätte es unsere Modellierung gestärkt, wenn unsere Datensätze mehr Patienten mit gemeinsamen Merkmalen enthalten würden. Darüber hinaus wäre es spezifisch für unsere Diagnosemodellierung wünschenswerter und passender gewesen, die gleiche klinische Bewertung an übereinstimmenden Patienten mit normaler kognitiver Gesundheit durchzuführen, um die Lernenden zu schulen. Und wie durch die höhere Klassifikationsleistung unter Verwendung des gefilterten Datensatzes (nur die vier am besten bewerteten Merkmale), allgemeiner und allgemeiner unterstrichen wird kognitive Gesundheitsmaße/-indikatoren hätten sich wahrscheinlich verbessert Modellierung der Leistung mit einer größeren Anzahl gemeinsamer Merkmale bei allen Patienten.

Bestimmte Teilnehmer könnten gleichzeitig an anderen Krankheiten gelitten haben, die vorübergehende oder chronische kognitive Defizite ausgelöst haben könnten. Mit Ausnahme des XL-Unterdatensatzes, in dem die Patienten diagnostisch entweder als Patienten mit AD oder VaD klassifiziert wurden, wurden im YH-Patientenpool keine Komorbiditätsdaten erhoben/gemeldet, und die bei weitem vorherrschende berichtete Komorbidität im KM-Unterdatensatz war Diabetes. Es lässt sich jedoch argumentieren, dass die Einbeziehung von Patienten in unsere Modellierungsschemata mit Komorbiditäten, die ein Maß an kognitiver Beeinträchtigung und einer daraus resultierenden geringeren MemTrax-Leistung hervorrufen oder verschlimmern könnten, repräsentativer für die reale Zielpatientenpopulation für dieses allgemeinere frühe kognitive Screening wäre und Modellierungsansatz. In Zukunft ist die genaue Diagnose von Komorbiditäten, die die kognitive Leistungsfähigkeit beeinträchtigen können, im Großen und Ganzen von Vorteil für die Optimierung der Modelle und der daraus resultierenden Patientenversorgungsanwendungen.

Schließlich benutzten die Patienten mit YH- und KM-Unterdatensatz ein Smartphone, um den MemTrax-Test durchzuführen, während eine begrenzte Anzahl der Patienten mit XL-Unterdatensatz ein iPad und der Rest ein Smartphone verwendete. Dies könnte zu einem geringfügigen gerätebezogenen Unterschied in der MemTrax-Leistung für die MoCA-Klassifizierungsmodellierung geführt haben. Unterschiede (falls vorhanden) in MTx-RT beispielsweise zwischen Geräten wären jedoch wahrscheinlich vernachlässigbar, insbesondere wenn jeder Teilnehmer kurz vor der aufgezeichneten Testleistung einen „Übungstest“ erhält. Dennoch beeinträchtigt die Nützlichkeit dieser beiden Handheld-Geräte möglicherweise den direkten Vergleich mit und/oder die Integration mit anderen MemTrax-Ergebnissen, bei denen Benutzer auf wiederholte Bilder reagierten, indem sie die Leertaste auf einer Computertastatur berührten.

Wichtige Punkte zum Vorhersagemodellierungsdienstprogramm MemTrax

  • • Unsere leistungsstärksten Vorhersagemodelle, die ausgewählte MemTrax-Leistungsmetriken umfassen, könnten den kognitiven Gesundheitszustand (normale kognitive Gesundheit oder MCI) zuverlässig klassifizieren, wie es der weithin anerkannte MoCA-Test anzeigen würde.
  • • Diese Ergebnisse unterstützen die Integration ausgewählter MemTrax-Leistungsmetriken in eine Klassifikationsvorhersagemodell-Screening-Anwendung für kognitive Beeinträchtigungen im Frühstadium.
  • • Unsere Klassifikationsmodellierung zeigte auch das Potenzial für die Nutzung der MemTrax-Leistung in Anwendungen zur Unterscheidung des Schweregrads der Demenzdiagnose.

Diese neuartigen Ergebnisse liefern endgültige Beweise für die Nützlichkeit des maschinellen Lernens beim Aufbau verbesserter robuster MemTrax-basierter Klassifizierungsmodelle für die diagnostische Unterstützung beim effektiven klinischen Fallmanagement und der Patientenversorgung von Personen mit kognitiven Beeinträchtigungen.

Danksagung

Wir würdigen die Arbeit von J. Wesson Ashford, Curtis B. Ashford und Kollegen für die Entwicklung und Validierung der hier verwendeten Online-Aufgabe und des Tools zur kontinuierlichen Erkennung (MemTrax) und danken den zahlreichen Patienten mit Demenz, die zu der kritischen Grundlagenforschung beigetragen haben . Wir danken auch Xianbo Zhou und seinen Kollegen bei SJN Biomed LTD, seinen Kollegen und Mitarbeitern an den Standorten der Krankenhäuser/Kliniken, insbesondere Dr. M. Luo und M. Zhong, die bei der Rekrutierung von Teilnehmern, der Planung von Tests und der Erfassung, Aufzeichnung und Front-End-Verwaltung der Daten halfen, und den freiwilligen Teilnehmern, die ihre wertvolle Zeit gespendet und sich verpflichtet haben, die Tests durchzuführen und bereitzustellen die wertvollen Daten, die wir in dieser Studie auswerten können. Dies Die Studie wurde teilweise von MD Scientific Research unterstützt Program of Kunming Medical University (Grant no. 2017BS028 to XL) und das Research Program of Yunnan Science and Technology Department (Grant no. 2019FE001 (-222) to XL).

J. Wesson Ashford hat eine Patentanmeldung für die Verwendung des spezifischen kontinuierlichen Erkennungsparadigmas eingereicht, das in dieser Veröffentlichung allgemein beschrieben wird Prüfung des Gedächtnisses.

MemTrax, LLC ist ein Unternehmen im Besitz von Curtis Ashford, und dieses Unternehmen verwaltet die Gedächtnistest System, das in diesem Dokument beschrieben wird.

Offenlegungen der Autoren online verfügbar (https://www.j-alz.com/manuscript-disclosures/19-1340r2).

Gedächtnistest Demenztest Gedächtnisverlusttest Kurzzeitgedächtnisverlusttest Widdertest Geistdiät Vielzahl von Büchern Kognitiver Test online
Curtis Ashford – Koordinator für kognitive Forschung

REFERENZEN

[1] Alzheimer's Association (2016) Fakten zur Alzheimer-Krankheit 2016 und Zahlen. Alzheimer Demenz 12, 459–509.
[2] Gresenz CR, Mitchell JM, Marrone J, Federoff HJ (2019) Effekt des frühen Stadiums Alzheimer-Krankheit über die finanziellen Ergebnisse des Haushalts. Gesundheitswirtschaft 29, 18–29.
[3] Foster NL , Bondi MW , Das R , Foss M , Hershey LA , Koh S , Logan R , Poole C , Shega JW , Sood A , Thothala N , Wicklund M , Yu M , Bennett A , Wang D (2019) Qualitätsverbesserung in Neurologie: Qualitätsmesssatz für leichte kognitive Beeinträchtigungen. Neurologie 93, 705–713.
[4] Tong T, Thokala P, McMillan B, Ghosh R, Brazier J (2017) Kosteneffizienz der Nutzung kognitive Screening-Tests zur Erkennung von Demenz und leichter kognitiver Beeinträchtigung in der Primärversorgung. Int J Geriatr Psychiatry 32, 1392–1400.
[5] Ashford JW, Gere E, Bayley PJ (2011) Gedächtnis messen in Großgruppen mit einem kontinuierlichen Wiedererkennungstest. J Alzheimers Dis 27, 885–895.
[6] Ashford JW, Tarpin-Bernard F, Ashford CB, Ashford MT (2019) Eine computergestützte kontinuierliche Erkennungsaufgabe zur Messung des episodischen Gedächtnisses. J Alzheimers Dis 69, 385–399.
[7] Bergeron MF , Landset S , Tarpin-Bernard F , Ashford CB , Khoshgoftaar TM , Ashford JW (2019) Episodische Gedächtnisleistung bei der Modellierung maschinellen Lernens zur Vorhersage der Klassifizierung des kognitiven Gesundheitszustands. J Alzheimers Dis 70, 277–286.
[8] van der Hoek MD, Nieuwenhuizen A, Keijer J, Ashford JW (2019) The MemTrax-Test im Vergleich zur Schätzung der kognitiven Bewertung von Montreal bei leichter kognitiver Beeinträchtigung. J Alzheimers Dis 67, 1045–1054.
[9] Falcone M, Yadav N, Poellabauer C, Flynn P (2013) Verwendung isolierter Vokale zur Klassifizierung leichter traumatischer Hirnverletzungen. 2013 IEEE International Conference on Acoustics, Speech and Signal Processing, Vancouver, BC, S. 7577–7581.
[10] Dabek F, Caban JJ (2015) Nutzung von Big Data zur Modellierung der Wahrscheinlichkeit der Entwicklung psychischer Erkrankungen nach einer Gehirnerschütterung. Procedia Comput Sci 53, 265–273.
[11] Climent MT, Pardo J, Munoz-Almaraz FJ, Guerrero MD, Moreno L (2018) Entscheidungsbaum zur Früherkennung kognitiver Beeinträchtigungen durch kommunale Apotheker. Front Pharmacol 9, 1232.
[12] Nasreddine ZS , Phillips NA , Bedirian V , Charbonneau S , Whitehead V , Collin I , Cummings JL , Chertkow H (2005) The Montreal Cognitive Assessment, MoCA: Ein kurzes Screening-Tool für leichte kognitive Beeinträchtigung. J Am Geriatr Soc 53, 695–699.
[13] Yu J, Li J, Huang X (2012)Die Peking-Version des kognitiven Assessments von Montreal als kurzes Screening-Tool für leichte kognitive Beeinträchtigung: Eine gemeinschaftsbasierte Studie. BMC Psychiatrie 12, 156.
[14] Chen KL , Xu Y , Chu AQ , Ding D , Liang XN , Nasreddine ZS , Dong Q , Hong Z , Zhao QH , Guo QH (2016)Validierung der chinesischen Version von Montreal Cognitive Assessment Basic für das Screening leichter kognitiver Beeinträchtigungen. J Am Geriatr Soc 64, e285–e290.
[15] Carson N., Leach L., Murphy KJ (2018) Eine erneute Untersuchung der Cutoff-Werte des Montreal Cognitive Assessment (MoCA). Int J Geriatr Psychiatry 33, 379–388.
[16] American Psychiatric Association (2013) Task Force Diagnostisches und statistisches Handbuch psychischer Störungen: DSM-5™, American Psychiatric Publishing, Inc., Washington, DC.
[17] Python. Python Software Foundation, http://www.python.org, Zugriff am 15. November 2019.
[18] R Kerngruppe, R: Eine Sprache und Umgebung für statistisches Rechnen R Foundation for Statistical Computing, Wien, Österreich. https://www.R-project.org/, 2018, Zugriff am 15. November 2019.
[19] Benavoli A, Corani G, Demšar J, Zaffalon M (2017) Zeit für eine Veränderung: Ein Tutorial zum Vergleich mehrerer Klassifikatoren durch Bayes'sche Analyse. J Mach Learn Res 18, 1–36.
[20] Frank E , Hall MA , Witten IH (2016) Die WEKA-Werkbank. Im Data Mining: Praktische Tools und Techniken für maschinelles Lernen, Frank E, Hall MA, Witten IH, Pal CJ, Hrsg. Morgan Kaufmann https://www.cs.waikato.ac.nz/ml/weka/Witten_et_al_2016_appendix.pdf
[21] Bergeron MF, Landset S, Maugans TA, Williams VB, Collins CL, Wasserman EB, Khoshgoftaar TM (2019) Maschinelles Lernen bei der Modellierung der Lösung von Gehirnerschütterungssymptomen im Highschool-Sport. Med Sci Sports Exerc 51, 1362–1371.
[22] Van Hulse J, Khoshgoftaar TM, Napolitano A (2007) Experimentelle Perspektiven zum Lernen aus unausgewogenen Daten. Im Tagungsband der 24. Internationalen Konferenz für Maschinelles Lernen, Corvalis, Oregon, USA, S. 935-942.
[23] Ashford JW , Kolm P , Colliver JA , Bekian C , Hsu LN (1989) Alzheimer-Patientenbewertung und der Mini-Mentalzustand: Item-Charakteristikkurvenanalyse.P. J. Gerontol 44, 139–146.
[24] Ashford JW, Jarvik L. (1985) Alzheimer-Erkrankung: Prädisponiert Neuronenplastizität für axonale neurofibrilläre Degeneration? N Engl J Med 313, 388–389.
[25] Jack CR Jr, Therneau TM, Weigand SD, Wiste HJ, Knopman DS, Vemuri P, Lowe VJ, Mielke MM, Roberts RO, Machulda MM, Graff-Radford J, Jones DT, Schwarz CG, Gunter JL, Senjem ML , Rocca WA, Petersen RC (2019)Prävalenz von biologisch vs. klinisch definierten Alzheimer-Spektrum-Entitäten unter Verwendung des National Institute on Aging-Alzheimer Assoziationsforschung Rahmen. JAMA Neurol 76, 1174–1183.
[26] Zhou X, Ashford JW (2019) Fortschritte bei Screening-Instrumenten für Alzheimer-Krankheit. Altern Med 2, 88–93.
[27] Weiner MW, Nosheny R., Camacho M., Truran-Sacrey D., Mackin RS. Flenniken D., Ulbricht A., Insel P., Finley S., Fockler J., Veitch D. (2018) The Mentale Leistungsfähigkeit Register: Eine internetbasierte Plattform zur Rekrutierung, Bewertung und Längsschnittüberwachung von Teilnehmern für neurowissenschaftliche Studien. Alzheimer Demenz 14, 1063–1076.
[28] Ashford JW, Schmitt FA (2001) Modellierung des Zeitverlaufs von Alzheimer-Demenz. Curr Psychiatry Rep 3, 20–28.
[29] Li X, Wang X, Su L, Hu X, Han Y (2019) Sino Longitudinal Study on Cognitive Decline (SILCODE): Protokoll für eine chinesische Längsschnitt-Beobachtungsstudie zur Entwicklung von Risikovorhersagemodellen für die Umwandlung in leichte kognitive Beeinträchtigungen bei Personen mit subjektiver kognitiver Beeinträchtigung Abfall. BMJ Open 9, e028188.
[30] Tarnanas I, Tsolaki A, Wiederhold M, Wiederhold B, Tsolaki M (2015) Five-year biomarker progression variability for Demenz der Alzheimer-Krankheit Vorhersage: Kann ein komplexer instrumenteller Aktivitäten-Marker des täglichen Lebens die Lücken füllen? Alzheimer Demenz (Amst) 1, 521–532.
[31] McGurran H, Glenn JM, Madero EN, Bott NT (2019) Vorbeugung und Behandlung der Alzheimer-Krankheit: Biologische Mechanismen der Übung. J Alzheimers Dis 69, 311–338.
[32] Mendiola-Precoma J, Berumen LC, Padilla K, Garcia-Alcocer G (2016) Therapies for Vorbeugung und Behandlung der Alzheimer-Krankheit. Biomed Res Int 2016, 2589276.
[33] Lane CA , Barnes J , Nicholas JM , Sudre CH , Cash DM , Malone IB , Parker TD , Keshavan A , Buchanan SM , Keuss SE , James SN , Lu K , Murray-Smith H , Wong A , Gordon E , Coath W , Modat M, Thomas D, Richards M, Fox NC, Schott JM (2020) Assoziationen zwischen vaskulärem Risiko im Erwachsenenalter und Hirnpathologie im späten Leben: Beweise aus einer britischen Geburtskohorte. JAMA Neurol 77, 175–183.
[34] Seshadri S (2020) Prävention von Demenz – Denken über das Alter hinaus und Amyloidkisten. JAMA Neurol 77, 160–161.
[35] Maillard P, Seshadri S, Beiser A, Himali JJ, Au R, Fletcher E, Carmichael O, Wolf PA, DeCarli C (2012) Auswirkungen des systolischen Blutdrucks auf die Integrität der weißen Substanz bei jungen Erwachsenen in der Framingham-Herzstudie: Ein Kreuz -Schnittstudie. Lancet Neurol 11, 1039–1047.
[36] Fink HA, Linskens EJ, Silverman PC, McCarten JR, Hemmy LS, Ouellette JM, Greer NL, Wilt TJ, Butler M (2020) Accuracy of biomarker testing for neuropathologically defined Alzheimer-Krankheit bei älteren Erwachsenen mit Demenz. Ann Intern Med 172, 669–677.

Zugehörigkeiten: [a] SIVOTEC Analytics, Boca Raton, FL, USA | [b] Institut für Informatik und Elektrotechnik und Informatik, Florida Atlantic University, Boca Raton, FL, USA | [c] SJN Biomed LTD, Kunming, Yunnan, China | [d] Zentrum für Alzheimer-Forschung, Washington Institute of Clinical Research, Washington, DC, USA | [e] Abteilung für Rehabilitationsmedizin, Erstes angeschlossenes Krankenhaus der Medizinischen Universität Kunming, Kunming, Yunnan, China | [f] Abteilung für Neurologie, Volkskrankenhaus Dehong, Dehong, Yunnan, China | [g] Abteilung für Neurologie, Erstes angeschlossenes Krankenhaus der Medizinischen Universität Kunming, Bezirk Wuhua, Kunming, Provinz Yunnan, China | [h] Studienzentrum für kriegsbedingte Krankheiten und Verletzungen, VA Palo Alto Gesundheitspflege System, Palo Alto, CA, USA | [i] Abteilung für Psychiatrie und Verhaltenswissenschaften, Stanford University School of Medicine, Palo Alto, CA, USA

Korrespondenz: [*] Korrespondenz an: Michael F. Bergeron, PhD, FACSM, SIVOTEC Analytics, Boca Raton Innovation Campus, 4800 T-Rex Avenue, Suite 315, Boca Raton, FL 33431, USA. E-Mail: mbergeron@sivotecanalytics.com.; Xiaolei Liu, MD, Abteilung für Neurologie, First Affiliated Hospital of Kunming Medical University, 295 Xichang Road, Bezirk Wuhua, Kunming, Provinz Yunnan 650032, China. E-Mail: ring@vip.163.com.

Schlüsselwörter: Altern, Alzheimer-Krankheit, Demenz, Massenscreening