Brug af MemTrax og Machine Learning-modellering til klassificering af mild kognitiv svækkelse

Forskningsartikel

Forfattere: Bergeron, Michael F. | Landset, Sara | Zhou, Xianbo | Ding, Tao | Khoshgoftaar, Taghi M. | Zhao, Feng | Du, Bo | Chen, Xinjie | Wang, Xuan | Zhong, Lianmei | Liu, Xiaolei| Ashford, J. Wesson

DOI: 10.3233/JAD-191340

Tidsskrift: Tidsskrift for Alzheimers sygdom, vol. 77, nr. 4, s. 1545-1558, 2020

Abstrakt

Baggrund:

Den udbredte forekomst og udbredelse af Alzheimers sygdom og mild kognitiv svækkelse (MCI) har foranlediget en presserende opfordring til forskning for at validere tidlig påvisning af kognitiv screening og vurdering.

Formål:

Vores primære forskningsmål var at afgøre, om udvalgte MemTrax-præstationsmålinger og relevante demografiske og sundhedsprofilkarakteristika kan bruges effektivt i prædiktive modeller udviklet med maskinlæring til at klassificere kognitiv sundhed (normal versus MCI), som det ville blive indikeret af Montreal kognitiv vurdering (MoCA).

Metoder:

Vi gennemførte en tværsnitsundersøgelse af 259 voksne patienter med neurologi, hukommelsesklinik og intern medicin rekrutteret fra to hospitaler i Kina. Hver patient fik den kinesisksprogede MoCA og selvadministreret den kontinuerlige anerkendelse MemTrax online episode hukommelsestest online samme dag. Forudsigende klassifikationsmodeller blev bygget ved hjælp af maskinlæring med 10-fold krydsvalidering, og modelydeevne blev målt ved hjælp af Area Under the Receiver Operating Characteristic Curve (AUC). Modellerne blev bygget ved hjælp af to MemTrax-ydeevnemålinger (procent korrekt, responstid) sammen med de otte fælles demografiske og personlige historiefunktioner.

resultater:

Ved at sammenligne eleverne på tværs af udvalgte kombinationer af MoCA-score og tærskelværdier var Naive Bayes generelt den bedst præsterende elev med en samlet klassifikationspræstation på 0.9093. Blandt de tre bedste elever var MemTrax-baseret klassifikationspræstation samlet set overlegen ved kun at bruge de fire toprangerede funktioner (0.9119) sammenlignet med at bruge alle 10 almindelige funktioner (0.8999).

konklusion:

MemTrax-ydeevne kan effektivt udnyttes i en forudsigelig model for maskinlæringsklassifikation screeningsapplikation til påvisning af kognitiv svækkelse på et tidligt stadie.

INDLEDNING

Den anerkendte (omend underdiagnosticeret) udbredte forekomst og prævalens og parallelt eskalerende medicinske, sociale og offentlige sundhed omkostninger og byrde ved Alzheimers sygdom (AD) og mild kognitiv svækkelse (MCI) er i stigende grad belastende for alle interessenter [1, 2]. Dette foruroligende og bourgeoning scenarie har foranlediget en presserende opfordring til forskning for at validere tidlig påvisning kognitive screenings- og vurderingsinstrumenter til regelmæssig praktisk anvendelighed i personlige og kliniske omgivelser for ældre patienter på tværs af forskellige regioner og populationer [3]. Disse instrumenter skal også give mulighed for problemfri oversættelse af informative resultater til elektroniske sundhedsjournaler. Fordelene vil blive realiseret ved at informere patienter og hjælpe læger med at erkende væsentlige ændringer tidligere og dermed muliggøre mere hurtig og rettidig stratificering, implementering og sporing af passende individualiseret og mere omkostningseffektiv behandling og patientbehandling for dem, der begynder at opleve kognitivt fald [3, 4].

Det computeriserede MemTrax-værktøj (https://memtrax.com) er en enkel og kort kontinuerlig genkendelsesvurdering, der kan administreres selv online for at måle udfordrende tidsindstillet episodisk hukommelsesydelse, hvor brugeren reagerer på gentagne billeder og ikke på en indledende præsentation [5, 6]. Nyere forskning og deraf følgende praktiske implikationer begynder gradvist og kollektivt at demonstrere den kliniske effekt af MemTrax i tidlig AD- og MCI-screening [5-7]. Imidlertid direkte sammenligning af klinisk nytte til eksisterende kognitiv sundhed vurdering og konventionelle standarder er berettiget til at informere professionelt perspektiv og bekræfte MemTrax-funktioner i tidlig detektion og diagnostisk support. van der Hoek et al. [8] sammenlignede udvalgte MemTrax præstationsmålinger (reaktionshastighed og procent korrekt) med kognitiv status som bestemt af Montreal Kognitiv vurdering (MoCA). Imidlertid var denne undersøgelse begrænset til at forbinde disse præstationsmålinger med karakterisering af kognitiv status (som bestemt af MoCA) og definere de relative intervaller og cutoff-værdier. For at udvide denne undersøgelse og forbedre klassificeringens ydeevne og effektivitet var vores primære forskningsspørgsmål derfor:

  • Kan en persons udvalgte MemTrax præstationsmålinger og relevante demografiske oplysninger og sundhed profil egenskaber effektivt udnyttes i en prædiktiv model udviklet med maskinlæring til at klassificere kognitiv sundhed dikotomisk (normal versus MCI), som det ville være indikeret af ens MoCA-score?

Sekundært til dette ønskede vi at vide:

  • Inklusive de samme funktioner, kan en MemTrax præstationsbaseret maskinlæringsmodel effektivt anvendes på en patient til at forudsige sværhedsgrad (mild versus svær) inden for udvalgte kategorier af kognitiv svækkelse, som ville blive bestemt af en uafhængig klinisk diagnose?

Fremkomsten og udviklingen af ​​den praktiske anvendelse af kunstig intelligens og maskinlæring i screening/detektion har allerede vist tydelige praktiske fordele, hvor prædiktiv modellering effektivt vejleder klinikere i den udfordrende vurdering af kognitiv/hjernesundhed og patienthåndtering. I vores undersøgelse valgte vi en lignende tilgang til MCI-klassifikationsmodellering og diskrimination af kognitiv svækkelse, som bekræftet af klinisk diagnose fra tre datasæt, der repræsenterer udvalgte frivillige indlagte patienter og ambulante patienter fra to hospitaler i Kina. Ved at bruge maskinlæringsprædiktiv modellering identificerede vi de bedst ydende elever fra de forskellige datasæt/lærer-kombinationer og rangerede funktionerne for at guide os i at definere de mest klinisk praktiske modelapplikationer.

Vores hypoteser var, at en valideret MemTrax-baseret model kan bruges til at klassificere kognitiv sundhed dikotomisk (normal eller MCI) baseret på MoCAs aggregerede scoretærskelkriterium, og at en lignende MemTrax-prædiktiv model effektivt kan anvendes til at skelne sværhedsgraden i udvalgte kategorier af klinisk diagnosticeret kognitiv svækkelse. Demonstration af de forventede resultater ville være medvirkende til at understøtte effektiviteten af ​​MemTrax som en tidlig detektionsskærm for kognitiv tilbagegang og klassificering af kognitiv svækkelse. En gunstig sammenligning med en standard, der påstås fra industrien, suppleret med langt større lethed og hurtig brug, ville have indflydelse på at hjælpe klinikere med at anvende dette enkle, pålidelige og tilgængelige værktøj som en indledende skærm til at opdage kognitive underskud på et tidligt (herunder prodromalt) stadium. En sådan tilgang og nytte kunne således foranledige mere rettidig og bedre stratificeret patientbehandling og intervention. Disse fremadrettede indsigter og forbedrede målinger og modeller kan også være nyttige til at afbøde eller stoppe demensprogression, herunder AD og AD-relaterede demenssygdomme (ADRD).

MATERIALER OG METODER

Undersøg population

Mellem januar 2018 og august 2019 blev tværsnitsforskning afsluttet på patienter rekrutteret fra to hospitaler i Kina. Administrationen af ​​MemTrax [5] til personer på 21 år og derover og indsamlingen og analysen af ​​disse data blev gennemgået og godkendt af og administreret i overensstemmelse med de etiske standarder i Human Emnebeskyttelseskomiteen ved Stanford University. MemTrax og alle andre tests for denne overordnede undersøgelse blev udført i henhold til Helsinki-erklæringen fra 1975 og godkendt af Institutional Review Board for det første tilknyttede hospital ved Kunming Medical University i Kunming, Yunnan, Kina. Hver bruger fik en informeret samtykke formular til at læse/anmelde og derefter frivilligt acceptere at deltage.

Deltagerne blev rekrutteret fra puljen af ​​ambulante patienter i neurologiklinikken på Yanhua Hospital (YH-underdatasæt) og hukommelsesklinik på First Affiliated Hospital of Kunming Medical Universitet (XL-underdatasæt) i Beijing, Kina. Deltagerne blev også rekrutteret fra neurologi (XL-underdatasæt) og intern medicin (KM-underdatasæt) indlagte patienter på det første tilknyttede hospital ved Kunming Medical University. Inklusionskriterier omfattede 1) mænd og kvinder på mindst 21 år, 2) evne til at tale kinesisk (mandarin) og 3) evne til at forstå verbale og skriftlige anvisninger. Udelukkelseskriterier var syn og motoriske svækkelser, der forhindrede deltagerne i at gennemføre MemTrax test, samt manglende evne til at forstå de specifikke testinstruktioner.

Kinesisk version af MemTrax

Den online MemTrax testplatform blev oversat til kinesisk (URL: https://www.memtrax.com.cn) og yderligere tilpasset til at blive brugt gennem WeChat (Shenzhen Tencent Computer Systems Co. LTD., Shenzhen, Guangdong, Kina) til selvadministration. Data blev lagret på en cloud-server (Ali Cloud) placeret i Kina og licenseret fra Alibaba (Alibaba Technology Co. Ltd., Hangzhou, Zhejiang, Kina) af SJN Biomed LTD (Kunming, Yunnan, Kina). Specifikke detaljer om MemTrax og testvaliditetskriterier, der anvendes her, er blevet beskrevet tidligere [6]. Testen blev leveret gratis for patienterne.

Undersøgelsesprocedurer

For indlagte og ambulante patienter, et generelt papirspørgeskema til indsamling af demografiske og personlige oplysninger såsom alder, køn, uddannelsesår, erhverv, bor alene eller med familie, og sygehistorien blev administreret af et medlem af undersøgelsesteamet. Efter udfyldelse af spørgeskemaet blev MoCA [12] og MemTrax testene administreret (MoCA først) med højst 20 minutter mellem testene. MemTrax procent korrekt (MTx-% C), gennemsnitlig responstid (MTx-RT) og dato og klokkeslæt for testen blev registreret på papir af et medlem af undersøgelsesteamet for hver testede deltager. Det udfyldte spørgeskema og resultaterne af MoCA blev uploadet til et Excel-regneark af forskeren, som administrerede testene og verificeret af en kollega, før Excel-filerne blev gemt til analyser.

MemTrax test

MemTrax online-testen inkluderede 50 billeder (25 unikke og 25 gentagelser; 5 sæt af 5 billeder af almindelige scener eller objekter) vist i en bestemt pseudo-tilfældig rækkefølge. Deltageren ville (ifølge instruktionerne) trykke på Start-knappen på skærmen for at påbegynde testen og begynde at se billedserien og igen trykke på billedet på skærmen så hurtigt som muligt, hver gang et gentaget billede dukkede op. Hvert billede dukkede op i 3 s eller indtil billedet på skærmen blev rørt, hvilket medførte øjeblikkelig præsentation af det næste billede. Ved hjælp af det interne ur på den lokale enhed blev MTx-RT for hvert billede bestemt af den forløbne tid fra præsentationen af ​​billedet, til skærmen blev berørt af deltageren som svar på at indikere genkendelse af billedet som et, der allerede var blevet vist under testen. MTx-RT blev optaget for hvert billede, med hele 3 s optaget, hvilket indikerer ingen respons. MTx-% C blev beregnet til at indikere procentdelen af ​​gentagne og indledende billeder, som brugeren reagerede korrekt på (sandt positivt + sandt negativt divideret med 50). Yderligere detaljer om MemTrax administration og implementering, datareduktion, ugyldige eller "intet svar"-data og primære dataanalyser er beskrevet andetsteds [6].

MemTrax-testen blev forklaret i detaljer, og en praksistest (med andre unikke billeder end dem, der blev brugt i testen til registrering af resultater) blev givet til deltagerne i hospitalsmiljøet. Deltagere i YH- og KM-underdatasættene tog MemTrax-testen på en smartphone, der var indlæst med applikationen på WeChat; hvorimod et begrænset antal af XL-underdatasætpatienterne brugte en iPad, og resten brugte en smartphone. Alle deltagere tog MemTrax-testen med en undersøgelsesforsker, der diskret observerede.

Montreal kognitiv vurdering

Beijing-versionen af ​​det kinesiske MoCA (MoCA-BC) [13] blev administreret og bedømt af uddannede forskere i henhold til de officielle testinstruktioner. Det er passende, at MoCA-BC har vist sig at være en pålidelig test for kognitiv screening på tværs af alle uddannelsesniveauer hos kinesiske ældre voksne [14]. Hver test tog omkring 10 til 30 minutter at administrere baseret på den respektive deltagers kognitive evner.

MoCA klassifikationsmodellering

Der var i alt 29 brugbare funktioner, inklusive to MemTrax test ydeevnemålinger og 27 funktioner relateret til demografi og sundhed information for hver deltager. Hver patients MoCA samlede testscore blev brugt som kognitiv screening "benchmark" for at træne vores prædiktive modeller. Derfor, fordi MoCA blev brugt til at oprette klasseetiketten, kunne vi ikke bruge den samlede score (eller nogen af ​​MoCA-undergruppens score) som en uafhængig funktion. Vi udførte foreløbige eksperimenter, hvor vi modellerede (klassificering af kognitiv sundhed defineret af MoCA) de oprindelige tre hospitals/klinik(ker) underdatasæt individuelt og derefter kombineret ved hjælp af alle funktioner. Alle de samme dataelementer blev dog ikke indsamlet i hver af de fire klinikker, der repræsenterede de tre deldatasæt; således havde mange af vores funktioner i det kombinerede datasæt (når vi brugte alle funktioner) en høj forekomst af manglende værdier. Derefter byggede vi modeller med det kombinerede datasæt kun ved at bruge fælles funktioner, hvilket resulterede i forbedret klassificeringsydelse. Dette blev sandsynligvis forklaret ved en kombination af at have flere instanser at arbejde med ved at kombinere de tre patientunderdatasæt og ingen funktioner med en unødig forekomst af manglende værdier (kun én funktion i det kombinerede datasæt, arbejdstype, havde nogen manglende værdier, hvilket påvirker kun tre patienttilfælde), fordi kun fællestræk registreret på alle tre steder var inkluderet. Navnlig havde vi ikke et specifikt afvisningskriterium for hver funktion, som i sidste ende ikke var inkluderet i det kombinerede datasæt. I vores foreløbige kombinerede datasætmodellering brugte vi dog først alle funktioner fra hvert af de tre separate patientunderdatasæt. Dette resulterede i vid udstrækning i modelydelse, der var målbart lavere end den indledende foreløbige modellering på hvert enkelt deldatasæt. Desuden, mens klassifikationspræstationen for modellerne, der blev bygget ved hjælp af alle funktionerne, var opmuntrende, blev ydeevnen forbedret på tværs af alle elever og klassifikationsskemaer for dobbelt så mange modeller, når der kun blev brugt fælles funktioner. Faktisk, blandt hvad der endte med at blive vores bedste elever, blev alle modeller på nær én forbedret ved at fjerne ikke-almindelige funktioner.

Det endelige samlede datasæt (YH, XL og KM kombineret) inkluderede 259 forekomster, der hver repræsenterede en unik deltager, der tog både MemTrax- og MoCA-testene. Der var 10 delte uafhængige funktioner: MemTrax præstationsmålinger: MTx-% C og middel MTx-RT; demografiske og sygehistorieoplysninger: alder, køn, uddannelsesår, arbejdstype (blå krave/hvid krave), social støtte (om testpersonen bor alene eller sammen med familie) og ja/nej svar på, om brugeren havde en historie med diabetes, hyperlipidæmi eller traumatisk hjerneskade. To yderligere målinger, MoCA aggregeret score og MoCA aggregeret score justeret for år af uddannelse [12], blev brugt separat til at udvikle afhængige klassifikationsetiketter, hvilket skaber to forskellige modelleringsskemaer, der skal anvendes på vores kombinerede datasæt. For hver version (justeret og ujusteret) af MoCA-scoren blev dataene igen modelleret separat til binær klassificering ved hjælp af to forskellige kriterietærskler - den oprindeligt anbefalede [12] og en alternativ værdi, der blev brugt og fremmet af andre [8, 15]. I det alternative tærskelklassifikationsskema blev en patient anset for at have normal kognitiv sundhed, hvis han/hun scorede ≥23 på MoCA-testen og havde MCI, hvis scoren var 22 eller lavere; hvorimod patienten i det oprindeligt anbefalede klassifikationsformat skulle score en 26 eller bedre på MoCA for at blive mærket som havende normal kognitiv sundhed.

Filtrerede data til MoCA-klassifikationsmodellering

Vi undersøgte yderligere MoCA-klassificering ved hjælp af fire almindeligt anvendte funktionsrangeringsteknikker: Chi-Squared, Gain Ratio, Information Gain og Symmetrical Uncertainty. For et foreløbigt perspektiv anvendte vi rankerne på hele det kombinerede datasæt ved hjælp af hver af vores fire modelleringsskemaer. Alle rankere var enige om de samme topfunktioner, dvs. alder, antal års uddannelse og begge MemTrax præstationsmålinger (MTx-% C, middel MTx-RT). Vi genopbyggede derefter modellerne ved at bruge hver funktionsvalgsteknik for kun at træne modellerne i de fire øverste funktioner (se Valg af funktion under).

De resulterende sidste otte variationer af MoCA-scoreklassificeringsmodelleringsskemaerne er præsenteret i tabel 1.

tabel 1

Sammenfatning af modelleringsskemavariationer brugt til MoCA-klassificering (Normal Kognitiv sundhed versus MCI)

ModelleringsskemaNormal kognitiv sundhed (negativ klasse)MCI (positiv klasse)
Justeret-23 Ufiltreret/filtreret101 (39.0%)158 (61.0%)
Justeret-26 Ufiltreret/filtreret49 (18.9%)210 (81.1%)
Ujusteret-23 Ufiltreret/filtreret92 (35.5%)167 (64.5%)
Ujusteret-26 Ufiltreret/filtreret42 (16.2%)217 (83.8%)

Respektive antal og procent af det samlede antal patienter i hver klasse er differentieret ved justering af score for uddannelse (Justeret eller Ujusteret) og klassifikationstærskel (23 eller 26), som anvendes på begge funktionssæt (Ufiltreret og Filtreret).

MemTrax-baseret klinisk evalueringsmodellering

Af vores tre originale underdatasæt (YH, XL, KM) blev kun XL-underdatasætpatienterne uafhængigt klinisk diagnosticeret for kognitiv svækkelse (dvs. deres respektive MoCA-score blev ikke brugt til at etablere en klassifikation af normal versus svækket). Specifikt blev XL-patienterne diagnosticeret med enten Alzheimers sygdom test (AD) eller vaskulær demens (VaD). Inden for hver af disse primære diagnosekategorier var der en yderligere betegnelse for MCI. Diagnoser af MCI, demens, vaskulær neurokognitiv lidelse og neurokognitiv lidelse på grund af AD var baseret på specifikke og karakteristiske diagnostiske kriterier skitseret i Diagnostic and Statistical Manual of Mental Disorders: DSM-5 [16]. I betragtning af disse raffinerede diagnoser blev to klassifikationsmodelleringsskemaer separat anvendt på XL-underdatasættet for at skelne sværhedsgrad (grad af svækkelse) for hver primær diagnosekategori. Data, der blev brugt i hver af disse diagnostiske modelleringsskemaer (AD og VaD) inkluderede demografiske og patienthistorieoplysninger såvel som MemTrax-ydelse (MTx-% C, middel MTx-RT). Hver diagnose blev mærket som mild, hvis den blev udpeget til MCI; ellers blev det betragtet som alvorligt. Vi overvejede oprindeligt at inkludere MoCA-scoren i diagnosemodellerne (mild versus svær); men vi besluttede, at det ville besejre formålet med vores sekundære prædiktive modelleringsskema. Her vil eleverne blive trænet ved at bruge andre patientegenskaber, der er let tilgængelige for udbyderen, og præstationsmålinger af den enklere MemTrax-test (i stedet for MoCA) mod referencen "guldstandard", den uafhængige kliniske diagnose. Der var 69 tilfælde i AD-diagnosedatasættet og 76 tilfælde af VaD (tabel 2). I begge datasæt var der 12 uafhængige funktioner. Ud over de 10 funktioner, der er inkluderet i MoCA-scoreklassifikationen, inkluderede patienthistorien også information om hypertension og slagtilfælde.

tabel 2

Sammenfatning af modelleringsskemavariationer brugt til klassificering af diagnoses sværhedsgrad (mild versus svær)

ModelleringsskemaMild (negativ klasse)Alvorlig (positiv klasse)
MCI-AD versus AD12 (17.4%)57 (82.6%)
MCI-VaD versus VaD38 (50.0%)38 (50.0%)

Respektive antal og procent af de samlede patienter i hver klasse er differentieret efter primær diagnosekategori (AD eller VaD).

Statistik

Sammenligning af deltagerkarakteristika og andre numeriske funktioner mellem underdatasæt for hver modelklassifikationsstrategi (for at forudsige MoCA kognitiv sundhed og diagnose sværhedsgrad) blev udført ved hjælp af Python-programmeringssproget (version 2.7.1) [17]. Modelydeevneforskellene blev oprindeligt bestemt ved hjælp af en enkelt- eller to-faktor (alt efter behov) ANOVA med et 95 % konfidensinterval og Tukey honest significant difference (HSD)-testen for at sammenligne præstationsgennemsnittene. Denne undersøgelse af forskelle mellem modelydelser blev udført ved hjælp af en kombination af Python og R (version 3.5.1) [18]. Vi brugte denne (omend, uden tvivl mindre end optimal) tilgang kun som en heuristisk hjælp til dette tidlig stadie til indledende sammenligning af modelpræstationer i foregribelse af potentiel klinisk anvendelse. Vi brugte derefter Bayesian signed-rank test ved hjælp af en posterior fordeling til at bestemme sandsynligheden for modelydelsesforskelle [19]. Til disse analyser brugte vi intervallet -0.01, 0.01, hvilket betyder, at hvis to grupper havde en præstationsforskel på mindre end 0.01, blev de betragtet som de samme (inden for området for praktisk ækvivalens), eller på anden måde var de forskellige (en bedre end den anden). For at udføre den Bayesianske sammenligning af klassifikatorer og beregne disse sandsynligheder, brugte vi baycomp-biblioteket (version 1.0.2) til Python 3.6.4.

Forudsigelig modellering

Vi byggede prædiktive modeller ved at bruge de ti samlede variationer af vores modelleringsskemaer til at forudsige (klassificere) resultatet af hver patients MoCA-test eller sværhedsgraden af ​​den kliniske diagnose. Alle elever blev anvendt, og modellerne blev bygget ved hjælp af open source-softwareplatformen Weka [20]. Til vores foreløbige analyse anvendte vi 10 almindeligt anvendte læringsalgoritmer: 5-Nærmeste naboer, to versioner af C4.5 beslutningstræ, Logistisk regression, Multilayer Perceptron, Naive Bayes, to versioner af Random Forest, Radial Basis Function Network og Support Vector Maskine. Nøgleegenskaber og kontraster af disse algoritmer er blevet beskrevet andetsteds [21] (se respektive appendiks). Disse blev valgt, fordi de repræsenterer en række forskellige typer elever, og fordi vi har vist succes ved at bruge dem i tidligere analyser på lignende data. Hyper-parameterindstillinger blev valgt fra vores tidligere forskning, hvilket indikerer, at de er robuste på en række forskellige data [22]. Baseret på resultaterne af vores foreløbige analyse ved brug af det samme kombinerede datasæt med fælles funktioner, som blev brugt efterfølgende i den fulde analyse, identificerede vi tre elever, som leverede konsekvent stærk præstation på tværs af alle klassifikationer: Logistisk regression, Naiv Bayes og Support Vector Machine.

Krydsvalidering og modelpræstationsmetrik

For al prædiktiv modellering (inklusive de foreløbige analyser) blev hver model bygget ved hjælp af 10-fold krydsvalidering, og modelydelsen blev målt ved hjælp af Area Under the Receiver Operating Characteristic Curve (AUC). Krydsvalidering begyndte med tilfældig opdeling af hvert af de 10 modelleringsskemadatasæt i 10 lige store segmenter (foldninger), ved at bruge ni af disse respektive segmenter til at træne modellen og det resterende segment til test. Denne procedure blev gentaget 10 gange under anvendelse af et andet segment som testsættet i hver iteration. Resultaterne blev derefter kombineret for at beregne den endelige models resultat/performance. For hver elev/datasæt-kombination blev hele denne proces gentaget 10 gange, hvor dataene blev opdelt forskelligt hver gang. Dette sidste trin reducerede bias, sikrede replikerbarhed og hjalp med at bestemme den overordnede modelydeevne. I alt (for MoCA-score og klassifikationsskemaer for diagnose-sværhedsgrad kombineret) blev der bygget 6,600 modeller. Dette inkluderede 1,800 ufiltrerede modeller (6 modelleringsskemaer anvendt på datasættet×3 elever×10 kørsler×10 gange = 1,800 modeller) og 4,800 filtrerede modeller (4 modelleringsskemaer anvendt på datasættet×3 elever×4 funktionsudvælgelsesteknikker×10 kørsler× 10 fold = 4,800 modeller).

Valg af funktion

For de filtrerede modeller blev funktionsvalg (ved hjælp af de fire funktionsrangeringsmetoder) udført inden for krydsvalideringen. For hver af de 10 gange, da forskellige 10 % af datasættet var testdata, blev kun de fire øverste udvalgte funktioner for hvert træningsdatasæt (dvs. de andre ni folder eller de resterende 90 % af hele datasættet) brugt. at bygge modellerne. Vi var ikke i stand til at bekræfte, hvilke fire funktioner der blev brugt i hver model, da disse oplysninger ikke er gemt eller gjort tilgængelige i den modelleringsplatform, vi brugte (Weka). Men i betragtning af konsistensen i vores indledende udvælgelse af topfunktioner, når rangerne blev anvendt på hele det kombinerede datasæt og den efterfølgende lighed i modelleringspræstationer, er de samme funktioner (alder, uddannelsesår, MTx-% C og gennemsnitlig MTx-RT) ) er sandsynligvis den mest udbredte top fire, der bruges samtidig med valget af funktion inden for krydsvalideringsprocessen.

RESULTATER

Deltagerens numeriske karakteristika (herunder MoCA-score og MemTrax-performancemålinger) for de respektive datasæt for hver modelklassificeringsstrategi til at forudsige MoCA-indikeret kognitiv sundhed (normal versus MCI) og diagnose-alvorlighed (mild versus svær) er vist i tabel 3.

tabel 3

Deltagerkarakteristika, MoCA-score og MemTrax-ydelse for hver modelklassifikationsstrategi

KlassifikationsstrategiAlderUddannelseMoCA justeretMoCA UjusteretMTx-% CMTx-RT
MoCA-kategori61.9 år (13.1)9.6 år (4.6)19.2 (6.5)18.4 (6.7)74.8% (15.0)1.4 s (0.3)
Diagnose Sværhedsgrad65.6 år (12.1)8.6 år (4.4)16.7 (6.2)15.8 (6.3)68.3% (13.8)1.5 s (0.3)

De viste værdier (middelværdi, SD) differentieret ved modelleringsklassifikationsstrategier er repræsentative for det kombinerede datasæt, der bruges til at forudsige MoCA-indiceret kognitiv sundhed (MCI versus normal), og XL-underdatasættet, der kun bruges til at forudsige diagnosens sværhedsgrad (mild versus svær).

For hver kombination af MoCA-score (justeret/ujusteret) og tærskelværdi (26/23) var der en statistisk forskel (p = 0.000) i hver parvis sammenligning (normal kognitiv sundhed versus MCI) for alder, uddannelse og MemTrax-ydelse (MTx-% C og MTx-RT). Hvert patientunderdatasæt i den respektive MCI-klasse for hver kombination var i gennemsnit omkring 9 til 15 år ældre, rapporterede omkring fem færre års uddannelse og havde mindre gunstig MemTrax-ydelse for begge målinger.

Prædiktive modelleringsresultater for MoCA-scoreklassifikationerne ved hjælp af de tre bedste elever, Logistic Regression, Naive Bayes og Support Vector Machine, er vist i tabel 4. Disse tre blev valgt baseret på den mest konsekvent høje absolutte elevpræstation på tværs af alle de forskellige modeller anvendt på datasættene for alle modelleringsskemaerne. For det ufiltrerede datasæt og modellering angiver hver af dataværdierne i tabel 4 modellens ydeevne baseret på den respektive AUC-middelværdi afledt af de 100 modeller (10 kørsler × 10 gange) bygget for hver elev-/modelleringsskemakombination, med den respektive højeste udførende elev angivet med fed skrift. Hvorimod resultaterne rapporteret i tabel 4 for den filtrerede datasætmodellering afspejler den overordnede gennemsnitlige modelpræstation fra 400 modeller for hver elev ved brug af hver af funktionsrangeringsmetoderne (4 funktionsrangeringsmetoder×10 kørsler×10 gange).

tabel 4

Resultater for dikotomisk MoCA-scoreklassifikation (AUC; 0.0-1.0) for hver af de tre bedst præsterende elever for alle respektive modelleringsskemaer

Funktionssæt brugtMoCA-scoreAfskæringstærskelLogistisk regressionNaive BayesSupport Vector Machine
Ufiltreret (10 funktioner)Justeret230.88620.89130.8695
260.89710.92210.9161
Ujusteret230.91030.90850.8995
260.88340.91530.8994
Filtreret (4 funktioner)Justeret230.89290.89540.8948
260.91880.92470.9201
Ujusteret230.91350.91340.9122
260.91590.92360.9177

Ved at bruge variationer af funktionssæt, MoCA-score og MoCA-score cutoff-tærskel, vises den højeste ydeevne for hvert modelleringsskema i pin (ikke nødvendigvis statistisk anderledes end alle andre ikke i pin for den respektive model).

Ved at sammenligne eleverne på tværs af alle kombinationer af MoCA-scoreversioner og tærskler (henholdsvis justeret/ujusteret og 23/26) i det kombinerede ufiltrerede datasæt (dvs. ved at bruge de 10 fælles funktioner), var Naive Bayes generelt den bedst præsterende elev med en samlet klassificeringsydelse på 0.9093. I betragtning af de tre bedste elever indikerede de Bayesiansk-korrelerede fortegns-rangtest, at sandsynligheden (Pr) af Naive Bayes udkonkurrerede logistisk regression var 99.9 %. Desuden, mellem Naive Bayes og Support Vector Machine, en 21.0 % sandsynlighed for praktisk ækvivalens i elevens præstation (altså en 79.0 % sandsynlighed for, at Naive Bayes klarer sig bedre end Support Vector Machine), kombineret med 0.0 % sandsynlighed for, at Support Vector Machine yder bedre, målbart forstærker præstationsfordelen for Naive Bayes. Yderligere sammenligning af MoCA-scoreversionen på tværs af alle elever/tærskler antydede en lille præstationsfordel ved at bruge ujusterede MoCA-scores versus justeret (henholdsvis 0.9027 versus 0.8971; Pr (ujusteret > justeret) = 0.988). Tilsvarende indikerede en sammenligning af cutoff-tærskel på tværs af alle elever og MoCA-scoreversioner en lille klassifikationsfordel ved brug af 26 som klassificeringstærskel versus 23 (henholdsvis 0.9056 versus 0.8942; Pr (26 > 23) = 0.999). Til sidst, ved at undersøge klassifikationsydelsen for modellerne, der kun bruger de filtrerede resultater (dvs. kun toprangerede fire funktioner), var Naive Bayes (0.9143) numerisk den bedst præsterende elev på tværs af alle MoCA-scoreversioner/tærskler. Men på tværs af alle funktionsrangeringsteknikker kombineret præsterede alle de bedst præsterende elever på samme måde. Bayesianske fortegnstests viste 100 % sandsynlighed for praktisk ækvivalens mellem hvert par filtrerede elever. Som med de ufiltrerede data (ved at bruge alle 10 almindelige funktioner), var der igen en præstationsfordel for den ujusterede version af MoCA-score (Pr (ujusteret > justeret) = 1.000), samt en tilsvarende distinkt fordel for klassificeringstærsklen på 26 (Pr (26 > 23) = 1.000). Det er bemærkelsesværdigt, at den gennemsnitlige præstation for hver af de tre bedste elever på tværs af alle MoCA-scoreversioner/tærskelværdier ved brug af kun de fire toprangerede funktioner oversteg den gennemsnitlige præstation for enhver elev på de ufiltrerede data. Ikke overraskende var klassificeringsydelsen for de filtrerede modeller (ved brug af de fire toprangerede funktioner) samlet set overlegen (0.9119) i forhold til de ufiltrerede modeller (0.8999), uanset funktionsrangeringsmetodemodellerne, der blev sammenlignet med de respektive modeller, der brugte alle 10 almindelige funktioner. For hver funktionsvalgmetode var der 100 % sandsynlighed for en ydeevnefordel i forhold til de ufiltrerede modeller.

Med de patienter, der overvejes til AD-diagnose-sværhedsklassificering, er forskelle mellem grupper (MCI-AD versus AD) for alder (p = 0.004), uddannelse (p = 0.028), MoCA-score justeret/ujusteret (p = 0.000), og MTx-% C (p = 0.008) var statistisk signifikante; hvorimod det for MTx-RT ikke var (p = 0.097). Med de patienter, der overvejes til klassificering af VaD-diagnose, er forskelle mellem grupper (MCI-VaD versus VaD) for MoCA-score justeret/ujusteret (p = 0.007) og MTx-% C (p = 0.026) og MTx-RT (p = 0.001) var statistisk signifikante; hvorimod for alder (p = 0.511) og uddannelse (p = 0.157) var der ingen signifikante forskelle mellem grupper.

Prædiktive modelleringsresultater for diagnose-sværhedsgradsklassifikationerne ved hjælp af de tre tidligere udvalgte elever, Logistic Regression, Naive Bayes og Support Vector Machine, er vist i tabel 5. Hvorimod yderligere undersøgte elever demonstrerede lidt stærkere præstationer individuelt med en af ​​de to kliniske diagnosekategorier , de tre elever, vi havde identificeret som de mest favorable i vores tidligere modellering, tilbød den mest konsistente præstation med begge nye modelleringsskemaer. Ved at sammenligne eleverne på tværs af hver af de primære diagnosekategorier (AD og VaD), var der ingen konsekvent forskel i klassifikationspræstation mellem elever for MCI-VaD versus VaD, selvom Support Vector Machine generelt præsterede mere fremtrædende. Tilsvarende var der ingen signifikante forskelle mellem elever for MCI-AD versus AD klassifikationen, selvom Naive Bayes (NB) havde en lille præstationsfordel i forhold til Logistic Regression (LR) og kun en ubetydelig flerhed i forhold til Support Vector Machine, med sandsynligheder på 61.4 % og 41.7 pct. På tværs af begge datasæt var der en generel ydeevnefordel for Support Vector Machine (SVM), med Pr (SVM > LR) = 0.819 og Pr (SVM > NB) = 0.934. Vores overordnede klassifikationspræstation på tværs af alle elever med hensyn til at forudsige sværhedsgraden af ​​diagnosen i XL-underdatasættet var bedre i VaD-diagnosekategorien versus AD (Pr (VAD > AD) = 0.998).

tabel 5

Resultater for dikotomisk klinisk diagnose, sværhedsgradsklassificering (AUC; 0.0-1.0) for hver af de tre bedst præsterende elever for begge respektive modelleringsskemaer

ModelleringsskemaLogistisk regressionNaive BayesSupport Vector Machine
MCI-AD versus AD0.74650.78100.7443
MCI-VaD versus VaD0.80330.80440.8338

Den højeste ydeevne for hvert modelleringsskema er vist i pin (ikke nødvendigvis statistisk anderledes end andre ikke i pin).

DISKUSSION

Tidlig opdagelse af ændringer i kognitiv sundhed er vigtig praktisk nytte i både personlig sundhedsstyring og folkesundhed. Det er faktisk også meget højt prioriteret i kliniske omgivelser for patienter verden over. Det fælles mål er at advare patienter, plejere og udbydere og tilskynde tidligere passende og omkostningseffektiv behandling og langsgående pleje for dem, der begynder at opleve kognitiv tilbagegang. Ved at fusionere vores tre hospitals-/klinikdata-undersæt identificerede vi tre klart foretrukne elever (med én bemærkelsesværdig fremtrædende – Naive Bayes) til at bygge prædiktive modeller ved at bruge MemTrax præstationsmålinger, der pålideligt kunne klassificere kognitiv sundhedsstatus dikotomisk (normal kognitiv sundhed eller MCI), som ville blive indikeret af en MoCA aggregeret score. Det er bemærkelsesværdigt, at den overordnede klassifikationspræstation for alle tre elever blev forbedret, da vores modeller kun brugte de fire toprangerede funktioner, som hovedsageligt omfattede disse MemTrax-præstationsmålinger. Desuden afslørede vi det underbyggede potentiale for at bruge de samme elever og MemTrax præstationsmålinger i en diagnostisk støtteklassifikationsmodellering for at skelne sværhedsgraden af ​​to kategorier af demensdiagnose: AD og VaD.

Hukommelsestest er central for tidlig påvisning af AD [23, 24]. Det er således opportunt, at MemTrax er en acceptabel, engagerende og nem at implementere online screeningstest for episodisk hukommelse i den almindelige befolkning [6]. Genkendelsesnøjagtighed og responstider fra denne kontinuerlige præstationsopgave er særligt afslørende ved identifikation af tidlig og udviklende forringelse og deraf følgende mangler i de neuroplastiske processer relateret til indlæring, hukommelse og kognition. Det vil sige, at modellerne her, der i vid udstrækning er baseret på MemTrax-præstationsmålinger, er følsomme over for og er mere tilbøjelige til at afsløre biologiske neuropatologiske mangler i løbet af det asymptomatiske overgangsstadie i god tid før mere væsentligt funktionelt tab [25]. Ashford et al. undersøgte nøje mønstrene og adfærden for genkendelseshukommelses nøjagtighed og responstid hos onlinebrugere, der deltog på egen hånd med MemTrax [6]. Med respekt for, at disse fordelinger er afgørende for optimal modellering og udvikling af valide og effektive patientplejeapplikationer, er det afgørende at definere klinisk anvendelige anerkendelses- og responstidsprofiler for at etablere en værdifuld grundlæggende reference for klinisk og forskningsmæssig nytte. Den praktiske værdi af MemTrax i AD-screening for tidlig kognitiv svækkelse og differentialdiagnostisk støtte skal derefter undersøges nærmere i sammenhæng med en klinisk indstilling, hvor komorbiditeter og kognitive, sensoriske og motoriske evner, der påvirker testpræstationer, kan overvejes. Og for at informere professionelt perspektiv og tilskynde til praktisk klinisk nytte, er det først bydende nødvendigt at demonstrere sammenligning med en etableret kognitiv helbredsvurderingstest, selvom sidstnævnte kan være genkendeligt begrænset af besværlig testlogistik, uddannelse og sproglige afskrækkende midler og kulturelle påvirkninger [26] . I denne henseende er den gunstige sammenligning af MemTrax i klinisk effekt med MoCA, der almindeligvis påstås som en industristandard, væsentlig, især når man afvejer den større brugervenlighed og patientens accept af MemTrax.

Tidligere udforskning, der sammenligner MemTrax med MoCA, fremhæver begrundelsen og de foreløbige beviser, der berettiger vores modelleringsundersøgelse [8]. Denne tidligere sammenligning associerede imidlertid blot de to nøgle MemTrax-præstationsmålinger, vi undersøgte, med kognitiv status som bestemt af MoCA og definerede respektive intervaller og cutoff-værdier. Vi uddybede den kliniske nyttevurdering af MemTrax ved at udforske en prædiktiv modelleringsbaseret tilgang, der ville give en mere individualiseret overvejelse af andre potentielt relevante patientspecifikke parametre. I modsætning til andre fandt vi ikke en fordel i modelpræstationer ved at bruge en uddannelseskorrektion (justering) til MoCA-scoren eller ved at variere den kognitive sundhedsdiskriminerende MoCA-scoretærskel fra den oprindeligt anbefalede 26 til 23 [12, 15]. Faktisk favoriserede klassifikationsfordelen at bruge den ujusterede MoCA-score og den højere tærskel.

Nøglepunkter i klinisk praksis

Maskinlæring er ofte bedst udnyttet og mest effektiv i prædiktiv modellering, når dataene er omfattende og multidimensionelle, det vil sige, når der er talrige observationer og en samtidig bred vifte af højværdi (medvirkende) attributter. Men med disse nuværende data klarede de filtrerede modeller med kun fire udvalgte funktioner bedre end dem, der brugte alle 10 almindelige funktioner. Dette tyder på, at vores samlede hospitalsdatasæt ikke havde de mest klinisk passende (høj værdi) funktioner til optimalt at klassificere patienterne på denne måde. Ikke desto mindre understøtter den funktionsplacering, der lægger vægt på de vigtigste MemTrax-ydeevnemålinger - MTx-% C og MTx-RT - kraftigt op om, at man bygger tidlige stadier af kognitive deficitscreeningsmodeller omkring denne test, som er enkel, nem at administrere, billig og passende afslørende mht. hukommelsesydelse, i det mindste lige nu som en indledende skærm for en binær klassifikation af kognitiv sundhedsstatus. I betragtning af den stadigt stigende belastning af udbydere og sundhedssystemer, bør patientscreeningsprocesser og kliniske applikationer udvikles passende med vægt på indsamling, sporing og modellering af de patientkarakteristika og testmålinger, der er mest nyttige, fordelagtige og bevist effektive til diagnostik. og patienthåndteringsstøtte.

Da de to nøgle MemTrax-metrikker er centrale i MCI-klassificeringen, havde vores bedst præsterende elev (Nive Bayes) en meget høj prædiktiv ydeevne i de fleste modeller (AUC over 0.90) med et sand-positivt til falsk-positivt forhold, der nærmede sig eller noget oversteg 4 : 1. En translationel klinisk applikation ved hjælp af denne lærende ville således fange (korrekt klassificere) langt de fleste af dem med et kognitivt underskud, samtidig med at det minimerer omkostningerne forbundet med fejlagtigt at klassificere en person med normal kognitiv sundhed som havende et kognitivt underskud (falsk positiv) eller mangler den klassifikation hos dem, der har et kognitivt underskud (falsk negativ). Et af disse scenarier med fejlklassificering kan pålægge patienten og pårørende en unødig psykosocial byrde.

Mens vi i de foreløbige og fulde analyser brugte alle ti elever i hvert modelleringsskema, fokuserede vi vores resultater på de tre klassifikatorer, der viste den mest konsistente stærke præstation. Dette var også for at fremhæve, baseret på disse data, de lærende, der forventes at præstere pålideligt på et højt niveau i en praktisk klinisk anvendelse til at bestemme kognitiv statusklassificering. Desuden, fordi denne undersøgelse var tænkt som en indledende undersøgelse af nytten af ​​maskinlæring på kognitiv screening og disse rettidige kliniske udfordringer, tog vi beslutningen om at holde læringsteknikkerne enkle og generaliserede med minimal parameterjustering. Vi forstår, at denne tilgang kan have begrænset potentialet for mere snævert definerede patientspecifikke forudsigelsesevner. På samme måde, mens træning af modellerne ved hjælp af kun de bedste funktioner (filtreret tilgang) informerer os yderligere om disse data (specifikke for manglerne i de indsamlede data og fremhæver værdien i at optimere dyrebar klinisk tid og ressourcer), erkender vi, at det er for tidligt at indsnævre omfanget af modellerne og derfor alle (og andre funktioner) bør overvejes med fremtidig forskning, indtil vi har en mere definitiv profil af prioriterede funktioner, der ville være anvendelige for den brede befolkning. Således anerkender vi også fuldt ud, at mere inkluderende og bredt repræsentative data og optimering af disse og andre modeller ville være nødvendige, før de integreres i en effektiv klinisk applikation, især for at imødekomme komorbiditeter, der påvirker kognitiv ydeevne, som ville skulle overvejes i yderligere klinisk evaluering.

MemTrax' nytte blev yderligere opbygget ved modellering af sygdommens sværhedsgrad baseret på separat klinisk diagnose. En bedre generel klassifikationspræstation til forudsigelse af sværhedsgraden af ​​VaD (sammenlignet med AD) var ikke overraskende i betragtning af patientprofilens træk i modellerne, der er specifikke for vaskulær sundhed og slagtilfælderisiko, dvs. hypertension, hyperlipidæmi, diabetes og (naturligvis) slagtilfældehistorie. Selvom det ville have været mere ønskeligt og passende at få udført den samme kliniske vurdering på matchede patienter med normal kognitiv sundhed for at træne eleverne med disse mere inkluderende data. Dette er især berettiget, da MemTrax er beregnet til primært at blive brugt til tidlige stadier af opdagelse af et kognitivt underskud og efterfølgende sporing af individuelle ændringer. Det er også sandsynligt, at den mere ønskelige fordeling af data i VaD-datasættet delvist bidrog til den forholdsvis bedre modelleringsydeevne. VaD-datasættet var velafbalanceret mellem de to klasser, hvorimod AD-datasættet med langt færre MCI-patienter ikke var det. Især i små datasæt kan selv nogle få ekstra tilfælde gøre en målbar forskel. Begge perspektiver er rimelige argumenter, der ligger til grund for forskellene i sygdomssværhedsmodellering. At forholdsmæssigt tilskrive forbedret ydeevne til datasættets numeriske karakteristika eller de iboende egenskaber, der er specifikke for den kliniske præsentation, der overvejes, er imidlertid for tidligt. Ikke desto mindre, denne roman demonstrerede anvendeligheden af ​​en MemTrax prædiktiv klassifikationsmodel i rollen som klinisk diagnostisk støtte giver et værdifuldt perspektiv og bekræfter jagten på yderligere undersøgelse med patienter på tværs af kontinuummet af MCI.

Implementeringen og demonstrerede nytteværdi af MemTrax og disse modeller i Kina, hvor sproget og kulturen er drastisk forskellig fra andre regioner med etableret nytte (f.eks. Frankrig, Holland og USA) [7, 8, 27], understreger yderligere potentialet for udbredt global accept og klinisk værdi af en MemTrax-baseret platform. Dette er et påviselig eksempel på at bestræbe sig på at harmonisere data og udvikle praktiske internationale normer og modelleringsressourcer til kognitiv screening, som er standardiserede og let tilpassede til brug i hele verden.

Næste trin i modellering og anvendelse af kognitiv tilbagegang

Kognitiv dysfunktion i AD forekommer faktisk på et kontinuum, ikke i diskrete stadier eller trin [28, 29]. Men i denne tidlige fase var vores mål først at etablere vores evne til at bygge en model, der inkorporerer MemTrax, der grundlæggende kan skelne "normalt" fra "ikke normalt". Mere inkluderende empiriske data (f.eks. hjernebilleddannelse, genetiske træk, biomarkører, komorbiditeter og funktionelle markører for komplekse aktiviteter, der kræver kognitive kontrol) [30] på tværs af forskellige globale regioner, befolkninger og aldersgrupper for at træne og udvikle mere sofistikerede (herunder passende vægtede ensemble) maskinlæringsmodeller vil understøtte en større grad af forbedret klassificering, dvs. evnen til at kategorisere grupper af patienter med MCI i mindre og mere definitive undergrupper langs det kognitive tilbagegang kontinuum. Desuden er samtidige kliniske diagnoser for individer på tværs af regionalt forskelligartede patientpopulationer afgørende for effektivt træne disse mere inkluderende og forudsigeligt robuste modeller. Dette vil lette mere specifik stratificeret sagsbehandling for dem med lignende baggrunde, påvirkninger og mere snævert definerede karakteristiske kognitive profiler og dermed optimere den kliniske beslutningsstøtte og patientbehandling.

Meget af den relevante kliniske forskning til dato har rettet sig mod patienter med mindst mild demens; og i praksis forsøges patientindgreb for ofte kun på fremskredne stadier. Men fordi kognitiv tilbagegang begynder længe før de kliniske kriterier for demens er opfyldt, kan en effektivt anvendt MemTrax-baseret tidlig screening tilskynde til passende uddannelse af individer om sygdommen og dens progression og tilskynde til tidligere og mere rettidige interventioner. Tidlig påvisning kunne således understøtte passende involveringer lige fra motion, kost, følelsesmæssig støtte og forbedret socialisering til farmakologisk intervention og forstærke patientrelaterede ændringer i adfærd og opfattelse, som enkeltvis eller samlet kunne afbøde eller potentielt stoppe demensprogression [31, 32] . Desuden med effektive tidlig screening, kan enkeltpersoner og deres familier blive bedt om at overveje kliniske forsøg eller få rådgivning og anden social servicestøtte for at hjælpe med at afklare forventninger og hensigter og håndtere daglige opgaver. Yderligere validering og udbredt praktisk anvendelighed på disse måder kan være medvirkende til at afbøde eller stoppe progressionen af ​​MCI, AD og ADRD for mange individer.

Faktisk repræsenterer den lave ende af patientaldersintervallet i vores undersøgelse ikke populationen af ​​traditionel bekymring med AD. Ikke desto mindre understreger gennemsnitsalderen for hver gruppe anvendt i klassifikationsmodelleringsskemaerne baseret på MoCA-score/tærskel og diagnose-sværhedsgrad (tabel 3), at et klart flertal (over 80%) er mindst 50 år gammel. Denne fordeling er derfor meget velegnet til generalisering, hvilket understøtter anvendeligheden af ​​disse modeller i befolkningen, der karakteriserer dem, der typisk er ramt af tidlig indtræden og spirende neurokognitiv sygdom på grund af AD og VaD. Nye beviser og perspektiv understreger også de anerkendte faktorer (f.eks. hypertension, fedme, diabetes og rygning), der potentielt bidrager til højere tidlige vaskulær risikoscore for voksne og midt i livet og deraf følgende subtil vaskulær hjerneskade, der udvikler sig snigende med tydelige virkninger selv hos unge voksne [33-35]. Derfor er den mest optimale initiale screeningsmulighed for tidlig opdagelse stadie kognitive underskud og initiering af effektive forebyggelses- og interventionsstrategier til succesfuld behandling af demens vil fremkomme ved at undersøge medvirkende faktorer og forudgående indikatorer på tværs af aldersspektret, herunder tidlig voksenalder og potentielt endda barndom (bemærk relevansen af ​​genetiske faktorer såsom apolipoprotein E fra tidlig graviditet).

I praksis er valide kliniske diagnoser og dyre procedurer til avanceret billeddannelse, genetisk profilering og måling af lovende biomarkører ikke altid let tilgængelige eller endda gennemførlige for mange udbydere. I mange tilfælde kan den indledende overordnede kognitive sundhedsstatusklassificering muligvis udledes af modeller, der bruger andre simple metrikker, som patienten har leveret (f.eks. selvrapporteret hukommelsesproblemer, nuværende medicin og rutinemæssige aktivitetsbegrænsninger) og almindelige demografiske træk [7]. Registre såsom University of California Brain Sundhed Registry (https://www.brainhealthregistry.org/) [27] og andre med en iboende større bredde af selvrapporterede symptomer, kvalitative mål (f.eks. søvn og hverdagserkendelse), medicin, helbredsstatus og historie, og mere detaljeret demografi vil være medvirkende til at udvikle og validere den praktiske anvendelse af disse mere primitive modeller i klinikken. Yderligere kan en test som MemTrax, som har vist nytte til at vurdere hukommelsesfunktion, faktisk give et væsentligt bedre estimat af AD-patologi end biologiske markører. I betragtning af, at kerneegenskaben ved AD-patologi er forstyrrelse af neuroplasticitet og et overvældende komplekst tab af synapser, hvilket viser sig som episodisk hukommelsesdysfunktion, kan et mål, der vurderer episodisk hukommelse faktisk giver et bedre estimat af AD patologisk byrde end biologiske markører hos den levende patient [36].

Med alle prædiktive modeller – uanset om de er suppleret med komplekse og inkluderende data fra den nyeste teknologi og raffineret klinisk indsigt på tværs af flere domæner eller dem, der er begrænset til mere grundlæggende og let tilgængelig information, der er karakteristisk for eksisterende patientprofiler – den anerkendte fordel ved kunstig intelligens og maskinlæring er, at de resulterende modeller kan syntetisere og induktivt "lære" fra relevante nye data og perspektiv leveret af løbende applikationsudnyttelse. Efter praktisk teknologioverførsel, efterhånden som modellerne her (og skal udvikles) anvendes og beriges med flere tilfælde og relevante data (inklusive patienter med komorbiditeter, der kunne optræde med efterfølgende kognitiv tilbagegang), vil forudsigelsespræstation og kognitiv sundhedsklassificering være mere robust, resulterer i mere effektiv klinisk beslutningsstøttefunktion. Denne udvikling vil blive mere fuldstændig og praktisk realiseret med indlejring af MemTrax i brugerdefinerede (målrettet til de tilgængelige kapaciteter) platforme, som sundhedsudbydere kan bruge i realtid i klinikken.

Af afgørende betydning for valideringen og anvendeligheden af ​​MemTrax-modellen til diagnostisk støtte og patientpleje er meget efterspurgte meningsfulde longitudinelle data. Ved at observere og registrere de samtidige ændringer (hvis nogen) i klinisk status på tværs af et tilstrækkeligt interval af normal til tidligt stadie af MCI, kan modellerne for passende løbende vurdering og klassificering trænes og modificeres, efterhånden som patienterne bliver ældre og behandles. Det vil sige, at gentagen brug kan hjælpe med longitudinel sporing af milde kognitive ændringer, interventionseffektivitet og opretholdelse af informeret stratificeret pleje. Denne tilgang er tættere på linje med klinisk praksis og patient- og sagsbehandling.

Begrænsninger

Vi værdsætter udfordringen og værdien i at indsamle rene kliniske data i et kontrolleret klinik-/hospitalmiljø. Ikke desto mindre ville det have styrket vores modellering, hvis vores datasæt inkluderede flere patienter med fælles træk. Specifikt for vores diagnosemodellering ville det desuden have været mere ønskeligt og passende at få den samme kliniske vurdering udført på matchede patienter med normal kognitiv sundhed for at træne eleverne. Og som understreget af den højere klassificeringsydelse ved brug af det filtrerede datasæt (kun de fire toprangerede funktioner), mere generelle og kognitive sundhedsmål/indikatorer ville sandsynligvis være blevet forbedret modelleringsydelse med et større antal fællestræk på tværs af alle patienter.

Visse deltagere kan samtidig have oplevet andre sygdomme, der kunne have forårsaget forbigående eller kroniske kognitive mangler. Ud over XL-underdatasættet, hvor patienterne blev diagnostisk klassificeret som havende enten AD eller VaD, blev komorbiditetsdata ikke indsamlet/rapporteret i YH-patientpuljen, og den overvejende rapporterede komorbiditet i KM-underdatasættet var diabetes. Det kan imidlertid argumenteres for, at at inkludere patienter i vores modelleringsskemaer med komorbiditeter, der kan fremkalde eller forværre et niveau af kognitiv defekt og en deraf følgende lavere MemTrax-ydelse, ville være mere repræsentativ for den virkelige verden målrettede patientpopulation for denne mere generaliserede tidlige kognitive screening og modelleringstilgang. Fremadrettet er nøjagtig diagnose af komorbiditeter, der potentielt påvirker kognitiv ydeevne, stort set gavnlig for optimering af modellerne og deraf følgende patientbehandlingsapplikationer.

Endelig brugte YH- og KM-subdatasætpatienterne en smartphone til at tage MemTrax-testen, hvorimod et begrænset antal af XL-subdatasætpatienterne brugte en iPad, og resten brugte en smartphone. Dette kunne have introduceret en mindre enhedsrelateret forskel i MemTrax-ydeevne for MoCA-klassifikationsmodelleringen. Forskelle (hvis nogen) i MTx-RT, for eksempel, mellem enheder vil dog sandsynligvis være ubetydelige, især når hver deltager får en "øve"-test lige før den registrerede testydelse. Ikke desto mindre kompromitterer brugen af ​​disse to håndholdte enheder potentielt direkte sammenligning med og/eller integration med andre MemTrax-resultater, hvor brugere reagerede på gentagne billeder ved at trykke på mellemrumstasten på et computertastatur.

Nøglepunkter om MemTrax prædiktiv modelleringsværktøj

  • • Vores bedste prædiktive modeller, der omfatter udvalgte MemTrax-præstationsmålinger, kunne pålideligt klassificere kognitiv sundhedsstatus (normal kognitiv sundhed eller MCI), som det ville blive indikeret af den bredt anerkendte MoCA-test.
  • • Disse resultater understøtter integration af udvalgte MemTrax præstationsmålinger i en klassificeringsprædiktiv modelscreeningapplikation for kognitiv svækkelse i tidlige stadier.
  • • Vores klassifikationsmodellering afslørede også potentialet for at udnytte MemTrax-ydelse i applikationer til at skelne sværhedsgraden af ​​demensdiagnose.

Disse nye resultater etablerer endegyldige beviser, der understøtter anvendeligheden af ​​maskinlæring til at opbygge forbedrede robuste MemTrax-baserede klassifikationsmodeller til diagnostisk støtte i effektiv klinisk sagsbehandling og patientpleje for personer, der oplever kognitiv svækkelse.

TAK

Vi anerkender J. Wesson Ashfords, Curtis B. Ashfords og kollegers arbejde med at udvikle og validere den online kontinuerlige anerkendelsesopgave og værktøj (MemTrax), der bruges her, og vi er taknemmelige for de talrige patienter med demens, som har bidraget til den kritiske grundlæggende forskning . Vi takker også Xianbo Zhou og hans kolleger hos SJN Biomed LTD, hans kolleger og samarbejdspartnere på hospitalerne/klinikkerne, især Dr. M. Luo og M. Zhong, som hjalp med rekruttering af deltagere, planlægning af tests og indsamling, registrering og front-end-styring af dataene, og de frivillige deltagere, der donerede deres værdifulde tid og forpligtede sig til at tage testene og levere de værdifulde data for os at evaluere i denne undersøgelse. Dette undersøgelsen blev delvist støttet af MD Scientific Research Program for Kunming Medical University (tilskud nr. 2017BS028 til XL) og forskningsprogrammet for Yunnan Science and Technology Department (tilskud nr. 2019FE001 (-222) til XL).

J. Wesson Ashford har indgivet en patentansøgning for brugen af ​​det specifikke kontinuerlige anerkendelsesparadigme, der er beskrevet i dette papir for generel test af hukommelse.

MemTrax, LLC er et selskab ejet af Curtis Ashford, og dette selskab administrerer hukommelsestest system beskrevet i denne artikel.

Forfatternes afsløringer tilgængelige online (https://www.j-alz.com/manuscript-disclosures/19-1340r2).

hukommelsestest demens test hukommelsestab test korttidshukommelsestab test ram test sindet kost forskellige bøger kognitiv test online
Curtis Ashford – Kognitiv forskningskoordinator

REFERENCER

[1] Alzheimers Association (2016) 2016 Fakta om Alzheimers sygdom og figurer. Alzheimers Dement 12, 459-509.
[2] Gresenz CR , Mitchell JM , Marrone J , Federoff HJ (2019) Effekt af tidligt stadie Alzheimers sygdom på husholdningernes økonomiske resultater. Sundhedsøkonomi 29, 18–29.
[3] Foster NL , Bondi MW , Das R , Foss M , Hershey LA , Koh S , Logan R , Poole C , Shega JW , Sood A , Thothala N , Wicklund M , Yu M , Bennett A , Wang D (2019) Kvalitetsforbedring i neurologi: Mild kognitiv svækkelse kvalitetsmålesæt. Neurology 93, 705-713.
[4] Tong T , Thokala P , McMillan B , Ghosh R , Brazier J (2017) Omkostningseffektivitet ved at bruge kognitive screeningstests til påvisning af demens og lettere kognitiv svækkelse i primærplejen. Int J Geriatr Psychiatry 32, 1392–1400.
[5] Ashford JW, Gere E, Bayley PJ (2011) Måler hukommelse i store grupper ved hjælp af en kontinuerlig genkendelsestest. J Alzheimers Dis 27, 885-895.
[6] Ashford JW, Tarpin-Bernard F, Ashford CB, Ashford MT (2019) En computeriseret kontinuerlig genkendelsesopgave til måling af episodisk hukommelse. J Alzheimers Dis 69, 385-399.
[7] Bergeron MF, Landset S, Tarpin-Bernard F, Ashford CB, Khoshgoftaar TM, Ashford JW (2019) Episodisk hukommelsespræstation i maskinlæringsmodellering til forudsigelse af kognitiv sundhedsstatusklassificering. J Alzheimers Dis 70, 277-286.
[8] van der Hoek MD , Nieuwenhuizen A , Keijer J , Ashford JW (2019) The MemTrax test sammenlignet med Montreal kognitive vurdering estimering af mild kognitiv svækkelse. J Alzheimers Dis 67, 1045-1054.
[9] Falcone M, Yadav N, Poellabauer C, Flynn P (2013) Brug af isolerede vokallyde til klassificering af mild traumatisk hjerneskade. I 2013 IEEE International Conference on Acoustics, Speech and Signal Processing, Vancouver, BC, s. 7577–7581.
[10] Dabek F, Caban JJ (2015) Udnyttelse af big data til at modellere sandsynligheden for at udvikle psykologiske tilstande efter en hjernerystelse. Procedia Comput Sci 53, 265-273.
[11] Climent MT, Pardo J, Munoz-Almaraz FJ, Guerrero MD, Moreno L (2018) Beslutningstræ til tidlig påvisning af kognitiv svækkelse af lokale farmaceuter. Front Pharmacol 9, 1232.
[12] Nasreddine ZS, Phillips NA, Bedirian V, Charbonneau S, Whitehead V, Collin I, Cummings JL, Chertkow H (2005) The Montreal Cognitive Assessment, MoCA: Et kort screeningsværktøj til mild kognitiv svækkelse. J Am Geriatr Soc 53, 695-699.
[13] Yu J, Li J, Huang X (2012) Beijing-versionen af ​​den kognitive vurdering i Montreal som et kort screeningsværktøj for mild kognitiv svækkelse: En samfundsbaseret undersøgelse. BMC Psychiatry 12, 156.
[14] Chen KL, Xu Y, Chu AQ, Ding D, Liang XN, Nasreddine ZS, Dong Q, Hong Z, Zhao QH, Guo QH (2016) Validering af den kinesiske version af Montreal kognitiv vurdering grundlæggende til screening af mild kognitiv svækkelse. J Am Geriatr Soc 64, e285–e290.
[15] Carson N, Leach L, Murphy KJ (2018) En genundersøgelse af Montreal Cognitive Assessment (MoCA) cutoff-score. Int J Geriatr Psychiatry 33, 379–388.
[16] American Psychiatric Association (2013) Task Force Diagnostisk og statistisk manual for psykiske lidelser: DSM-5™, American Psychiatric Publishing, Inc., Washington, DC.
[17] Python. Python Software Foundation, http://www.python.org, Tilgået 15. november 2019.
[18] R Core Group, R: Et sprog og miljø for statistisk databehandling R Foundation for Statistical Computing, Wien, Østrig. https://www.R-project.org/, 2018, Tilgået 15. november 2019.
[19] Benavoli A , Corani G , Demšar J , Zaffalon M (2017) Tid til en forandring: En tutorial til at sammenligne flere klassifikatorer gennem Bayesiansk analyse. J Mach Learn Res 18, 1-36.
[20] Frank E , Hall MA , Witten IH (2016) WEKA Workbench. I Data Mining: Praktiske maskinlæringsværktøjer og -teknikker, Frank E, Hall MA, Witten IH, Pal CJ, red. Morgan Kaufmann https://www.cs.waikato.ac.nz/ml/weka/Witten_et_al_2016_appendix.pdf
[21] Bergeron MF , Landset S , Maugans TA , Williams VB , Collins CL , Wasserman EB , Khoshgoftaar TM (2019) Maskinlæring i modellering af hjernerystelse i gymnasiet i gymnasiet. Med Sci Sports Exerc 51, 1362–1371.
[22] Van Hulse J, Khoshgoftaar TM, Napolitano A (2007) Eksperimentelle perspektiver på læring fra ubalancerede data. I Proceedings of the 24th International Conference on Machine Learning, Corvalis, Oregon, USA, s. 935-942.
[23] Ashford JW, Kolm P, Colliver JA, Bekian C, Hsu LN (1989) Alzheimer patient evaluation and the mini-mental state: Item characteristic curve analysis.P. J Gerontol 44, 139-146.
[24] Ashford JW, Jarvik L (1985) Alzheimers sygdom: Predisponerer neurons plasticitet for axonal neurofibrillær degeneration? N Engl J Med 313, 388-389.
[25] Jack CR Jr , Therneau TM , Weigand SD , ​​Wiste HJ , Knopman DS , Vemuri P , Lowe VJ , Mielke MM , Roberts RO , Machulda MM , Graff-Radford J , Jones DT , Schwarz CG , Gunter JL , , Rocca WA, Petersen RC (2019) Forekomst af biologisk vs klinisk definerede Alzheimer-spektrumenheder ved hjælp af National Institute on Aging-Alzheimer's Foreningsforskning rammer. JAMA Neurol 76, 1174-1183.
[26] Zhou X, Ashford JW (2019) Fremskridt inden for screeningsinstrumenter til Alzheimers sygdom. Aldring Med 2, 88–93.
[27] Weiner MW , Nosheny R , Camacho M , Truran-Sacrey D , Mackin RS , Flenniken D , Ulbricht A , Insel P , Finley S , Fockler J , Veitch D (2018) Brain Sundhed Registry: En internetbaseret platform til rekruttering, vurdering og longitudinel overvågning af deltagere til neurovidenskabelige studier. Alzheimers Dement 14, 1063-1076.
[28] Ashford JW, Schmitt FA (2001) Modellering af tidsforløbet for Alzheimers demens. Curr Psychiatry Rep 3, 20-28.
[29] Li X , Wang X , Su L , Hu X , Han Y (2019) Sino Longitudinal Study on Cognitive Decline (SILCODE): Protokol for en kinesisk longitudinel observationsundersøgelse til udvikling af risikoforudsigelsesmodeller for konvertering til mild kognitiv svækkelse hos individer med subjektiv kognitiv funktion. nedgang. BMJ Open 9, e028188.
[30] Tarnanas I , Tsolaki A , Wiederhold M , Wiederhold B , Tsolaki M (2015) Femårig biomarkørprogressionsvariabilitet for Alzheimers sygdom demens forudsigelse: Kan en kompleks instrumental aktivitet i hverdagen udfylde hullerne? Alzheimers Dement (Amst) 1, 521-532.
[31] McGurran H , Glenn JM , Madero EN , Bott NT (2019) Forebyggelse og behandling af Alzheimers sygdom: Biologiske mekanismer ved træning. J Alzheimers Dis 69, 311-338.
[32] Mendiola-Precoma J , Berumen LC , Padilla K , Garcia-Alcocer G (2016) Therapies for forebyggelse og behandling af Alzheimers sygdom. Biomed Res Int 2016, 2589276.
[33] Lane CA, Barnes J, Nicholas JM, Sudre CH, Cash DM, Malone IB, Parker TD, Keshavan A, Buchanan SM, Keuss SE, James SN, Lu K, Murray-Smith H, Wong A, Gordon E, Coath W, Modat M, Thomas D, Richards M, Fox NC, Schott JM (2020) Forbindelser mellem vaskulær risiko på tværs af voksenalderen og hjernepatologi i det sene liv: Evidens fra en britisk fødselskohorte. JAMA Neurol 77, 175-183.
[34] Seshadri S (2020) Forebyggelse af demenstænkning ud over alderen og amyloidbokse. JAMA Neurol 77, 160-161.
[35] Maillard P, Seshadri S, Beiser A, Himali JJ, Au R, Fletcher E, Carmichael O, Wolf PA, DeCarli C (2012) Effekter af systolisk blodtryk på hvidstofintegritet hos unge voksne i Framingham Heart Study: A cross -sektionsstudie. Lancet Neurol 11, 1039-1047.
[36] Fink HA, Linskens EJ, Silverman PC, McCarten JR, Hemmy LS, Ouellette JM, Greer NL, Wilt TJ, Butler M (2020) Nøjagtighed af biomarkørtest for neuropatologisk defineret Alzheimers sygdom hos ældre voksne med demens. Ann Intern Med 172, 669–677.

Tilknytninger: [a] SIVOTEC Analytics, Boca Raton, FL, USA | [b] Department of Computer and Electrical Engineering and Computer Science, Florida Atlantic University, Boca Raton, FL, USA | [c] SJN Biomed LTD, Kunming, Yunnan, Kina | [d] Center for Alzheimers forskning, Washington Institute of Clinical Research, Washington, DC, USA | [e] Department of Rehabilitation Medicine, Kunming Medical Universitys første tilknyttede hospital, Kunming, Yunnan, Kina | [f] Neurologisk afdeling, Dehong People's Hospital, Dehong, Yunnan, Kina | [g] Neurologisk afdeling, det første tilknyttede hospital ved Kunming Medical University, Wuhua-distriktet, Kunming, Yunnan-provinsen, Kina | [h] War-Related Illness and Injury Study Center, VA Palo Alto Health Care System, Palo Alto, CA, USA | [i] Department of Psychiatry & Behavioral Sciences, Stanford University School of Medicine, Palo Alto, CA, USA

Korrespondance: [*] Korrespondance til: Michael F. Bergeron, PhD, FACSM, SIVOTEC Analytics, Boca Raton Innovation Campus, 4800 T-Rex Avenue, Suite 315, Boca Raton, FL 33431, USA. E-mail: mbergeron@sivotecanalytics.com.; Xiaolei Liu, MD, Department of Neurology, First Affiliated Hospital of Kunming Medical University, 295 Xichang Road, Wuhua District, Kunming, Yunnan Province 650032, Kina. E-mail: ring@vip.163.com.

Nøgleord: Aldring, Alzheimers sygdom, demens, massescreening