Nytte av MemTrax og maskinlæringsmodellering i klassifisering av mild kognitiv svikt

Forskningsartikkel

Forfattere: Bergeron, Michael F. | Landset, Sara | Zhou, Xianbo | Ding, Tao | Khoshgoftaar, Taghi M. | Zhao, Feng | Du, Bo | Chen, Xinjie | Wang, Xuan | Zhong, Lianmei | Liu, Xiaolei| Ashford, J. Wesson

DOI: 10.3233/JAD-191340

Tidsskrift: Tidsskrift for Alzheimers sykdom, vol. 77, nei. 4, s. 1545-1558, 2020

Abstrakt

Bakgrunn:

Den utbredte forekomsten og utbredelsen av Alzheimers sykdom og mild kognitiv svekkelse (MCI) har ført til en presserende oppfordring til forskning for å validere tidlig oppdagelse av kognitiv screening og vurdering.

Målet:

Vårt primære forskningsmål var å finne ut om utvalgte MemTrax-ytelsesberegninger og relevante demografiske og helseprofilkarakteristikker kan brukes effektivt i prediktive modeller utviklet med maskinlæring for å klassifisere kognitiv helse (normal versus MCI), slik det vil bli indikert av Montreal kognitiv vurdering (MoCA).

Metoder:

Vi gjennomførte en tverrsnittsstudie på 259 voksne pasienter med nevrologi, hukommelsesklinikk og indremedisin rekruttert fra to sykehus i Kina. Hver pasient ble gitt den kinesiskspråklige MoCA og selvadministrerte den kontinuerlige anerkjennelsen MemTrax online episode minnetest på nett på samme dag. Prediktive klassifikasjonsmodeller ble bygget ved hjelp av maskinlæring med 10 ganger kryssvalidering, og modellytelse ble målt ved bruk av Area Under the Receiver Operating Characteristic Curve (AUC). Modeller ble bygget ved å bruke to MemTrax-ytelsesmålinger (prosent korrekt, responstid), sammen med de åtte vanlige demografiske og personlig historiefunksjonene.

resultater:

Ved å sammenligne elevene på tvers av utvalgte kombinasjoner av MoCA-poengsum og terskler, var Naive Bayes generelt den best presterende eleven med en total klassifiseringsytelse på 0.9093. Videre, blant de tre beste elevene, var MemTrax-basert klassifisering ytelse totalt sett overlegen ved å bruke bare de topprangerte fire funksjonene (0.9119) sammenlignet med å bruke alle 10 vanlige funksjonene (0.8999).

Konklusjon:

MemTrax-ytelse kan effektivt brukes i en prediktiv modell for maskinlæringsklassifisering screeningapplikasjon for å oppdage kognitiv svikt på et tidlig stadium.

INNLEDNING

Den anerkjente (riktignok underdiagnostiserte) utbredte forekomsten og prevalensen og parallelle eskalerende medisinske, sosiale og offentlige Helse kostnader og byrder ved Alzheimers sykdom (AD) og mild kognitiv svikt (MCI) blir stadig mer belastende for alle interessenter [1, 2]. Dette foruroligende og bourgeoning scenariet har ført til en presserende oppfordring til forskning for å validere tidlig gjenkjenning kognitiv screening og vurderingsinstrumenter for regelmessig praktisk nytte i personlige og kliniske omgivelser for eldre pasienter på tvers av ulike regioner og populasjoner [3]. Disse instrumentene må også sørge for sømløs oversettelse av informative resultater til elektroniske helsejournaler. Fordelene vil bli realisert ved å informere pasienter og hjelpe leger med å gjenkjenne betydelige endringer tidligere, og dermed muliggjøre mer rask og rettidig stratifisering, implementering og sporing av passende individualisert og mer kostnadseffektiv behandling og pasientbehandling for de som begynner å oppleve kognitiv nedgang [3, 4].

Det datastyrte MemTrax-verktøyet (https://memtrax.com) er en enkel og kort kontinuerlig gjenkjenningsvurdering som kan administreres selv på nettet for å måle utfordrende tidsbestemt episodisk minneytelse der brukeren reagerer på gjentatte bilder og ikke på en første presentasjon [5, 6]. Nyere forskning og resulterende praktiske implikasjoner begynner gradvis og kollektivt å demonstrere den kliniske effekten av MemTrax i tidlig AD- og MCI-screening [5–7]. Imidlertid direkte sammenligning av klinisk nytte til eksisterende kognitiv helse vurdering og konvensjonelle standarder er garantert å informere profesjonelt perspektiv og bekrefte MemTrax-verktøyet i tidlig oppdagelse og diagnostisk støtte. van der Hoek et al. [8] sammenlignet utvalgte MemTrax-ytelsesmålinger (reaksjonshastighet og prosent korrekt) med kognitiv status som bestemt av Montreal Kognitiv vurdering (MoCA). Imidlertid var denne studien begrenset til å assosiere disse ytelsesmålingene med karakterisering av kognitiv status (som bestemt av MoCA) og definere de relative områdene og grenseverdiene. Følgelig, for å utvide denne undersøkelsen og forbedre klassifiseringsytelsen og effektiviteten, var vårt primære forskningsspørsmål:

  • Kan en persons utvalgte MemTrax-ytelsesberegninger og relevant demografi og helse profil egenskaper effektivt utnyttes i en prediktiv modell utviklet med maskinlæring for å klassifisere kognitiv helse dikotomisk (normal versus MCI), som ens MoCA-score vil indikere?

Sekundært til dette ønsket vi å vite:

  • Inkludert de samme funksjonene, kan en MemTrax ytelsesbasert maskinlæringsmodell effektivt brukes på en pasient for å forutsi alvorlighetsgrad (mild versus alvorlig) innenfor utvalgte kategorier av kognitiv svekkelse som ville bli bestemt av en uavhengig klinisk diagnose?

Fremkomsten og den utviklende praktiske anvendelsen av kunstig intelligens og maskinlæring i screening/deteksjon har allerede vist klare praktiske fordeler, med prediktiv modellering som effektivt veileder klinikere i den utfordrende vurderingen av kognitiv/hjernehelse og pasientbehandling. I vår studie valgte vi en lignende tilnærming i MCI-klassifiseringsmodellering og diskriminering av kognitiv svekkelse alvorlighetsgrad som bekreftet av klinisk diagnose fra tre datasett som representerer utvalgte frivillige innlagte pasienter og polikliniske pasienter fra to sykehus i Kina. Ved å bruke prediktiv modellering for maskinlæring, identifiserte vi de best presterende elevene fra de ulike datasett/lærer-kombinasjonene og rangerte funksjonene for å veilede oss i å definere de mest klinisk praktiske modellapplikasjonene.

Våre hypoteser var at en validert MemTrax-basert modell kan brukes til å klassifisere kognitiv helse dikotomisk (normal eller MCI) basert på MoCAs aggregerte scoreterskelkriteriet, og at en lignende MemTrax-prediktiv modell effektivt kan brukes til å diskriminere alvorlighetsgrad i utvalgte kategorier av klinisk diagnostisert kognitiv svekkelse. Å demonstrere de forventede resultatene vil være medvirkende til å støtte effekten av MemTrax som en tidlig deteksjonsskjerm for kognitiv svikt og kognitiv svekkelsesklassifisering. En gunstig sammenligning med en standard som er påstått av industrien supplert med langt større brukervennlighet og raskere bruk, vil ha innflytelse når det gjelder å hjelpe klinikere med å ta i bruk dette enkle, pålitelige og tilgjengelige verktøyet som en innledende skjerm for å oppdage kognitive defekter i tidlig (inkludert prodromal) stadium. En slik tilnærming og nytte kan dermed føre til mer rettidig og bedre stratifisert pasientbehandling og intervensjon. Disse fremtidsrettede innsiktene og forbedrede beregningene og modellene kan også være nyttige for å dempe eller stoppe demensprogresjon, inkludert AD og AD-relaterte demens (ADRD).

MATERIALER OG METODER

Studiepopulasjon

Mellom januar 2018 og august 2019 ble det fullført tverrsnittsforskning på pasienter rekruttert fra to sykehus i Kina. Administrasjonen av MemTrax [5] til personer i alderen 21 år og over og innsamlingen og analysen av disse dataene ble gjennomgått og godkjent av og administrert i samsvar med de etiske standardene til Menneskelig Emnebeskyttelseskomiteen ved Stanford University. MemTrax og all annen testing for denne overordnede studien ble utført i henhold til Helsinki-erklæringen fra 1975 og godkjent av Institutional Review Board ved det første tilknyttede sykehuset ved Kunming Medical University i Kunming, Yunnan, Kina. Hver bruker fikk en informert samtykke skjema for å lese/gjennomgå og deretter frivillig godta å delta.

Deltakerne ble rekruttert fra poolen av polikliniske pasienter i nevrologisk klinikk ved Yanhua Hospital (YH-underdatasett) og minneklinikk ved First Affiliated Hospital of Kunming Medical Universitet (XL-underdatasett) i Beijing, Kina. Deltakerne ble også rekruttert fra nevrologi (XL-underdatasett) og internmedisin (KM-underdatasett) inneliggende pasienter ved First Affiliated Hospital ved Kunming Medical University. Inkluderingskriterier inkluderte 1) menn og kvinner minst 21 år gamle, 2) evne til å snakke kinesisk (mandarin), og 3) evne til å forstå muntlige og skriftlige instruksjoner. Eksklusjonskriterier var syn og motoriske svekkelser som hindret deltakerne i å fullføre MemTrax test, samt manglende evne til å forstå de spesifikke testinstruksjonene.

Kinesisk versjon av MemTrax

Den elektroniske MemTrax testplattform ble oversatt til kinesisk (URL: https://www.memtrax.com.cn) og videre tilpasset for å kunne brukes gjennom WeChat (Shenzhen Tencent Computer Systems Co. LTD., Shenzhen, Guangdong, Kina) for egenadministrasjon. Data ble lagret på en skyserver (Ali Cloud) lokalisert i Kina og lisensiert fra Alibaba (Alibaba Technology Co. Ltd., Hangzhou, Zhejiang, Kina) av SJN Biomed LTD (Kunming, Yunnan, Kina). Spesifikke detaljer om MemTrax og testvaliditetskriterier brukt her har blitt beskrevet tidligere [6]. Testen ble gitt uten kostnad for pasientene.

Studieprosedyrer

For innlagte og polikliniske pasienter, et generelt spørreskjema for innsamling av demografisk og personlig informasjon som alder, kjønn, utdanningsår, yrke, bor alene eller med familie, og medisinsk historie ble administrert av et medlem av studieteamet. Etter utfylling av spørreskjemaet ble MoCA [12] og MemTrax-testene administrert (MoCA først) med ikke mer enn 20 minutter mellom testene. MemTrax prosent korrekt (MTx-% C), gjennomsnittlig responstid (MTx-RT) og dato og klokkeslett for testingen ble registrert på papir av et medlem av studieteamet for hver testet deltaker. Det utfylte spørreskjemaet og resultatene av MoCA ble lastet opp i et Excel-regneark av forskeren som administrerte testene og verifisert av en kollega før Excel-filene ble lagret for analyser.

MemTrax test

MemTrax online-testen inkluderte 50 bilder (25 unike og 25 repetisjoner; 5 sett med 5 bilder av vanlige scener eller objekter) vist i en spesifikk pseudo-tilfeldig rekkefølge. Deltakeren ville (i henhold til instruksjoner) trykke på Start-knappen på skjermen for å starte testen og begynne å se bildeserien og igjen berøre bildet på skjermen så raskt som mulig hver gang et gjentatt bilde dukket opp. Hvert bilde dukket opp i 3 s eller til bildet på skjermen ble berørt, noe som førte til umiddelbar presentasjon av neste bilde. Ved å bruke den interne klokken til den lokale enheten, ble MTx-RT for hvert bilde bestemt av tiden fra presentasjon av bildet til skjermen ble berørt av deltakeren som svar på å indikere gjenkjennelse av bildet som et som allerede var vist under testen. MTx-RT ble tatt opp for hvert bilde, med hele 3 s registrert som indikerer ingen respons. MTx-% C ble beregnet for å indikere prosentandelen av gjentatte og første bilder som brukeren svarte riktig på (sann positiv + sann negativ delt på 50). Ytterligere detaljer om MemTrax-administrasjonen og implementeringen, datareduksjon, ugyldige eller "ingen respons"-data og primærdataanalyser er beskrevet andre steder [6].

MemTrax-testen ble forklart i detalj og en praksistest (med andre unike bilder enn de som ble brukt i testen for registrering av resultater) ble gitt til deltakerne på sykehuset. Deltakere i YH- og KM-underdatasettene tok MemTrax-testen på en smarttelefon som ble lastet med applikasjonen på WeChat; mens et begrenset antall av XL-subdatasettpasientene brukte en iPad og resten brukte en smarttelefon. Alle deltakerne tok MemTrax-testen med en studieetterforsker som diskret observerte.

Montreal kognitiv vurdering

Beijing-versjonen av den kinesiske MoCA (MoCA-BC) [13] ble administrert og skåret av trente forskere i henhold til de offisielle testinstruksjonene. Passende har MoCA-BC vist seg å være en pålitelig test for kognitiv screening på tvers av alle utdanningsnivåer hos eldre kinesiske voksne [14]. Hver test tok omtrent 10 til 30 minutter å administrere basert på den respektive deltakerens kognitive evner.

MoCA klassifiseringsmodellering

Det var totalt 29 brukbare funksjoner, inkludert to MemTrax test ytelsesmålinger og 27 funksjoner relatert til demografi og helse informasjon for hver deltaker. Hver pasients MoCA samlede testscore ble brukt som kognitiv screening "benchmark" for å trene våre prediktive modeller. Følgelig, fordi MoCA ble brukt til å lage klasseetiketten, kunne vi ikke bruke den samlede poengsummen (eller noen av MoCA-undergruppens poengsum) som en uavhengig funksjon. Vi utførte foreløpige eksperimenter der vi modellerte (klassifisering av kognitiv helse definert av MoCA) de opprinnelige tre sykehus/klinikk(e) underdatasettene individuelt og deretter kombinert med alle funksjoner. Imidlertid ble ikke alle de samme dataelementene samlet inn i hver av de fire klinikkene som representerer de tre underdatasettene; derfor hadde mange av funksjonene våre i det kombinerte datasettet (når alle funksjonene ble brukt) en høy forekomst av manglende verdier. Vi bygde deretter modeller med det kombinerte datasettet ved bruk av bare vanlige funksjoner som resulterte i forbedret klassifiseringsytelse. Dette ble sannsynligvis forklart med en kombinasjon av å ha flere forekomster å jobbe med ved å kombinere de tre pasientunderdatasettene og ingen funksjoner med en unødig forekomst av manglende verdier (bare én funksjon i det kombinerte datasettet, arbeidstype, hadde noen manglende verdier, noe som påvirker bare tre pasientforekomster), fordi bare vanlige funksjoner registrert på alle tre stedene ble inkludert. Spesielt hadde vi ikke et spesifikt avvisningskriterium for hver funksjon som til slutt ikke ble inkludert i det kombinerte datasettet. I vår foreløpige kombinerte datasettmodellering brukte vi imidlertid først alle funksjonene fra hvert av de tre separate pasientunderdatasettene. Dette resulterte i stor grad i modellytelse som var målbart lavere enn den innledende foreløpige modelleringen på hvert enkelt deldatasett. Dessuten, mens klassifiseringsytelsen til modellene bygget med alle funksjonene var oppmuntrende, på tvers av alle elever og klassifiseringsskjemaer, ble ytelsen forbedret for dobbelt så mange modeller når man bare brukte vanlige funksjoner. Faktisk, blant det som endte opp med å bli våre beste elever, ble alle unntatt én modell forbedret ved å eliminere ikke-vanlige funksjoner.

Det endelige samlede datasettet (YH, XL og KM kombinert) inkluderte 259 forekomster, som hver representerte en unik deltaker som tok både MemTrax- og MoCA-testene. Det var 10 delte uavhengige funksjoner: MemTrax-ytelsesmålinger: MTx-% C og gjennomsnittlig MTx-RT; demografisk og sykehistorieinformasjon: alder, kjønn, utdannelsesår, arbeidstype (blå krage/hvit krage), sosial støtte (om testpersonen bor alene eller sammen med familie), og ja/nei svar på om brukeren hadde en historie med diabetes, hyperlipidemi eller traumatisk hjerneskade. To ekstra beregninger, MoCA samlet poengsum og MoCA samlet poengsum justert for år med utdanning [12], ble brukt separat for å utvikle avhengige klassifiseringsetiketter, og dermed opprettet to distinkte modelleringsskjemaer som skal brukes på vårt kombinerte datasett. For hver versjon (justert og ujustert) av MoCA-poengsummen, ble dataene igjen modellert separat for binær klassifisering ved å bruke to forskjellige kriterieterskler - den opprinnelig anbefalte [12] og en alternativ verdi brukt og fremmet av andre [8, 15]. I det alternative terskelklassifiseringsskjemaet ble en pasient ansett for å ha normal kognitiv helse hvis han/hun skåret ≥23 på MoCA-testen og hadde MCI hvis skåren var 22 eller lavere; Mens, i det opprinnelige anbefalte klassifiseringsformatet, måtte pasienten skåre 26 eller bedre på MoCA for å bli merket som å ha normal kognitiv helse.

Filtrerte data for MoCA-klassifiseringsmodellering

Vi undersøkte videre MoCA-klassifisering ved å bruke fire vanlige funksjonsrangeringsteknikker: Chi-Squared, Gain Ratio, Information Gain og Symmetrical Uncertainty. For et midlertidig perspektiv brukte vi rangerne på hele det kombinerte datasettet ved å bruke hvert av våre fire modelleringsskjemaer. Alle rangere var enige om de samme topptrekkene, dvs. alder, antall år med utdanning og begge MemTrax-ytelsesmålingene (MTx-% C, gjennomsnittlig MTx-RT). Vi bygde deretter om modellene ved å bruke hver funksjonsvalgteknikk for å trene modellene på bare de fire beste funksjonene (se Valg av funksjon nedenfor).

De resulterende siste åtte variantene av MoCA-scoreklassifiseringsmodelleringsskjemaene er presentert i tabell 1.

Tabell 1

Sammendrag av modelleringsskjemavariasjoner brukt for MoCA-klassifisering (Normal Kognitiv helse versus MCI)

ModelleringsskjemaNormal kognitiv helse (negativ klasse)MCI (positiv klasse)
Justert-23 Ufiltrert/filtrert101 (39.0%)158 (61.0%)
Justert-26 Ufiltrert/filtrert49 (18.9%)210 (81.1%)
Ujustert-23 Ufiltrert/filtrert92 (35.5%)167 (64.5%)
Ujustert-26 Ufiltrert/filtrert42 (16.2%)217 (83.8%)

Respektivt antall og prosent av totale pasienter i hver klasse er differensiert ved justering av poengsum for utdanning (Justert eller Ujustert) og klassifiseringsterskel (23 eller 26), slik det gjelder begge funksjonssettene (Ufiltrert og Filtrert).

MemTrax-basert klinisk evalueringsmodellering

Av våre tre originale underdatasett (YH, XL, KM) ble bare pasientene med XL-underdatasett uavhengig klinisk diagnostisert for kognitiv svikt (dvs. deres respektive MoCA-skår ble ikke brukt til å etablere en klassifisering av normal versus svekket). Spesifikt ble XL-pasientene diagnostisert med enten Alzheimers sykdomstest (AD) eller vaskulær demens (VaD). Innenfor hver av disse primærdiagnosekategoriene var det en ytterligere betegnelse for MCI. Diagnoser av MCI, demens, vaskulær nevrokognitiv lidelse og nevrokognitiv lidelse på grunn av AD var basert på spesifikke og særegne diagnostiske kriterier skissert i Diagnostic and Statistical Manual of Mental Disorders: DSM-5 [16]. Tatt i betraktning disse raffinerte diagnosene, ble to klassifiseringsmodelleringsskjemaer separat brukt på XL-underdatasettet for å skille alvorlighetsgrad (grad av svekkelse) for hver primær diagnosekategori. Data brukt i hvert av disse diagnostiske modelleringsskjemaene (AD og VaD) inkluderte demografisk informasjon og pasienthistorieinformasjon, samt MemTrax-ytelse (MTx-% C, gjennomsnittlig MTx-RT). Hver diagnose ble merket som mild hvis den ble betegnet som MCI; ellers ble det ansett som alvorlig. Vi vurderte først å inkludere MoCA-skåren i diagnosemodellene (mild versus alvorlig); men vi bestemte at det ville beseire formålet med vår sekundære prediktive modellering. Her vil elevene bli opplært ved å bruke andre pasientkarakteristikker som er lett tilgjengelige for leverandøren og ytelsesmålinger for den enklere MemTrax-testen (i stedet for MoCA) mot referansen "gullstandard", den uavhengige kliniske diagnosen. Det var 69 forekomster i AD-diagnosedatasettet og 76 forekomster av VaD (tabell 2). I begge datasettene var det 12 uavhengige funksjoner. I tillegg til de 10 funksjonene som er inkludert i MoCA-scoreklassifiseringen, inkluderte pasienthistorien også informasjon om hypertensjon og hjerneslag.

Tabell 2

Sammendrag av modelleringsskjemavariasjoner brukt for alvorlighetsklassifisering av diagnose (mild versus alvorlig)

ModelleringsskjemaMild (negativ klasse)Alvorlig (positiv klasse)
MCI-AD versus AD12 (17.4%)57 (82.6%)
MCI-VaD versus VaD38 (50.0%)38 (50.0%)

Respektive antall og prosent av totale pasienter i hver klasse er differensiert etter primær diagnosekategori (AD eller VaD).

Statistikk

Sammenligning av deltakerkarakteristikker og andre numeriske funksjoner mellom deldatasett for hver modellklassifiseringsstrategi (for å forutsi MoCA kognitiv helse og alvorlighetsgrad av diagnoser) ble utført ved bruk av Python-programmeringsspråk (versjon 2.7.1) [17]. Modellytelsesforskjellene ble først bestemt ved å bruke en enkelt- eller tofaktor (etter hensiktsmessig) ANOVA med et 95 % konfidensintervall og Tukey honest significant difference (HSD)-testen for å sammenligne ytelsesgjennomsnittene. Denne undersøkelsen av forskjeller mellom modellytelser ble utført ved bruk av en kombinasjon av Python og R (versjon 3.5.1) [18]. Vi brukte denne (riktignok uten tvil mindre enn optimal) tilnærmingen bare som et heuristisk hjelpemiddel til dette tidlig stadie for første sammenligning av modellytelse for å forutse potensiell klinisk anvendelse. Vi brukte deretter Bayesian signed-rank test ved å bruke en posterior fordeling for å bestemme sannsynligheten for modellytelsesforskjeller [19]. For disse analysene brukte vi intervallet –0.01, 0.01, noe som betyr at hvis to grupper hadde en ytelsesforskjell på mindre enn 0.01, ble de ansett som de samme (innenfor området for praktisk ekvivalens), eller på annen måte var de forskjellige (en bedre enn den andre). For å utføre den Bayesianske sammenligningen av klassifikatorer og beregne disse sannsynlighetene, brukte vi baycomp-biblioteket (versjon 1.0.2) for Python 3.6.4.

Forutsigende modellering

Vi bygde prediktive modeller ved å bruke de ti totale variasjonene av modelleringsskjemaene våre for å forutsi (klassifisere) utfallet av hver pasients MoCA-test eller alvorlighetsgraden av den kliniske diagnosen. Alle elever ble brukt og modellene ble bygget ved hjelp av åpen kildekode-programvareplattformen Weka [20]. For vår foreløpige analyse brukte vi 10 vanlig brukte læringsalgoritmer: 5-Nearest Neighbors, to versjoner av C4.5 beslutningstre, Logistic Regression, Multilayer Perceptron, Naive Bayes, to versjoner av Random Forest, Radial Basis Function Network og Support Vector Maskin. Nøkkelattributter og kontraster til disse algoritmene er beskrevet andre steder [21] (se respektive vedlegg). Disse ble valgt fordi de representerer en rekke ulike typer elever og fordi vi har vist suksess ved å bruke dem i tidligere analyser av lignende data. Hyperparameterinnstillinger ble valgt fra vår tidligere forskning, noe som indikerer at de er robuste på en rekke forskjellige data [22]. Basert på resultatene fra vår foreløpige analyse ved bruk av det samme kombinerte datasettet med vanlige funksjoner som ble brukt senere i den fullstendige analysen, identifiserte vi tre elever som ga konsistent sterk ytelse på tvers av alle klassifikasjoner: Logistisk regresjon, Naive Bayes og Support Vector Machine.

Kryssvalidering og modellytelsesmåling

For all prediktiv modellering (inkludert de foreløpige analysene) ble hver modell bygget ved hjelp av 10-gangers kryssvalidering, og modellytelsen ble målt ved bruk av Area Under the Receiver Operating Characteristic Curve (AUC). Kryssvalidering begynte med tilfeldig deling av hvert av de 10 modellskjemadatasettene i 10 like segmenter (folder), ved å bruke ni av disse respektive segmentene for å trene modellen og det gjenværende segmentet for testing. Denne prosedyren ble gjentatt 10 ganger, med et annet segment som testsettet i hver iterasjon. Resultatene ble deretter kombinert for å beregne den endelige modellens resultat/ytelse. For hver elev/datasett-kombinasjon ble hele denne prosessen gjentatt 10 ganger, og dataene ble delt forskjellig hver gang. Dette siste trinnet reduserte skjevhet, sikret replikerbarhet og hjalp til med å bestemme den generelle modellytelsen. Totalt (for MoCA-score og klassifiseringsordninger for diagnose alvorlighetsgrad kombinert) ble det bygget 6,600 modeller. Dette inkluderte 1,800 6 ufiltrerte modeller (3 modelleringsskjemaer brukt på datasettet × 10 elever × 10 løp × 1,800 ganger = 4,800 4 modeller) og 3 4 filtrerte modeller (10 modelleringsskjemaer brukt på datasettet × 10 elever × 4,800 funksjonsvalgteknikker × XNUMX kjøringer × XNUMX folder = XNUMX modeller).

Valg av funksjon

For de filtrerte modellene ble funksjonsvalg (ved bruk av de fire funksjonsrangeringsmetodene) utført innenfor kryssvalideringen. For hver av de 10 foldene, siden forskjellige 10 % av datasettet var testdataene, ble bare de fire øverste valgte funksjonene for hvert treningsdatasett (dvs. de andre ni foldene, eller de resterende 90 % av hele datasettet) brukt. å bygge modellene. Vi var ikke i stand til å bekrefte hvilke fire funksjoner som ble brukt i hver modell, da denne informasjonen ikke er lagret eller gjort tilgjengelig innenfor modelleringsplattformen vi brukte (Weka). Men gitt konsistensen i vårt første utvalg av toppfunksjoner da rangerne ble brukt på hele det kombinerte datasettet og den påfølgende likheten i modelleringsytelser, er de samme funksjonene (alder, år med utdanning, MTx-% C og gjennomsnittlig MTx-RT) ) er sannsynligvis de mest utbredte topp fire som brukes samtidig med funksjonsvalget i kryssvalideringsprosessen.

RESULTATER

Deltakernes numeriske karakteristikker (inkludert MoCA-score og MemTrax-ytelsesmålinger) for de respektive datasettene for hver modellklassifiseringsstrategi for å forutsi MoCA-indisert kognitiv helse (normal versus MCI) og alvorlighetsgrad av diagnosen (mild versus alvorlig) er vist i tabell 3.

Tabell 3

Deltakeregenskaper, MoCA-score og MemTrax-ytelse for hver modellklassifiseringsstrategi

KlassifiseringsstrategiAlderKunnskapMoCA JustertMoCA UjustertMTx-% CMTx-RT
MoCA-kategori61.9 år (13.1)9.6 år (4.6)19.2 (6.5)18.4 (6.7)74.8% (15.0)1.4 s (0.3)
Diagnose alvorlighetsgrad65.6 år (12.1)8.6 år (4.4)16.7 (6.2)15.8 (6.3)68.3% (13.8)1.5 s (0.3)

Verdier vist (gjennomsnitt, SD) differensiert ved modelleringsklassifiseringsstrategier er representative for det kombinerte datasettet som brukes til å forutsi MoCA-indisert kognitiv helse (MCI versus normal) og XL-underdatasettet kun brukt til å forutsi alvorlighetsgraden av diagnosen (mild versus alvorlig).

For hver kombinasjon av MoCA-poengsum (justert/ujustert) og terskel (26/23), var det en statistisk forskjell (p = 0.000) i hver parvis sammenligning (normal kognitiv helse versus MCI) for alder, utdanning og MemTrax-ytelse (MTx-% C og MTx-RT). Hvert pasientunderdatasett i den respektive MCI-klassen for hver kombinasjon var i gjennomsnitt omtrent 9 til 15 år eldre, rapporterte omtrent fem færre års utdanning og hadde mindre gunstig MemTrax-ytelse for begge beregningene.

Prediktive modelleringsresultater for MoCA-poengklassifiseringene ved bruk av de tre beste elevene, Logistic Regression, Naive Bayes og Support Vector Machine, er vist i tabell 4. Disse tre ble valgt basert på den mest konsekvent høye absolutte elevprestasjonen på tvers av alle de ulike modellene. brukt på datasettene for alle modelleringsskjemaene. For det ufiltrerte datasettet og modelleringen indikerer hver av dataverdiene i tabell 4 modellytelsen basert på den respektive AUC-middelverdien utledet fra de 100 modellene (10 kjøringer × 10 ganger) bygget for hver elev/modelleringsskjemakombinasjon, med den respektive høyeste presterende elev angitt med fet skrift. Mens for den filtrerte datasettmodelleringen, reflekterer resultatene rapportert i tabell 4 den generelle gjennomsnittlige modellytelsen fra 400 modeller for hver elev som bruker hver av funksjonsrangeringsmetodene (4 funksjonsrangeringsmetoder×10 løp×10 ganger).

Tabell 4

Dikotome MoCA-poengklassifiseringsytelse (AUC; 0.0–1.0) resultater for hver av de tre best presterende elevene for alle respektive modelleringsskjemaer

Funksjonssett bruktMoCA-poengsumCutoff-terskelLogistisk regresjonNaive BayesStøtt vektormaskin
Ufiltrert (10 funksjoner)justert230.88620.89130.8695
260.89710.92210.9161
Ujustert230.91030.90850.8995
260.88340.91530.8994
Filtrert (4 funksjoner)justert230.89290.89540.8948
260.91880.92470.9201
Ujustert230.91350.91340.9122
260.91590.92360.9177

Ved å bruke variasjoner av funksjonssett, MoCA-poengsum og MoCA-poenggrensegrense, vises den høyeste ytelsen for hvert modelleringsskjema i pin (ikke nødvendigvis statistisk annerledes enn alle andre som ikke er i pin for den respektive modellen).

Ved å sammenligne elevene på tvers av alle kombinasjoner av MoCA-poengsversjoner og terskler (henholdsvis justert/ujustert og 23/26) i det kombinerte ufiltrerte datasettet (dvs. ved å bruke de 10 vanlige funksjonene), var Naive Bayes generelt den best presterende eleven med en samlet klassifiseringsytelse på 0.9093. Tatt i betraktning de tre beste elevene, indikerte de Bayesiansk-korrelerte signerte rangeringstestene at sannsynligheten (Pr) av Naive Bayes utkonkurrerte logistisk regresjon var 99.9 %. Dessuten, mellom Naive Bayes og Support Vector Machine, en 21.0 % sannsynlighet for praktisk ekvivalens i elevens ytelse (dermed en 79.0 % sannsynlighet for at Naive Bayes overgår Support Vector Machine), kombinert med 0.0 % sannsynlighet for at Support Vector Machine yter bedre, målbart forsterker ytelsesfordelen for Naive Bayes. Ytterligere sammenligning av MoCA-poengversjonen på tvers av alle elever/terskler antydet en liten ytelsesfordel ved å bruke ujusterte MoCA-score versus justert (henholdsvis 0.9027 mot 0.8971; Pr (ujustert > justert) = 0.988). Tilsvarende indikerte en sammenligning av grensegrense for alle elever og MoCA-poengversjoner en liten fordel med klassifiseringsytelse ved å bruke 26 som klassifiseringsterskel versus 23 (henholdsvis 0.9056 mot 0.8942; Pr (26 > 23) = 0.999). Til slutt, ved å undersøke klassifiseringsytelsen for modellene som bare bruker de filtrerte resultatene (dvs. kun topprangerte fire funksjoner), var Naive Bayes (0.9143) numerisk den best presterende eleven på tvers av alle MoCA-poengsversjoner/terskelverdier. Men på tvers av alle funksjonsrangeringsteknikker kombinert, presterte alle de best presterende elevene på samme måte. Bayesianske fortegnstester viste 100 % sannsynlighet for praktisk ekvivalens mellom hvert par filtrerte elever. Som med de ufiltrerte dataene (med alle 10 vanlige funksjoner), var det igjen en ytelsesfordel for den ujusterte versjonen av MoCA-poengsummen (Pr (ujustert > justert) = 1.000), samt en tilsvarende distinkt fordel for klassifiseringsterskelen på 26 (Pr (26 > 23) = 1.000). Spesielt oversteg den gjennomsnittlige ytelsen til hver av de tre beste elevene på tvers av alle MoCA-poengsversjoner/terskelverdier ved bruk av kun de topprangerte fire funksjonene den gjennomsnittlige ytelsen til enhver elev på de ufiltrerte dataene. Ikke overraskende var klassifiseringsytelsen til de filtrerte modellene (ved bruk av de topprangerte fire funksjonene) totalt sett bedre (0.9119) i forhold til de ufiltrerte modellene (0.8999), uavhengig av funksjonsrangeringsmetodemodellene som ble sammenlignet med de respektive modellene som brukte alle 10 vanlige funksjoner. For hver funksjonsvalgmetode var det 100 % sannsynlighet for en ytelsesfordel i forhold til de ufiltrerte modellene.

Med pasientene vurdert for alvorlighetsklassifisering av AD-diagnose, forskjeller mellom gruppe (MCI-AD versus AD) for alder (p = 0.004), utdanning (p = 0.028), MoCA-poengsum justert/ujustert (p = 0.000), og MTx-% C (p = 0.008) var statistisk signifikante; mens for MTx-RT var det ikke (p = 0.097). Med de pasientene som vurderes for alvorlighetsklassifisering av VaD-diagnose, mellom-gruppe (MCI-VaD versus VaD) forskjeller for MoCA-skår justert/ujustert (p = 0.007) og MTx-% C (p = 0.026) og MTx-RT (p = 0.001) var statistisk signifikante; mens for alder (p = 0.511) og utdanning (p = 0.157) var det ingen signifikante forskjeller mellom gruppene.

Prediktive modelleringsresultater for diagnosealvorlighetsklassifikasjonene ved bruk av de tre tidligere valgte elevene, Logistic Regression, Naive Bayes og Support Vector Machine, er vist i tabell 5. Mens flere undersøkte elever demonstrerte litt sterkere prestasjoner individuelt med en av de to kliniske diagnosekategoriene , de tre elevene vi hadde identifisert som de mest gunstige i vår forrige modellering, ga den mest konsistente ytelsen med begge de nye modelleringsordningene. Ved å sammenligne elevene på tvers av hver av de primære diagnosekategoriene (AD og VaD), var det ingen konsistent forskjell i klassifiseringsytelse mellom elever for MCI-VaD versus VaD, selv om Support Vector Machine generelt presterte mer fremtredende. Tilsvarende var det ingen signifikante forskjeller mellom elever for MCI-AD versus AD-klassifiseringen, selv om Naive Bayes (NB) hadde en liten ytelsesfordel fremfor Logistic Regression (LR) og bare en ubetydelig flerhet over Support Vector Machine, med sannsynligheter på 61.4 % og 41.7 %. På tvers av begge datasettene var det en generell ytelsesfordel for Support Vector Machine (SVM), med Pr (SVM > LR) = 0.819 og Pr (SVM > NB) = 0.934. Vår generelle klassifiseringsytelse på tvers av alle elever i å forutsi alvorlighetsgraden av diagnosen i XL-underdatasettet var bedre i VaD-diagnosekategorien versus AD (Pr (VAD > AD) = 0.998).

Tabell 5

Resultater for dikotome klinisk diagnose alvorlighetsklassifisering (AUC; 0.0–1.0) for hver av de tre best presterende elevene for begge respektive modelleringsskjemaer

ModelleringsskjemaLogistisk regresjonNaive BayesStøtt vektormaskin
MCI-AD versus AD0.74650.78100.7443
MCI-VaD versus VaD0.80330.80440.8338

Den høyeste ytelsen for hvert modelleringsskjema vises i pin (ikke nødvendigvis statistisk annerledes enn andre som ikke er i pin).

DISKUSJON

Tidlig oppdagelse av endringer i kognitiv helse er viktig praktisk nytte i både personlig helseledelse og folkehelse. Faktisk er det også veldig høyt prioritert i kliniske omgivelser for pasienter over hele verden. Det felles målet er å varsle pasienter, omsorgspersoner og forsørgere og be om tidligere passende og kostnadseffektiv behandling og langsgående omsorg for de som begynner å oppleve kognitiv tilbakegang. Ved å slå sammen de tre dataundersettene våre for sykehus/klinikker, identifiserte vi tre spesielt foretrukne elever (med en bemerkelsesverdig fremtredende – Naive Bayes) for å bygge prediktive modeller ved å bruke MemTrax ytelsesmålinger som pålitelig kan klassifisere kognitiv helsestatus dikotomt (normal kognitiv helse eller MCI) som vil bli indikert av en MoCA aggregert poengsum. Spesielt forbedret den generelle klassifiseringsytelsen for alle tre elevene når modellene våre brukte kun de fire topprangerte funksjonene som hovedsakelig omfattet disse MemTrax-ytelsesmålingene. Dessuten avslørte vi det underbyggede potensialet for å bruke de samme elevene og MemTrax-ytelsesmålingene i et diagnostisk støtteklassifiseringsmodelleringsskjema for å skille alvorlighetsgraden av to kategorier av demensdiagnose: AD og VaD.

Minnetesting er sentral for tidlig påvisning av AD [23, 24]. Derfor er det hensiktsmessig at MemTrax er et akseptabelt, engasjerende og enkelt å implementere online screeningtest for episodisk hukommelse i den generelle befolkningen [6]. Gjenkjennelsesnøyaktighet og responstider fra denne kontinuerlige ytelsesoppgaven er spesielt avslørende når det gjelder å identifisere tidlig og utviklende forverring og påfølgende mangler i de nevroplastiske prosessene relatert til læring, hukommelse og kognisjon. Det vil si at modellene her som i stor grad er basert på MemTrax-ytelsesmålinger er følsomme for og er mer sannsynlige for å avsløre biologiske nevropatologiske mangler under det asymptomatiske overgangsstadiet i god tid før mer betydelig funksjonstap [25]. Ashford et al. undersøkte nøye mønstrene og atferden for gjenkjenningsminnets nøyaktighet og responstid hos nettbrukere som deltok på egen hånd med MemTrax [6]. Å respektere at disse distribusjonene er avgjørende for optimal modellering og utvikling av gyldige og effektive pasientbehandlingsapplikasjoner, er å definere klinisk anvendelige anerkjennelses- og responstidsprofiler avgjørende for å etablere en verdifull grunnleggende referanse for klinisk og forskningsnytte. Den praktiske verdien av MemTrax i AD-screening for tidlig kognitiv svikt og differensialdiagnostisk støtte må deretter undersøkes nærmere i sammenheng med en klinisk setting der komorbiditeter og kognitive, sensoriske og motoriske evner som påvirker testytelse kan vurderes. Og for å informere profesjonelt perspektiv og oppmuntre til praktisk klinisk nytte, er det først viktig å demonstrere sammenligning med en etablert kognitiv helsevurderingstest, selv om sistnevnte kan være gjenkjennelig begrenset av tungvint testlogistikk, utdanning og språkavskrekkende midler og kulturelle påvirkninger [26] . I denne forbindelse er den gunstige sammenligningen av MemTrax i klinisk effekt med MoCA som vanligvis påstås som en industristandard betydelig, spesielt når man veier den større brukervennligheten og pasientens aksept av MemTrax.

Tidligere utforskning som sammenligner MemTrax med MoCA fremhever begrunnelsen og de foreløpige bevisene som garanterer vår modelleringsundersøkelse [8]. Imidlertid assosierte denne tidligere sammenligningen bare de to viktigste MemTrax-ytelsesmålingene vi undersøkte med kognitiv status som bestemt av MoCA og definerte respektive områder og grenseverdier. Vi utdypet den kliniske nyttevurderingen av MemTrax ved å utforske en prediktiv modelleringsbasert tilnærming som ville gi en mer individualisert vurdering av andre potensielt relevante pasientspesifikke parametere. I motsetning til andre, fant vi ingen fordel i modellytelse ved å bruke en utdanningskorreksjon (justering) til MoCA-skåren eller ved å variere den kognitive helsediskriminerende MoCA-scoreterskelen fra den opprinnelig anbefalte 26 til 23 [12, 15]. Faktisk favoriserte klassifiseringsfordelen å bruke den ujusterte MoCA-poengsummen og den høyere terskelen.

Sentrale punkter i klinisk praksis

Maskinlæring er ofte best utnyttet og mest effektiv i prediktiv modellering når dataene er omfattende og flerdimensjonale, det vil si når det er mange observasjoner og et samtidig bredt spekter av høyverdi (medvirkende) attributter. Likevel, med disse nåværende dataene, presterte de filtrerte modellene med bare fire utvalgte funksjoner bedre enn de som brukte alle de 10 vanlige funksjonene. Dette tyder på at vårt aggregerte sykehusdatasett ikke hadde de mest klinisk passende (høyverdi) funksjonene for å klassifisere pasientene optimalt på denne måten. Ikke desto mindre støtter funksjonsrangeringen som legger vekt på de viktigste MemTrax-ytelsesberegningene – MTx-% C og MTx-RT – sterkt å bygge tidlig stadium kognitive deficitscreeningsmodeller rundt denne testen som er enkel, lett å administrere, rimelig og treffende avslørende mht. minneytelse, i det minste akkurat nå som en innledende skjerm for en binær klassifisering av kognitiv helsestatus. Gitt den stadig økende belastningen på leverandører og helsevesen, bør pasientscreeningsprosesser og kliniske applikasjoner utvikles passende med vekt på å samle, spore og modellere de pasientkarakteristikkene og testmålingene som er mest nyttige, fordelaktige og bevist effektive i diagnostikk. og støtte til pasientbehandling.

Ettersom de to viktigste MemTrax-beregningene er sentrale i MCI-klassifiseringen, hadde vår best presterende elev (Naïve Bayes) en svært høy prediktiv ytelse i de fleste modellene (AUC over 0.90) med et sant-positivt til falskt-positivt forhold som nærmet seg eller noe over 4 : 1. En translasjons klinisk applikasjon som bruker denne eleven vil dermed fange opp (korrekt klassifisere) langt de fleste av de med kognitivt underskudd, samtidig som kostnadene forbundet med å feilaktig klassifisere noen med normal kognitiv helse som har et kognitivt underskudd (falsk positiv) eller mangler den klassifiseringen hos de som har et kognitivt underskudd (falsk negativ). Begge disse scenariene med feilklassifisering kan påføre pasienten og omsorgspersoner en unødig psykososial belastning.

Mens vi i de foreløpige og fullstendige analysene brukte alle de ti elevene i hvert modelleringsskjema, fokuserte vi resultatene våre på de tre klassifikatorene som viste de mest konsistente sterke resultatene. Dette var også for å fremheve, basert på disse dataene, elevene som forventet ville prestere pålitelig på et høyt nivå i en praktisk klinisk anvendelse for å bestemme kognitiv statusklassifisering. Dessuten, fordi denne studien var ment som en innledende undersøkelse av nytten av maskinlæring på kognitiv screening og disse tidsmessige kliniske utfordringene, tok vi beslutningen om å holde læringsteknikkene enkle og generaliserte, med minimal parameterjustering. Vi forstår at denne tilnærmingen kan ha begrenset potensialet for mer snevert definerte pasientspesifikke prediktive evner. På samme måte, mens trening av modellene ved bruk av bare de beste funksjonene (filtrert tilnærming) informerer oss ytterligere om disse dataene (spesifikt for manglene i data som samles inn og fremhever verdien av å optimalisere dyrebar klinisk tid og ressurser), innser vi at det er for tidlig å begrense omfanget av modellene og derfor alle (og andre funksjoner) bør vurderes med fremtidig forskning inntil vi har en mer definitiv profil av prioriterte funksjoner som vil være anvendelige for den brede befolkningen. Dermed erkjenner vi også fullt ut at mer inkluderende og bredt representative data og optimalisering av disse og andre modeller vil være nødvendig før de integreres i en effektiv klinisk applikasjon, spesielt for å imøtekomme komorbiditeter som påvirker kognitiv ytelse som må vurderes i videre klinisk evaluering.

Nytten av MemTrax ble videreutviklet ved modellering av sykdommens alvorlighetsgrad basert på separat klinisk diagnose. En bedre generell klassifiseringsytelse i å forutsi alvorlighetsgraden av VaD (sammenlignet med AD) var det ikke overraskende gitt pasientprofiltrekkene i modellene som er spesifikke for vaskulær helse og slagrisiko, dvs. hypertensjon, hyperlipidemi, diabetes og (selvfølgelig) hjerneslaghistorie. Selv om det ville vært mer ønskelig og passende å ha den samme kliniske vurderingen utført på matchede pasienter med normal kognitiv helse for å trene elevene med disse mer inkluderende dataene. Dette er spesielt berettiget, siden MemTrax er ment å brukes primært for tidlig oppdagelse av kognitivt underskudd og påfølgende sporing av individuell endring. Det er også sannsynlig at den mer ønskelige distribusjonen av data i VaD-datasettet delvis bidro til den relativt bedre modelleringsytelsen. VaD-datasettet var godt balansert mellom de to klassene, mens AD-datasettet med langt færre MCI-pasienter ikke var det. Spesielt i små datasett kan selv noen få ekstra tilfeller utgjøre en målbar forskjell. Begge perspektivene er rimelige argumenter som ligger til grunn for forskjellene i sykdomsgradsmodelleringsytelse. Å forholdsmessig tilskrive forbedret ytelse til datasetts numeriske egenskaper eller de iboende funksjonene som er spesifikke for den kliniske presentasjonen som vurderes, er imidlertid for tidlig. Ikke desto mindre, denne romanen demonstrerte nytten av en MemTrax prediktiv klassifiseringsmodell i rollen som klinisk diagnostisk støtte gir verdifullt perspektiv og bekrefter jakten på ytterligere undersøkelser med pasienter over kontinuumet av MCI.

Implementeringen og demonstrerte nytten av MemTrax og disse modellene i Kina, der språket og kulturen er drastisk forskjellig fra andre regioner med etablert nytte (f.eks. Frankrike, Nederland og USA) [7, 8, 27], understreker ytterligere potensialet for utbredt global aksept og klinisk verdi av en MemTrax-basert plattform. Dette er et påviselig eksempel på streben mot dataharmonisering og utvikling av praktiske internasjonale normer og modelleringsressurser for kognitiv screening som er standardisert og lett tilpasset for bruk over hele verden.

Neste trinn i kognitiv nedgang modellering og anvendelse

Kognitiv dysfunksjon i AD forekommer faktisk på et kontinuum, ikke i diskrete stadier eller trinn [28, 29]. Men i denne tidlige fasen var målet vårt å først etablere vår evne til å bygge en modell som inneholder MemTrax som fundamentalt kan skille "normal" fra "ikke normal". Mer inkluderende empiriske data (f.eks. hjerneavbildning, genetiske egenskaper, biomarkører, komorbiditeter og funksjonelle markører for komplekse aktiviteter som krever kognitive kontroll) [30] på tvers av varierte globale regioner, populasjoner og aldersgrupper for å trene og utvikle mer sofistikerte (inkludert passende vektede ensemble) maskinlæringsmodeller vil støtte en større grad av forbedret klassifisering, det vil si kapasiteten til å kategorisere grupper av pasienter med MCI inn i mindre og mer definitive undergrupper langs kontinuumet for kognitiv nedgang. Dessuten er samtidige kliniske diagnoser for individer på tvers av regionalt forskjellige pasientpopulasjoner avgjørende for trene effektivt disse mer inkluderende og forutsigbart robuste modellene. Dette vil legge til rette for mer spesifikk stratifisert saksbehandling for de med lignende bakgrunn, påvirkninger og mer snevert definerte karakteristiske kognitive profiler og dermed optimere klinisk beslutningsstøtte og pasientbehandling.

Mye av relevant klinisk forskning til dags dato har adressert pasienter med minst mild demens; og i praksis blir pasientintervensjon for ofte bare forsøkt i avanserte stadier. Men fordi kognitiv nedgang begynner i god tid før kliniske kriterier for demens er oppfylt, kan en effektivt anvendt MemTrax-basert tidlig skjerm oppmuntre til passende opplæring av individer om sykdommen og dens progresjon og be om tidligere og mer rettidige intervensjoner. Dermed kan tidlig oppdagelse støtte passende involveringer som spenner fra trening, kosthold, emosjonell støtte og forbedret sosialisering til farmakologisk intervensjon og forsterke pasientrelaterte endringer i atferd og oppfatning som enkeltvis eller samlet kan dempe eller potensielt stoppe demensprogresjon [31, 32] . Dessuten med effektive tidlig screening, kan enkeltpersoner og deres familier bli bedt om å vurdere kliniske utprøvinger eller få rådgivning og annen sosial støtte for å hjelpe med å avklare forventninger og intensjoner og håndtere daglige oppgaver. Ytterligere validering og utbredt praktisk nytte på disse måtene kan være medvirkende til å dempe eller stoppe progresjonen av MCI, AD og ADRD for mange individer.

Den lave enden av pasientens aldersgruppe i vår studie representerer faktisk ikke populasjonen av tradisjonell bekymring med AD. Ikke desto mindre understreker gjennomsnittsalderen for hver gruppe brukt i klassifiseringsmodelleringsskjemaene basert på MoCA-skåre/terskel og diagnosealvorlighet (tabell 3) at et klart flertall (over 80 %) er minst 50 år gammel. Denne fordelingen er derfor veldig passende for generalisering, og støtter bruken av disse modellene i befolkningen som karakteriserer de som typisk er påvirket av tidlig debut og spirende nevrokognitiv sykdom på grunn av AD og VaD. Nyere bevis og perspektiv understreker også de anerkjente faktorene (f.eks. hypertensjon, fedme, diabetes og røyking) som potensielt kan bidra til høyere tidlig vaskulær risikoscore for voksne og midt i livet og påfølgende subtil vaskulær hjerneskade som utvikler seg snikende med tydelige effekter selv hos unge voksne [33–35]. Følgelig den mest optimale initiale screeningsmulighet for å oppdage tidlig stadium kognitive defekter og igangsetting av effektive forebyggings- og intervensjonsstrategier for å lykkes med å håndtere demens vil komme fra å undersøke medvirkende faktorer og forutgående indikatorer på tvers av aldersspekteret, inkludert tidlig voksen alder og potensielt til og med barndom (bemerker relevansen av genetiske faktorer som apolipoprotein E fra tidlig svangerskap).

I praksis er gyldige kliniske diagnoser og kostbare prosedyrer for avansert bildebehandling, genetisk profilering og måling av lovende biomarkører ikke alltid lett tilgjengelige eller til og med gjennomførbare for mange leverandører. I mange tilfeller kan derfor den første generelle kognitive helsestatusklassifiseringen måtte utledes fra modeller som bruker andre enkle beregninger gitt av pasienten (f.eks. selvrapportert minneproblemer, gjeldende medisiner og rutinemessige aktivitetsbegrensninger) og vanlige demografiske trekk [7]. Registre som University of California Hjernehelse Registry (https://www.brainhealthregistry.org/) [27] og andre med en iboende større bredde av selvrapporterte symptomer, kvalitative mål (f.eks. søvn og daglig kognisjon), medisiner, helsestatus og historie, og mer detaljert demografi vil være medvirkende til å utvikle og validere den praktiske anvendelsen av disse mer primitive modellene i klinikken. Videre kan en test som MemTrax, som har vist nytte ved vurdering av minnefunksjon, faktisk gi et vesentlig bedre estimat av AD-patologi enn biologiske markører. Gitt at kjernetrekket ved AD-patologi er forstyrrelse av nevroplastisitet og et overveldende komplekst tap av synapser, som viser seg som episodisk minnedysfunksjon, kan et mål som vurderer episodisk hukommelse faktisk gir et bedre estimat av AD patologisk belastning enn biologiske markører hos den levende pasienten [36].

Med alle prediktive modeller – enten de er supplert med komplekse og inkluderende data fra toppmoderne teknologi og raffinert klinisk innsikt på tvers av flere domener eller de som er begrenset til mer grunnleggende og lett tilgjengelig informasjon som er karakteristisk for eksisterende pasientprofiler – den anerkjente fordelen med kunstig intelligens og maskinlæring er at de resulterende modellene kan syntetisere og induktivt "lære" fra relevante nye data og perspektiv levert av pågående applikasjonsbruk. Etter praktisk teknologioverføring, ettersom modellene her (og som skal utvikles) blir brukt og beriket med flere tilfeller og relevante data (inkludert pasienter med komorbiditeter som kan oppstå med påfølgende kognitiv nedgang), vil prediksjonsytelse og kognitiv helseklassifisering være mer robust, som resulterer i mer effektiv klinisk beslutningsstøtte. Denne utviklingen vil bli mer fullstendig og praktisk realisert ved å bygge inn MemTrax i tilpassede (målrettet mot de tilgjengelige egenskapene) plattformer som helsepersonell kan bruke i sanntid i klinikken.

Imperativ for valideringen og nytten av MemTrax-modellen for diagnostisk støtte og pasientbehandling er svært ettertraktede meningsfulle longitudinelle data. Ved å observere og registrere de samtidige endringene (hvis noen) i klinisk status på tvers av et tilstrekkelig område av normal MCI i tidlig stadium, kan modellene for passende løpende vurdering og klassifisering trenes opp og modifiseres etter hvert som pasienter blir eldre og behandles. Det vil si at gjentatt bruk kan hjelpe til med longitudinell sporing av milde kognitive endringer, intervensjonseffektivitet og opprettholdelse av informert stratifisert omsorg. Denne tilnærmingen stemmer mer overens med klinisk praksis og pasient- og saksbehandling.

Begrensninger

Vi setter pris på utfordringen og verdien i å samle rene kliniske data i en kontrollert klinikk/sykehus. Ikke desto mindre ville det ha styrket vår modellering om våre datasett inkluderte flere pasienter med fellestrekk. Dessuten, spesifikt for vår diagnosemodellering, ville det vært mer ønskelig og passende å ha den samme kliniske vurderingen utført på matchede pasienter med normal kognitiv helse for å trene elevene. Og som understreket av den høyere klassifiseringsytelsen ved bruk av det filtrerte datasettet (bare de topprangerte fire funksjonene), mer generell og kognitive helsetiltak/indikatorer ville sannsynligvis blitt bedre modelleringsytelse med et større antall fellestrekk for alle pasienter.

Enkelte deltakere kan samtidig ha opplevd andre sykdommer som kan ha forårsaket forbigående eller kroniske kognitive mangler. Bortsett fra XL-underdatasettet der pasientene ble diagnostisk klassifisert som å ha enten AD eller VaD, ble ikke komorbiditetsdata samlet inn/rapportert i YH-pasientpoolen, og den overveiende rapporterte komorbiditeten i KM-subdatasettet var diabetes. Det kan imidlertid argumenteres for at å inkludere pasienter i våre modelleringsopplegg med komorbiditeter som kan føre til eller forverre et nivå av kognitiv defekt og en påfølgende lavere MemTrax-ytelse, ville være mer representativt for den virkelige målrettede pasientpopulasjonen for denne mer generaliserte tidlige kognitive screeningen. og modelleringstilnærming. Fremover er nøyaktig diagnose av komorbiditeter som potensielt kan påvirke kognitiv ytelse, stort sett fordelaktig for å optimalisere modellene og resulterende pasientbehandlingsapplikasjoner.

Til slutt brukte YH- og KM-subdatasettpasientene en smarttelefon for å ta MemTrax-testen, mens et begrenset antall av XL-subdatasettpasientene brukte en iPad og resten brukte en smarttelefon. Dette kunne ha introdusert en mindre enhetsrelatert forskjell i MemTrax-ytelse for MoCA-klassifiseringsmodelleringen. Imidlertid vil forskjeller (hvis noen) i MTx-RT, for eksempel mellom enheter, sannsynligvis være ubetydelige, spesielt når hver deltaker får en "øvingstest" rett før den registrerte testytelsen. Ikke desto mindre kan bruken av disse to håndholdte enhetene potensielt kompromittere direkte sammenligning med og/eller integrasjon med andre MemTrax-resultater der brukere svarte på gjentatte bilder ved å berøre mellomromstasten på et datamaskintastatur.

Nøkkelpunkter på MemTrax prediktiv modelleringsverktøy

  • • Våre toppytende prediktive modeller som omfatter utvalgte MemTrax-ytelsesmålinger, kan pålitelig klassifisere kognitiv helsestatus (normal kognitiv helse eller MCI) slik den allment anerkjente MoCA-testen viser.
  • • Disse resultatene støtter integrering av utvalgte MemTrax-ytelsesmålinger i en klassifiseringsprediktiv modellscreeningapplikasjon for kognitiv svekkelse på et tidlig stadium.
  • • Vår klassifiseringsmodellering avslørte også potensialet for å bruke MemTrax-ytelse i applikasjoner for å skille alvorlighetsgraden av demensdiagnose.

Disse nye funnene etablerer definitive bevis som støtter nytten av maskinlæring for å bygge forbedrede robuste MemTrax-baserte klassifiseringsmodeller for diagnostisk støtte i effektiv klinisk saksbehandling og pasientbehandling for personer som opplever kognitiv svikt.

Erkjennelsene

Vi anerkjenner arbeidet til J. Wesson Ashford, Curtis B. Ashford og kolleger for å utvikle og validere den elektroniske kontinuerlige anerkjennelsesoppgaven og verktøyet (MemTrax) som brukes her, og vi er takknemlige for de mange pasientene med demens som har bidratt til den kritiske grunnleggende forskningen . Vi takker også Xianbo Zhou og hans kolleger ved SJN Biomed LTD, hans kolleger og samarbeidspartnere ved sykehus/klinikker, spesielt Drs. M. Luo og M. Zhong, som hjalp til med rekruttering av deltakere, planlegging av tester og innsamling, registrering og front-end-håndtering av dataene, og de frivillige deltakerne som donerte sin verdifulle tid og forpliktet seg til å ta testene og gi de verdsatte dataene for oss å evaluere i denne studien. Dette studien ble delvis støttet av MD Scientific Research Program ved Kunming Medical University (stipend nr. 2017BS028 til XL) og forskningsprogrammet til Yunnan Science and Technology Department (stipend nr. 2019FE001 (-222) til XL).

J. Wesson Ashford har sendt inn en patentsøknad for bruk av det spesifikke kontinuerlige anerkjennelsesparadigmet beskrevet i denne artikkelen for generell testing av minne.

MemTrax, LLC er et selskap som eies av Curtis Ashford, og dette selskapet administrerer minnetesting systemet beskrevet i denne artikkelen.

Forfatteres avsløringer tilgjengelig på nettet (https://www.j-alz.com/manuscript-disclosures/19-1340r2).

minnetest demens test minnetap test korttidshukommelsestap test ram test sinnet diett utvalg av bøker kognitiv test på nett
Curtis Ashford – Kognitiv forskningskoordinator

REFERANSER

[1] Alzheimers Association (2016) 2016 Alzheimers sykdom fakta og figurer. Alzheimers Dement 12, 459–509.
[2] Gresenz CR , Mitchell JM , Marrone J , Federoff HJ (2019) Effekt av tidlig stadium Alzheimers sykdom på husholdningenes økonomiske utfall. Helseøkonomi 29, 18–29.
[3] Foster NL , Bondi MW , Das R , Foss M , Hershey LA , Koh S , Logan R , Poole C , Shega JW , Sood A , Thothala N , Wicklund M , Yu M , Bennett A , Wang D (2019) Kvalitetsforbedring i nevrologi: Mild kognitiv svikt kvalitetsmålesett. Neurology 93, 705–713.
[4] Tong T , Thokala P , McMillan B , Ghosh R , Brazier J (2017) Kostnadseffektivitet ved bruk kognitive screeningtester for å oppdage demens og mild kognitiv svikt i primærhelsetjenesten. Int J Geriatr Psychiatry 32, 1392–1400.
[5] Ashford JW, Gere E, Bayley PJ (2011) Måler minne i store gruppeinnstillinger ved hjelp av en kontinuerlig gjenkjenningstest. J Alzheimers Dis 27, 885–895.
[6] Ashford JW, Tarpin-Bernard F, Ashford CB, Ashford MT (2019) En datastyrt kontinuerlig gjenkjenningsoppgave for måling av episodisk minne. J Alzheimers Dis 69, 385–399.
[7] Bergeron MF, Landset S, Tarpin-Bernard F, Ashford CB, Khoshgoftaar TM, Ashford JW (2019) Episodisk minneytelse i maskinlæringsmodellering for å forutsi klassifisering av kognitiv helsestatus. J Alzheimers Dis 70, 277–286.
[8] van der Hoek MD , Nieuwenhuizen A , Keijer J , Ashford JW (2019) The MemTrax test sammenlignet med Montreal kognitive vurderingsestimat av mild kognitiv svikt. J Alzheimers Dis 67, 1045-1054.
[9] Falcone M , Yadav N , Poellabauer C , Flynn P (2013) Bruk av isolerte vokallyder for klassifisering av mild traumatisk hjerneskade. I 2013 IEEE International Conference on Acoustics, Speech and Signal Processing, Vancouver, BC, s. 7577–7581.
[10] Dabek F, Caban JJ (2015) Utnytte store data for å modellere sannsynligheten for å utvikle psykologiske tilstander etter en hjernerystelse. Procedia Comput Sci 53, 265–273.
[11] Climent MT , Pardo J , Munoz-Almaraz FJ , Guerrero MD , Moreno L (2018) Beslutningstre for tidlig oppdagelse av kognitiv svekkelse av farmasøyter. Front Pharmacol 9, 1232.
[12] Nasreddine ZS, Phillips NA, Bedirian V, Charbonneau S, Whitehead V, Collin I, Cummings JL, Chertkow H (2005) The Montreal Cognitive Assessment, MoCA: Et kort screeningverktøy for mild kognitiv svikt. J Am Geriatr Soc 53, 695–699.
[13] Yu J, Li J, Huang X (2012) Beijing-versjonen av montreal kognitiv vurdering som et kort screeningverktøy for mild kognitiv svikt: En samfunnsbasert studie. BMC Psychiatry 12, 156.
[14] Chen KL , Xu Y , Chu AQ , Ding D , Liang XN , Nasreddine ZS , Dong Q , Hong Z , Zhao QH , Guo QH (2016) Validering av den kinesiske versjonen av Montreal kognitiv vurdering grunnleggende for screening av mild kognitiv svikt. J Am Geriatr Soc 64, e285–e290.
[15] Carson N , Leach L , Murphy KJ (2018) En ny undersøkelse av Montreal Cognitive Assessment (MoCA) cutoff-score. Int J Geriatr Psychiatry 33, 379–388.
[16] American Psychiatric Association (2013) Task Force Diagnostisk og statistisk manual for psykiske lidelser: DSM-5™, American Psychiatric Publishing, Inc., Washington, DC.
[17] Python. Python Software Foundation, http://www.python.org, åpnet 15. november 2019.
[18] R Core Group, R: Et språk og miljø for statistisk databehandling R Foundation for Statistical Computing, Wien, Østerrike. https://www.R-project.org/, 2018, åpnet 15. november 2019.
[19] Benavoli A , Corani G , Demšar J , Zaffalon M (2017) Tid for en endring: En opplæring for å sammenligne flere klassifiserere gjennom Bayesiansk analyse. J Mach Learn Res 18, 1–36.
[20] Frank E , Hall MA , Witten IH (2016) WEKA Workbench. I Databehandling: Praktiske maskinverktøy og teknikker, Frank E, Hall MA, Witten IH, Pal CJ, red. Morgan Kaufmann https://www.cs.waikato.ac.nz/ml/weka/Witten_et_al_2016_appendix.pdf
[21] Bergeron MF , Landset S , Maugans TA , Williams VB , Collins CL , Wasserman EB , Khoshgoftaar TM (2019) Maskinlæring i modellering av hjernerystelse i videregående skolesport. Med Sci Sports Exerc 51, 1362–1371.
[22] Van Hulse J, Khoshgoftaar TM, Napolitano A (2007) Eksperimentelle perspektiver på læring fra ubalanserte data. I Proceedings of the 24th International Conference on Machine Learning, Corvalis, Oregon, USA, s. 935-942.
[23] Ashford JW, Kolm P, Colliver JA, Bekian C, Hsu LN (1989) Alzheimer pasientevaluering og den mini-mentale tilstanden: Element karakteristisk kurveanalyse.P. J Gerontol 44, 139–146.
[24] Ashford JW , Jarvik L (1985) Alzheimers sykdom: Predisponerer nevronplastisitet for aksonal nevrofibrillær degenerasjon? N Engl J Med 313, 388–389.
[25] Jack CR Jr , Therneau TM , Weigand SD , ​​Wiste HJ , Knopman DS , Vemuri P , Lowe VJ , Mielke MM , Roberts RO , Machulda MM , Graff-Radford J , Jones DT , Schwarz CG , Gunter JL , , Rocca WA , Petersen RC (2019) Prevalens av biologisk vs klinisk definerte Alzheimer-spekterenheter ved bruk av National Institute on Aging-Alzheimer's Foreningsforskning rammeverk. JAMA Neurol 76, 1174–1183.
[26] Zhou X , Ashford JW (2019) Fremskritt innen screeningsinstrumenter for Alzheimers sykdom. Aldring Med 2, 88–93.
[27] Weiner MW , Nosheny R , Camacho M , Truran-Sacrey D , Mackin RS , Flenniken D , Ulbricht A , Insel P , Finley S , Fockler J , Veitch D (2018) Hjernehelse Register: En internettbasert plattform for rekruttering, vurdering og longitudinell overvåking av deltakere for nevrovitenskapelige studier. Alzheimers Dement 14, 1063–1076.
[28] Ashford JW, Schmitt FA (2001) Modellering av tidsforløpet til Alzheimers demens. Curr Psychiatry Rep 3, 20–28.
[29] Li X , Wang X , Su L , Hu X , Han Y (2019) Sino Longitudinal Study on Cognitive Decline (SILCODE): Protokoll for en kinesisk longitudinell observasjonsstudie for å utvikle risikoprediksjonsmodeller for konvertering til mild kognitiv svikt hos individer med subjektiv kognitiv svikt. avslå. BMJ Open 9, e028188.
[30] Tarnanas I , Tsolaki A , Wiederhold M , Wiederhold B , Tsolaki M (2015) Fem-års biomarkørprogresjonsvariabilitet for Alzheimers sykdom demens prediksjon: Kan en kompleks instrumentell aktivitet i dagliglivet fylle hullene? Alzheimers Dement (Amst) 1, 521–532.
[31] McGurran H , Glenn JM , Madero EN , Bott NT (2019) Forebygging og behandling av Alzheimers sykdom: Biologiske mekanismer for trening. J Alzheimers Dis 69, 311–338.
[32] Mendiola-Precoma J , Berumen LC , Padilla K , Garcia-Alcocer G (2016) Therapies for forebygging og behandling av Alzheimers sykdom. Biomed Res Int 2016, 2589276.
[33] Lane CA , Barnes J , Nicholas JM , Sudre CH , Cash DM , Malone IB , Parker TD , Keshavan A , Buchanan SM , Keuss SE , James SN , Lu K , Murray-Smith H , Wong A , Gordon E , Coath W , Modat M, Thomas D, Richards M, Fox NC, Schott JM (2020) Assosiasjoner mellom vaskulær risiko på tvers av voksen alder og hjernepatologi på slutten av livet: bevis fra en britisk fødselskohort. JAMA Neurol 77, 175–183.
[34] Seshadri S (2020) Forebygging av demenstenkning utover alderen og amyloidbokser. JAMA Neurol 77, 160–161.
[35] Maillard P, Seshadri S, Beiser A, Himali JJ, Au R, Fletcher E, Carmichael O, Wolf PA, DeCarli C (2012) Effekter av systolisk blodtrykk på hvitstoffintegritet hos unge voksne i Framingham Heart Study: A cross -seksjonsstudie. Lancet Neurol 11, 1039–1047.
[36] Fink HA, Linskens EJ, Silverman PC, McCarten JR, Hemmy LS, Ouellette JM, Greer NL, Wilt TJ, Butler M (2020) Nøyaktighet av biomarkørtesting for nevropatologisk definerte Alzheimers sykdom hos eldre voksne med demens. Ann Intern Med 172, 669–677.

Tilknytninger: [a] SIVOTEC Analytics, Boca Raton, FL, USA | [b] Institutt for data- og elektroteknikk og informatikk, Florida Atlantic University, Boca Raton, FL, USA | [c] SJN Biomed LTD, Kunming, Yunnan, Kina | [d] Senter for Alzheimers forskning, Washington Institute of Clinical Research, Washington, DC, USA | [e] Institutt for rehabiliteringsmedisin, Det første tilknyttede sykehuset ved Kunming Medical University, Kunming, Yunnan, Kina | [f] Nevrologisk avdeling, Dehong People's Hospital, Dehong, Yunnan, Kina | [g] Nevrologisk avdeling, det første tilknyttede sykehuset ved Kunming Medical University, Wuhua-distriktet, Kunming, Yunnan-provinsen, Kina | [h] Studiesenter for krigsrelatert sykdom og skade, VA Palo Alto Health Care System, Palo Alto, CA, USA | [i] Institutt for psykiatri og atferdsvitenskap, Stanford University School of Medicine, Palo Alto, CA, USA

Korrespondanse: [*] Korrespondanse til: Michael F. Bergeron, PhD, FACSM, SIVOTEC Analytics, Boca Raton Innovation Campus, 4800 T-Rex Avenue, Suite 315, Boca Raton, FL 33431, USA. E-post: mbergeron@sivotecanalytics.com.; Xiaolei Liu, MD, nevrologisk avdeling, First Affiliated Hospital of Kunming Medical University, 295 Xichang Road, Wuhua District, Kunming, Yunnan Province 650032, Kina. E-post: ring@vip.163.com.

Nøkkelord: Aldring, Alzheimers sykdom, demens, massescreening