Utilitat de MemTrax i el modelatge d'aprenentatge automàtic en la classificació del deteriorament cognitiu lleu

Article de recerca

Autors: Bergeron, Michael F. | Landset, Sara | Zhou, Xianbo | Ding, Tao | Khoshgoftaar, Taghi M. | Zhao, Feng | Du, Bo | Chen, Xinjie | Wang, Xuan | Zhong, Lianmei | Liu, Xiaolei| Ashford, J. Wesson

DOI: 10.3233/JAD-191340

Revista: Revista de Malaltia d'Alzheimer, vol. 77, no. 4, pàgines 1545-1558, 2020

abstracte

Antecedents:

La incidència i prevalença generalitzada de La malaltia d'Alzheimer i el deteriorament cognitiu lleu (MCI) ha provocat una crida urgent d'investigació per validar el cribratge i l'avaluació cognitiva de detecció precoç.

Objectiu:

El nostre objectiu principal d'investigació va ser determinar si les mètriques de rendiment de MemTrax seleccionades i les característiques demogràfiques rellevants i el perfil de salut es poden utilitzar eficaçment en models predictius desenvolupats amb aprenentatge automàtic per classificar la salut cognitiva (normal versus MCI), tal com indicaria el Avaluació cognitiva de Montreal (MoCA).

Mètodes:

Hem realitzat un estudi transversal sobre 259 pacients adults de neurologia, clínica de memòria i medicina interna reclutats entre dos hospitals a la Xina. A cada pacient se li va donar el MoCA en xinès i es va autoadministrar l'episodi en línia de reconeixement continu MemTrax prova de memòria en línia el mateix dia. Els models de classificació predictiva es van crear mitjançant l'aprenentatge automàtic amb validació creuada de 10 vegades, i el rendiment del model es va mesurar mitjançant l'àrea sota la corba característica de funcionament del receptor (AUC). Els models es van crear utilitzant dues mètriques de rendiment de MemTrax (percentatge de correcte, temps de resposta), juntament amb les vuit funcions comunes de l'historial demogràfic i personal.

Resultats:

Comparant els aprenents a través de combinacions seleccionades de puntuacions i llindars de MoCA, Naïve Bayes va ser generalment l'aprenent de millor rendiment amb un rendiment global de classificació de 0.9093. A més, entre els tres primers aprenents, el rendiment general de la classificació basada en MemTrax va ser superior utilitzant només les quatre característiques principals (0.9119) en comparació amb les 10 característiques comunes (0.8999).

Conclusió:

El rendiment de MemTrax es pot utilitzar eficaçment en un model predictiu de classificació d'aprenentatge automàtic aplicació de cribratge per detectar el deteriorament cognitiu en fase inicial.

INTRODUCCIÓ

La incidència i prevalença reconegudes (encara que infradiagnosticades) i l'escalada paral·lela mèdica, social i pública health els costos i la càrrega de la malaltia d'Alzheimer (MA) i el deteriorament cognitiu lleu (MCI) són cada cop més estressants per a totes les parts interessades [1, 2]. Aquest escenari angoixant i burgès ha provocat una crida urgent a la investigació per validar detecció precoç instruments de cribratge i avaluació cognitius per a una utilitat pràctica regular en entorns personals i clínics per a pacients grans de diverses regions i poblacions [3]. Aquests instruments també han de proporcionar una traducció perfecta dels resultats informatius als registres sanitaris electrònics. Els beneficis s'aconseguiran informant els pacients i ajudant els metges a reconèixer els canvis significatius abans i així permetre una estratificació, implementació i seguiment més ràpides i oportunes d'un tractament i una atenció al pacient adequats i individualitzats i més rendibles per a aquells que comencen a experimentar. disminució cognitiva [3, 4].

L'eina informàtica MemTrax (https://memtrax.com) és una avaluació de reconeixement contínua senzilla i breu que es pot autoadministrar en línia per mesurar el rendiment de la memòria episòdica cronometrada desafiant on l'usuari respon a imatges repetides i no a una presentació inicial [5, 6]. Les investigacions recents i les implicacions pràctiques resultants estan començant a demostrar de manera progressiva i col·lectiva l'eficàcia clínica de MemTrax en el cribratge precoç d'AD i MCI [5–7]. No obstant això, comparació directa de la utilitat clínica amb l'existent salut cognitiva L'avaluació i els estàndards convencionals estan garantits per informar la perspectiva professional i corroborar la utilitat de MemTrax en la detecció precoç i el suport de diagnòstic. van der Hoek et al. [8] va comparar les mètriques de rendiment de MemTrax seleccionades (velocitat de reacció i percentatge de correcte) amb l'estat cognitiu determinat pel Mont-real Avaluació cognitiva (MoCA). Tanmateix, aquest estudi es va limitar a associar aquestes mètriques de rendiment amb la caracterització de l'estat cognitiu (determinat per MoCA) i a definir els intervals relatius i els valors de tall. En conseqüència, per ampliar aquesta investigació i millorar el rendiment i l'eficàcia de la classificació, la nostra pregunta principal de recerca va ser:

  • Poden les mètriques de rendiment de MemTrax seleccionades per una persona i les dades demogràfiques i la salut rellevants perfil Les característiques s'utilitzen eficaçment en un model predictiu desenvolupat amb aprenentatge automàtic per classificar la salut cognitiva de manera dicotòmica (normal versus MCI), tal com indicaria la puntuació MoCA d'un?

En segon lloc, volíem saber:

  • Incloent les mateixes característiques, es pot aplicar un model d'aprenentatge automàtic basat en el rendiment de MemTrax a un pacient per predir la gravetat (lleu versus greu) dins de categories seleccionades de deteriorament cognitiu tal com es determinaria per un diagnòstic clínic independent?

L'aparició i l'evolució de l'aplicació pràctica de la intel·ligència artificial i l'aprenentatge automàtic en el cribratge/detecció ja han demostrat diferents avantatges pràctics, amb el modelatge predictiu que guia eficaçment els metges en l'avaluació desafiant de la salut cognitiva/cerebral i la gestió del pacient. En el nostre estudi, vam triar un enfocament similar en el modelatge de classificació MCI i la discriminació de la gravetat del deteriorament cognitiu, tal com va confirmar el diagnòstic clínic de tres conjunts de dades que representen pacients voluntaris seleccionats i pacients ambulatoris de dos hospitals de la Xina. Utilitzant el modelatge predictiu d'aprenentatge automàtic, vam identificar els aprenents de millor rendiment a partir de les diverses combinacions de conjunt de dades/aprenent i vam classificar les característiques per guiar-nos a definir les aplicacions de model més pràctica clínicament.

Les nostres hipòtesis eren que es pot utilitzar un model basat en MemTrax validat per classificar la salut cognitiva de manera dicotòmica (normal o MCI) basant-se en el criteri del llindar de puntuació agregada MoCA, i que un model predictiu MemTrax similar es pot emprar eficaçment per discriminar la gravetat en categories seleccionades de clínicament diagnosticada discapacitat cognitiva. Demostrar els resultats previstos seria fonamental per donar suport a l'eficàcia de MemTrax com a pantalla de detecció precoç del deteriorament cognitiu i la classificació del deteriorament cognitiu. Una comparació favorable amb un suposat estàndard de la indústria complementat amb una facilitat i rapidesa d'utilitat molt més gran seria influent per ajudar els metges a adoptar aquesta eina senzilla, fiable i accessible com a pantalla inicial per detectar dèficits cognitius en fase inicial (inclosos els prodròmics). Així, aquest enfocament i utilitat podrien provocar una intervenció i una intervenció més oportuna i estratificada del pacient. Aquests coneixements futuristes i mètriques i models millorats també podrien ser útils per mitigar o aturar la progressió de la demència, incloses les demències relacionades amb l'AD i l'AD (ADRD).

MATERIALS I MÈTODES

Població d'estudi

Entre gener de 2018 i agost de 2019, es va completar la investigació transversal sobre pacients reclutats a dos hospitals de la Xina. L'administració de MemTrax [5] a persones de 21 anys o més i la recollida i anàlisi d'aquestes dades van ser revisades i aprovades i administrades d'acord amb els estàndards ètics de la Humà Comitè de protecció de subjectes de la Universitat de Stanford. MemTrax i totes les altres proves d'aquest estudi global es van realitzar d'acord amb la declaració d'Hèlsinki de 1975 i aprovades per la Junta de Revisió Institucional del Primer Hospital Afiliat de la Universitat Mèdica de Kunming a Kunming, Yunnan, Xina. A cada usuari se li va proporcionar un consentiment informat formulari per llegir/revisar i després acceptar voluntàriament participar-hi.

Els participants van ser reclutats del grup de pacients ambulatoris de la clínica de neurologia de l'Hospital Yanhua (subconjunt de dades YH) i el clínica de memòria al Primer Hospital Afiliat de Kunming Medical Universitat (subconjunt de dades XL) a Pequín, Xina. Els participants també van ser reclutats entre pacients hospitalitzats en neurologia (subconjunt de dades XL) i medicina interna (subconjunt de dades KM) al primer hospital afiliat de la Universitat Mèdica de Kunming. Els criteris d'inclusió incloïen 1) homes i dones d'almenys 21 anys, 2) capacitat de parlar xinès (mandarí) i 3) capacitat d'entendre indicacions verbals i escrites. Els criteris d'exclusió van ser deficiències visuals i motrius que impedien als participants completar el curs Prova MemTrax, així com la incapacitat per entendre les instruccions específiques de la prova.

Versió xinesa de MemTrax

La línia S'ha traduït la plataforma de prova MemTrax en xinès (URL: https://www.memtrax.com.cn) i adaptat per ser utilitzat a través de WeChat (Shenzhen Tencent Computer Systems Co. LTD., Shenzhen, Guangdong, Xina) per a l'autoadministració. Les dades es van emmagatzemar en un servidor al núvol (Ali Cloud) situat a la Xina i amb llicència d'Alibaba (Alibaba Technology Co. Ltd., Hangzhou, Zhejiang, Xina) per SJN Biomed LTD (Kunming, Yunnan, Xina). Els detalls específics sobre MemTrax i els criteris de validesa de les proves utilitzats aquí s'han descrit anteriorment [6]. La prova es va oferir sense cap cost als pacients.

Procediments d’estudi

Per als pacients hospitalitzats i ambulatoris, un qüestionari general en paper per recollir informació demogràfica i personal com ara edat, sexe, anys d'educació, ocupació, viure sola o amb la família, i la història clínica va ser administrada per un membre de l'equip de l'estudi. Després de completar el qüestionari, es van administrar les proves MoCA [12] i MemTrax (primer MoCA) amb no més de 20 minuts entre proves. El percentatge de MemTrax correcte (MTx-% C), el temps de resposta mitjà (MTx-RT) i la data i l'hora de la prova es van registrar en paper per un membre de l'equip d'estudi per a cada participant provat. El qüestionari emplenat i els resultats del MoCA van ser penjats a un full de càlcul Excel per l'investigador que va administrar les proves i va ser verificat per un company abans que els fitxers d'Excel fossin desats per a les anàlisis.

Prova MemTrax

La prova en línia de MemTrax va incloure 50 imatges (25 úniques i 25 repeticions; 5 conjunts de 5 imatges d'escenes o objectes comuns) mostrades en un ordre pseudoaleatori específic. El participant hauria de tocar (segons les instruccions) el botó d'inici de la pantalla per començar la prova i començar a veure la sèrie d'imatges i tornar a tocar la imatge a la pantalla el més ràpidament possible sempre que aparegués una imatge repetida. Cada imatge va aparèixer durant 3 s o fins que es va tocar la imatge de la pantalla, cosa que va provocar la presentació immediata de la següent imatge. Utilitzant el rellotge intern del dispositiu local, MTx-RT per a cada imatge es va determinar pel temps transcorregut des de la presentació de la imatge fins al moment en què el participant va tocar la pantalla en resposta a indicar el reconeixement de la imatge com una que ja s'havia mostrat. durant la prova. Es va gravar MTx-RT per a cada imatge, amb un total de 3 s enregistrats que indicaven que no hi havia resposta. Es va calcular MTx-% C per indicar el percentatge d'imatges repetides i inicials a les quals l'usuari va respondre correctament (vertader positiu + veritable negatiu dividit per 50). En altres llocs es descriuen detalls addicionals de l'administració i implementació de MemTrax, la reducció de dades, les dades no vàlides o "sense resposta" i les anàlisis de dades primàries [6].

Es va explicar detalladament la prova MemTrax i es va proporcionar una prova pràctica (amb imatges úniques diferents de les utilitzades a la prova per registrar els resultats) als participants a l'entorn hospitalari. Els participants dels subconjunts de dades YH i KM van fer la prova MemTrax en un telèfon intel·ligent que es va carregar amb l'aplicació a WeChat; mentre que un nombre limitat de pacients del subconjunt de dades XL utilitzaven un iPad i la resta utilitzaven un telèfon intel·ligent. Tots els participants van fer la prova MemTrax amb un investigador de l'estudi observant discretament.

Avaluació cognitiva de Montreal

La versió de Beijing del MoCA xinès (MoCA-BC) [13] va ser administrada i puntuada per investigadors entrenats segons les instruccions oficials de la prova. De manera adequada, s'ha demostrat que el MoCA-BC és fiable prova de cognició cribratge a tots els nivells educatius en adults grans xinesos [14]. Cada prova va trigar entre 10 i 30 minuts a administrar-se en funció de les capacitats cognitives dels participants respectius.

Modelització de classificació MoCA

Hi havia un total de 29 funcions utilitzables, incloses dues MemTrax prova mètriques de rendiment i 27 característiques relacionades amb la demografia i la salut informació per a cada participant. La puntuació total de la prova MoCA de cada pacient es va utilitzar com a cribratge cognitiu "punt de referència" per entrenar els nostres models predictius. En conseqüència, com que es va utilitzar MoCA per crear l'etiqueta de classe, no vam poder utilitzar la puntuació agregada (ni cap de les puntuacions del subconjunt MoCA) com a característica independent. Vam realitzar experiments preliminars en els quals vam modelar (classificant la salut cognitiva definida per MoCA) els tres subconjunts de dades originals d'hospitals/clíniques de manera individual i després combinats utilitzant totes les característiques. Tanmateix, no es van recollir els mateixos elements de dades a cadascuna de les quatre clíniques que representen els tres subconjunts de dades; per tant, moltes de les nostres funcions del conjunt de dades combinat (quan s'utilitzaven totes les funcions) tenien una alta incidència de valors que falten. A continuació, vam crear models amb el conjunt de dades combinat utilitzant només característiques comunes que van donar lloc a un rendiment de classificació millorat. Això probablement es va explicar per una combinació de tenir més instàncies amb les quals treballar combinant els tres subconjunts de dades de pacients i cap característiques amb una prevalença indeguda de valors que falten (només una característica del conjunt de dades combinat, tipus de treball, tenia valors que faltaven, afectant només tres casos de pacients), perquè només es van incloure les característiques comunes registrades als tres llocs. Notablement, no teníem un criteri de rebuig específic per a cada característica que finalment no es va incloure al conjunt de dades combinat. Tanmateix, en el nostre model de conjunt de dades combinat preliminar, primer vam utilitzar totes les característiques de cadascun dels tres subconjunts de dades de pacients separats. Això va donar com a resultat un rendiment del model que era mesurablement inferior al model preliminar inicial de cada subconjunt de dades individual. A més, mentre que el rendiment de classificació dels models construïts amb totes les característiques era encoratjador, en tots els aprenents i esquemes de classificació, el rendiment va millorar el doble de models quan s'utilitzaven només característiques comunes. De fet, entre els que van acabar sent els nostres millors aprenents, tots els models menys un van millorar en eliminar funcions no comunes.

El conjunt de dades agregades final (YH, XL i KM combinats) incloïa 259 instàncies, cadascuna de les quals representava un participant únic que va fer les proves de MemTrax i MoCA. Hi havia 10 característiques independents compartides: mètriques de rendiment de MemTrax: MTx-% C i MTx-RT mitjà; informació demogràfica i de l'historial mèdic: edat, sexe, anys d'estudis, tipus de treball (collar blau/coll blanc), suport social (si l'estudiant viu sol o amb la família) i respostes sí/no sobre si l'usuari tenia un antecedents de diabetis, hiperlipèmia o lesió cerebral traumàtica. Dues mètriques addicionals, la puntuació agregada de MoCA i la puntuació agregada de MoCA ajustada per als anys d'educació [12], es van utilitzar per separat per desenvolupar etiquetes de classificació dependents, creant així dos esquemes de modelatge diferents per aplicar-los al nostre conjunt de dades combinat. Per a cada versió (ajustada i no ajustada) de la puntuació MoCA, les dades es van modelar de nou per separat per a la classificació binària mitjançant dos llindars de criteri diferents: el recomanat inicialment [12] i un valor alternatiu utilitzat i promogut per altres [8, 15]. En l'esquema de classificació de llindar alternatiu, es va considerar que un pacient tenia una salut cognitiva normal si tenia una puntuació ≥23 a la prova MoCA i tenia MCI si la puntuació era 22 o inferior; mentre que, en el format de classificació recomanat inicial, el pacient havia de puntuar un 26 o millor al MoCA per ser etiquetat com a salut cognitiva normal.

Dades filtrades per al modelatge de classificació MoCA

Vam examinar més la classificació MoCA mitjançant quatre tècniques de classificació de característiques utilitzades habitualment: Chi quadrat, ràtio de guany, guany d'informació i incertesa simètrica. Per a una perspectiva provisional, vam aplicar els classificadors a tot el conjunt de dades combinat mitjançant cadascun dels nostres quatre esquemes de modelització. Tots els classificadors van coincidir en les mateixes característiques principals, és a dir, l'edat, el nombre d'anys d'educació i ambdues mètriques de rendiment de MemTrax (MTx-% C, MTx-RT mitjà). A continuació, vam reconstruir els models utilitzant cada tècnica de selecció de funcions per entrenar els models només en les quatre funcions principals (vegeu Selecció de funcions a continuació).

Les vuit variacions finals resultants dels esquemes de modelització de classificació de la puntuació MoCA es presenten a la taula 1.

Taula 1

Resum de les variacions de l'esquema de modelització utilitzades per a la classificació MoCA (Normal Salut Cognitiva versus MCI)

Esquema de modelatgeSalut cognitiva normal (classe negativa)MCI (classe positiva)
Ajustat-23 Sense filtrat/Filtrat101 (% 39.0)158 (% 61.0)
Ajustat-26 Sense filtrat/Filtrat49 (% 18.9)210 (% 81.1)
Sense ajustar-23 Sense filtrat/Filtrat92 (% 35.5)167 (% 64.5)
Sense ajustar-26 Sense filtrat/Filtrat42 (% 16.2)217 (% 83.8)

El nombre i el percentatge respectius del total de pacients de cada classe es diferencien per l'ajust de la puntuació per a l'educació (ajustat o no ajustat) i el llindar de classificació (23 o 26), tal com s'aplica als dos conjunts de característiques (sense filtrar i filtrat).

Modelització d'avaluació clínica basada en MemTrax

Dels nostres tres subconjunts de dades originals (YH, XL, KM), només els pacients del subconjunt de dades XL van ser diagnosticats clínicament de manera independent per deteriorament cognitiu (és a dir, les seves respectives puntuacions MoCA no es van utilitzar per establir una classificació de normal versus deteriorat). Concretament, als pacients XL se'ls va diagnosticar qualsevol de les dues Test de la malaltia d'Alzheimer (AD) o demència vascular (VaD). Dins de cadascuna d'aquestes categories de diagnòstic primari, hi havia una designació addicional per a MCI. Els diagnòstics de MCI, demència, trastorn neurocognitiu vascular i trastorn neurocognitiu a causa de l'AD es van basar en criteris de diagnòstic específics i distintius descrits al Manual de diagnòstic i estadístic dels trastorns mentals: DSM-5 [16]. Tenint en compte aquests diagnòstics refinats, es van aplicar per separat dos esquemes de modelització de classificació al subconjunt de dades XL per distingir el nivell de gravetat (grau de deteriorament) per a cada categoria de diagnòstic primari. Les dades utilitzades en cadascun d'aquests esquemes de modelització diagnòstica (AD i VaD) incloïen informació demogràfica i de la història del pacient, així com el rendiment de MemTrax (MTx-% C, MTx-RT mitjà). Cada diagnòstic es va etiquetar lleu si es designava MCI; en cas contrari, es considerava greu. Inicialment vam considerar incloure la puntuació MoCA en els models de diagnòstic (lleu versus greu); però vam determinar que això derrotaria el propòsit del nostre esquema de modelització predictiva secundària. Aquí els aprenents s'entrenarien utilitzant altres característiques del pacient fàcilment disponibles per al proveïdor i mètriques de rendiment de la prova MemTrax més senzilla (en lloc del MoCA) amb la referència "estàndard d'or", el diagnòstic clínic independent. Hi va haver 69 instàncies al conjunt de dades de diagnòstic d'AD i 76 instàncies de VaD (taula 2). En ambdós conjunts de dades, hi havia 12 característiques independents. A més de les 10 característiques incloses a la classificació de la puntuació MoCA, la història del pacient també va incloure informació sobre la història d'hipertensió i ictus.

Taula 2

Resum de les variacions de l'esquema de modelització utilitzades per a la classificació de la gravetat del diagnòstic (lleu versus greu)

Esquema de modelatgeLleu (classe negativa)Sever (classe positiva)
MCI-AD versus AD12 (% 17.4)57 (% 82.6)
MCI-VaD versus VaD38 (% 50.0)38 (% 50.0)

El nombre i el percentatge respectius del total de pacients de cada classe es diferencien per categoria de diagnòstic primari (AD o VaD).

Estadística

La comparació de les característiques dels participants i altres característiques numèriques entre subconjunts de dades per a cada estratègia de classificació del model (per predir la salut cognitiva de MoCA i la gravetat del diagnòstic) es va realitzar mitjançant el llenguatge de programació Python (versió 2.7.1) [17]. Les diferències de rendiment del model es van determinar inicialment mitjançant un ANOVA d'un sol o dos factors (segons correspongui) amb un interval de confiança del 95% i la prova de diferència significativa honesta (HSD) de Tukey per comparar els mitjans de rendiment. Aquest examen de les diferències entre el rendiment del model es va realitzar mitjançant una combinació de Python i R (versió 3.5.1) [18]. Hem emprat aquest enfocament (encara que possiblement menys que òptim) només com a ajuda heurística en aquest etapa inicial per a les comparacions inicials de rendiment del model per anticipar una possible aplicació clínica. A continuació, vam utilitzar la prova de rang signat bayesià mitjançant una distribució posterior per determinar la probabilitat de les diferències de rendiment del model [19]. Per a aquestes anàlisis, hem utilitzat l'interval –0.01, 0.01, que significa que si dos grups tenien una diferència de rendiment inferior a 0.01, es consideraven iguals (dins de la regió d'equivalència pràctica), o en cas contrari eren diferents (un millor que l'altre). Per realitzar la comparació bayesiana de classificadors i calcular aquestes probabilitats, hem utilitzat la biblioteca baycomp (versió 1.0.2) per a Python 3.6.4.

Modelatge predictiu

Vam construir models predictius utilitzant les deu variacions totals dels nostres esquemes de modelització per predir (classificar) el resultat de la prova MoCA de cada pacient o la gravetat del diagnòstic clínic. Tots els alumnes es van aplicar i els models es van construir mitjançant la plataforma de programari de codi obert Weka [20]. Per a la nostra anàlisi preliminar, hem utilitzat 10 algorismes d'aprenentatge d'ús habitual: 5-Nearest Neighbors, dues versions de l'arbre de decisió C4.5, regressió logística, multicapa Perceptron, Naïve Bayes, dues versions de Random Forest, Radial Basis Function Network i Support Vector. Màquina. Els atributs clau i els contrastos d'aquests algorismes s'han descrit en altres llocs [21] (vegeu l'apèndix respectiu). Es van triar perquè representen una varietat de tipus diferents d'aprenents i perquè hem demostrat l'èxit utilitzant-los en anàlisis anteriors de dades similars. Els paràmetres d'hiper-paràmetres es van triar a partir de les nostres investigacions anteriors, indicant-los que són robusts en una varietat de dades diferents [22]. A partir dels resultats de la nostra anàlisi preliminar utilitzant el mateix conjunt de dades combinat amb característiques comunes que es van utilitzar posteriorment a l'anàlisi completa, vam identificar tres aprenents que van oferir un rendiment constantment fort en totes les classificacions: regressió logística, naïve Bayes i suport Vector Machine.

Validació creuada i mètrica de rendiment del model

Per a tots els models predictius (incloses les anàlisis preliminars), cada model es va construir mitjançant una validació creuada de 10 vegades i es va mesurar el rendiment del model mitjançant l'àrea sota la corba característica de funcionament del receptor (AUC). La validació creuada va començar dividint aleatòriament cadascun dels 10 conjunts de dades de l'esquema de modelització en 10 segments iguals (plecs), utilitzant nou d'aquests segments respectius per entrenar el model i el segment restant per a la prova. Aquest procediment es va repetir 10 vegades, utilitzant un segment diferent com a conjunt de prova en cada iteració. A continuació, es van combinar els resultats per calcular el resultat/rendiment del model final. Per a cada combinació d'alumne/conjunt de dades, tot aquest procés es va repetir 10 vegades i les dades es van dividir de manera diferent cada vegada. Aquest darrer pas va reduir el biaix, va assegurar la replicabilitat i va ajudar a determinar el rendiment global del model. En total (per als esquemes de classificació de la puntuació MoCA i la gravetat del diagnòstic combinats), es van construir 6,600 models. Això incloïa 1,800 models no filtrats (6 esquemes de modelització aplicats al conjunt de dades × 3 aprenents × 10 execucions × 10 plecs = 1,800 models) i 4,800 models filtrats (4 esquemes de modelització aplicats al conjunt de dades × 3 aprenents × 4 tècniques de selecció de característiques × 10 execucions × 10 plecs = 4,800 models).

Selecció de funcions

Per als models filtrats, la selecció de característiques (utilitzant els quatre mètodes de classificació de característiques) es va realitzar dins de la validació creuada. Per a cadascun dels 10 plecs, com que un 10% diferent del conjunt de dades eren les dades de prova, només es van utilitzar les quatre característiques principals seleccionades per a cada conjunt de dades d'entrenament (és a dir, els altres nou plecs, o el 90% restant de tot el conjunt de dades) per construir els models. No hem pogut confirmar quines quatre funcions es van utilitzar a cada model, ja que aquesta informació no s'emmagatzema ni està disponible a la plataforma de modelatge que hem utilitzat (Weka). Tanmateix, donada la coherència en la nostra selecció inicial de característiques principals quan els classificadors es van aplicar a tot el conjunt de dades combinat i la similitud posterior en els rendiments de modelització, aquestes mateixes característiques (edat, anys d'educació, MTx-% C i MTx-RT mitjà). ) són probablement els quatre primers utilitzats més freqüentment simultàniament amb la selecció de funcions dins del procés de validació creuada.

RESULTATS

Les característiques numèriques dels participants (incloses les puntuacions de MoCA i les mètriques de rendiment de MemTrax) dels conjunts de dades respectius per a cada estratègia de classificació del model per predir la salut cognitiva indicada per MoCA (normal versus MCI) i la gravetat del diagnòstic (lleu versus greu) es mostren a la taula 3.

Taula 3

Característiques dels participants, puntuacions MoCA i rendiment de MemTrax per a cada estratègia de classificació del model

Estratègia de classificacióedatEducacióMoCA ajustatMoCA no ajustatMTx-% CMTx-RT
Categoria MoCA61.9 anys (13.1)9.6 anys (4.6)19.2 (6.5)18.4 (6.7)74.8% (15.0)1.4 s (0.3)
Gravetat del diagnòstic65.6 anys (12.1)8.6 anys (4.4)16.7 (6.2)15.8 (6.3)68.3% (13.8)1.5 s (0.3)

Els valors mostrats (mitjana, SD) diferenciats per estratègies de classificació de modelització són representatius del conjunt de dades combinat utilitzat per predir la salut cognitiva indicada per MoCA (MCI versus normal) i el subconjunt de dades XL només utilitzat per predir la gravetat del diagnòstic (lleu versus greu).

Per a cada combinació de puntuació MoCA (ajustada/no ajustada) i llindar (26/23), hi va haver una diferència estadística (p = 0.000) en cada comparació per parelles (salut cognitiva normal versus MCI) per edat, educació i rendiment de MemTrax (MTx-% C i MTx-RT). Cada subconjunt de dades de pacients de la classe MCI respectiva per a cada combinació tenia una mitjana d'entre 9 i 15 anys més, va informar uns cinc anys menys d'educació i tenia un rendiment MemTrax menys favorable per a ambdues mètriques.

A la taula 4 es mostren els resultats del model predictiu per a les classificacions de la puntuació de MoCA que utilitzen els tres millors aprenents, regressió logística, naïve Bayes i support Vector Machine. aplicat als conjunts de dades per a tots els esquemes de modelització. Per al conjunt de dades i el modelatge no filtrats, cadascun dels valors de dades de la taula 4 indica el rendiment del model basat en la mitjana respectiva de l'AUC derivada dels 100 models (10 execucions × 10 plecs) creats per a cada combinació d'alumne/esquema de modelització, amb la corresponent més alta. l'alumne amb rendiment indicat en negreta. Mentre que per al modelatge del conjunt de dades filtrat, els resultats que es mostren a la taula 4 reflecteixen el rendiment mitjà global del model de 400 models per a cada alumne que utilitza cadascun dels mètodes de classificació de característiques (4 mètodes de classificació de característiques × 10 execucions × 10 plecs).

Taula 4

Resultats del rendiment de la classificació de la puntuació MoCA dicotòmica (AUC; 0.0–1.0) per a cadascun dels tres aprenents de millor rendiment per a tots els esquemes de modelització respectius

Conjunt de funcions utilitzadesPuntuació MoCALlindar de tallRegressió logísticaBayes naïfMàquina vectorial de suport
Sense filtrar (10 funcions)Ajustat230.88620.89130.8695
260.89710.92210.9161
No ajustat230.91030.90850.8995
260.88340.91530.8994
Filtrat (4 funcions)Ajustat230.89290.89540.8948
260.91880.92470.9201
No ajustat230.91350.91340.9122
260.91590.92360.9177

Utilitzant variacions del conjunt de característiques, la puntuació MoCA i el llindar de tall de la puntuació MoCA, el rendiment més alt per a cada esquema de modelització es mostra a (no necessàriament és estadísticament diferent de totes les altres que no són a pel model corresponent).

Comparant els estudiants de totes les combinacions de versions i llindars de puntuació MoCA (ajustat/no ajustat i 23/26, respectivament) en el conjunt de dades combinat sense filtrar (és a dir, utilitzant les 10 característiques comunes), Naïve Bayes va ser generalment l'aprenent de millor rendiment amb una rendiment de classificació de 0.9093. Tenint en compte els tres millors aprenents, les proves de rang signat correlacionades amb bayesians van indicar que la probabilitat (Pr) de Naïve Bayes que va superar la regressió logística va ser del 99.9%. A més, entre Naïve Bayes i Support Vector Machine, una probabilitat del 21.0% d'equivalència pràctica en el rendiment de l'alumne (per tant, una probabilitat del 79.0% que Naïve Bayes superi la Support Vector Machine), juntament amb la probabilitat del 0.0% que la Support Vector Machine funcioni millor, mesurable. reforça l'avantatge de rendiment de Naïve Bayes. Una comparació addicional de la versió de la puntuació MoCA entre tots els aprenents/llindars va suggerir un lleuger avantatge de rendiment utilitzant puntuacions MoCA no ajustades versus ajustades (0.9027 versus 0.8971, respectivament; Pr (no ajustat > ajustat) = 0.988). De la mateixa manera, una comparació del llindar de tall entre tots els aprenents i les versions de puntuació de MoCA va indicar un petit avantatge de rendiment de classificació utilitzant 26 com a llindar de classificació enfront de 23 (0.9056 versus 0.8942, respectivament); Pr (26 > 23) = 0.999). Finalment, examinant el rendiment de la classificació dels models que utilitzen només els resultats filtrats (és a dir, només les quatre característiques més destacades), Naïve Bayes (0.9143) va ser numèricament l'aprenent de millor rendiment en totes les versions/llindars de puntuació de MoCA. No obstant això, a través de totes les tècniques de classificació de funcions combinades, tots els estudiants amb millor rendiment van tenir un rendiment similar. Les proves bayesianes de rang signat van mostrar una probabilitat del 100% d'equivalència pràctica entre cada parell d'aprenents filtrats. Igual que amb les dades no filtrades (utilitzant les 10 característiques comunes), hi va haver de nou un avantatge de rendiment per a la versió no ajustada de la puntuació MoCA (Pr (no ajustat > ajustat) = 1.000), així com un avantatge diferent per al llindar de classificació de 26 (Pr (26 > 23) = 1.000). En particular, el rendiment mitjà de cadascun dels tres alumnes principals en totes les versions/llindars de puntuació de MoCA utilitzant només les quatre característiques més destacades va superar el rendiment mitjà de qualsevol aprenent a les dades no filtrades. No és sorprenent que el rendiment de classificació dels models filtrats (utilitzant les quatre característiques més importants) en general va ser superior (0.9119) als models no filtrats (0.8999), independentment dels models del mètode de classificació de característiques que es van comparar amb els models respectius que utilitzen els 10 models comuns. característiques. Per a cada mètode de selecció de característiques, hi havia un 100% de probabilitat d'un avantatge de rendiment respecte als models no filtrats.

Amb els pacients considerats per a la classificació de la gravetat del diagnòstic d'AD, diferències entre grups (MCI-AD versus AD) per edat (p = 0.004), educació (p = 0.028), puntuació MoCA ajustada/no ajustada (p = 0.000) i MTx-% C (p = 0.008) van ser estadísticament significatius; mentre que per a MTx-RT no ho era (p = 0.097). Amb aquells pacients considerats per a la classificació de la gravetat del diagnòstic de VaD, diferències entre grups (MCI-VaD versus VaD) per a la puntuació MoCA ajustada/no ajustada (p = 0.007) i MTx-% C (p = 0.026) i MTx-RT (p = 0.001) van ser estadísticament significatius; mentre que per edat (p = 0.511) i educació (p = 0.157) no hi va haver diferències significatives entre grups.

Els resultats de rendiment de modelització predictiva per a les classificacions de gravetat del diagnòstic utilitzant els tres aprenents seleccionats prèviament, Logistic Regression, Naïve Bayes i Support Vector Machine, es mostren a la taula 5. Mentre que els aprenents examinats addicionals van demostrar un rendiment lleugerament més fort individualment amb una de les dues categories de diagnòstic clínic. , els tres aprenents que havíem identificat com els més favorables en la nostra modelització anterior van oferir el rendiment més consistent amb els dos nous esquemes de modelització. Comparant els aprenents de cadascuna de les categories de diagnòstic principal (AD i VaD), no hi va haver cap diferència coherent de rendiment de classificació entre els aprenents per a MCI-VaD versus VaD, tot i que la màquina de vectors de suport generalment va tenir un paper més destacat. De la mateixa manera, no hi va haver diferències significatives entre els aprenents per a la classificació MCI-AD versus AD, tot i que Naïve Bayes (NB) tenia un lleuger avantatge de rendiment respecte a la regressió logística (LR) i només una pluralitat insignificant sobre la màquina de vectors de suport, amb probabilitats del 61.4% i el 41.7% respectivament. En ambdós conjunts de dades, hi va haver un avantatge de rendiment global per a la màquina de suport vectorial (SVM). Pr (SVM > LR) = 0.819 i Pr (SVM > NB) = 0.934. El nostre rendiment global de classificació entre tots els aprenents per predir la gravetat del diagnòstic al subconjunt de dades XL va ser millor a la categoria de diagnòstic de VaD versus AD (Pr (VAD > AD) = 0.998).

Taula 5

Resultats del rendiment de la classificació de la gravetat del diagnòstic clínic dicotòmic (AUC; 0.0–1.0) per a cadascun dels tres aprenents de millor rendiment per als dos esquemes de modelització respectius

Esquema de modelatgeRegressió logísticaBayes naïfMàquina vectorial de suport
MCI-AD versus AD0.74650.78100.7443
MCI-VaD versus VaD0.80330.80440.8338

El rendiment més alt per a cada esquema de modelització es mostra a (no necessàriament diferent estadísticament d'altres que no en ).

DISCUSSIÓ

La detecció precoç dels canvis en la salut cognitiva és important utilitat pràctica tant en la gestió de la salut personal com en la salut pública. De fet, també és una alta prioritat en els entorns clínics per als pacients de tot el món. L'objectiu compartit és alertar els pacients, els cuidadors i els proveïdors i demanar un tractament i una atenció longitudinal adequats i rendibles abans per a aquells que comencen a experimentar un deteriorament cognitiu. Combinant els nostres tres subconjunts de dades d'hospitals/clíniques, vam identificar tres aprenents molt preferibles (amb un destacat notable: Naïve Bayes) per construir models predictius utilitzant Mètriques de rendiment de MemTrax que podrien classificar de manera fiable l'estat de salut cognitiva de manera dicotòmica (salut cognitiva normal o MCI), tal com indicaria una puntuació agregada de MoCA. En particular, el rendiment general de la classificació per als tres aprenents va millorar quan els nostres models van utilitzar només les quatre funcions més destacades que abastaven principalment aquestes mètriques de rendiment de MemTrax. A més, vam revelar el potencial demostrat d'utilitzar els mateixos aprenents i mètriques de rendiment de MemTrax en un esquema de modelització de classificació de suport diagnòstic per distingir la gravetat de dues categories de diagnòstic de demència: AD i VaD.

Prova de memòria és fonamental per a la detecció precoç de l'AD [23, 24]. Per tant, és oportú que MemTrax sigui un servei en línia acceptable, atractiu i fàcil d'implementar. prova de cribratge de memòria episòdica a la població general [6]. La precisió del reconeixement i els temps de resposta d'aquesta tasca de rendiment continu són especialment reveladors per identificar el deteriorament precoç i evolutiu i els conseqüents dèficits en els processos neuroplàstics relacionats amb l'aprenentatge, la memòria i la cognició. És a dir, els models aquí que es basen en gran mesura en mètriques de rendiment de MemTrax són sensibles i tenen més probabilitats de revelar fàcilment i amb un cost mínim dèficits neuropatològics biològics durant l'etapa asimptomàtica de transició molt abans d'una pèrdua funcional més substancial [25]. Ashford et al. va examinar de prop els patrons i comportaments de la precisió de la memòria de reconeixement i el temps de resposta dels usuaris en línia que van participar pel seu compte amb MemTrax [6]. Respectant que aquestes distribucions són crítiques per a la modelització òptima i el desenvolupament d'aplicacions d'atenció al pacient vàlides i efectives, la definició de perfils de reconeixement i temps de resposta clínicament aplicables és essencial per establir una referència fundacional valuosa per a la utilitat clínica i de recerca. El valor pràctic de MemTrax en el cribratge d'AD per al deteriorament cognitiu en fase inicial i el suport diagnòstic diferencial s'ha d'examinar més de prop en el context d'un entorn clínic on es puguin considerar les comorbiditats i les capacitats cognitives, sensorials i motores que afecten el rendiment de la prova. I per informar la perspectiva professional i fomentar la utilitat clínica pràctica, primer és imprescindible demostrar la comparació amb una prova d'avaluació de la salut cognitiva establerta, tot i que aquesta última pot veure's limitada de manera reconeixible per la logística de les proves feixugues, els elements dissuasius de l'educació i el llenguatge i les influències culturals [26] . En aquest sentit, la comparació favorable de MemTrax en l'eficàcia clínica amb MoCA que es considera habitualment com a estàndard de la indústria és significativa, especialment quan es sospesa la major facilitat d'utilitat i l'acceptació del pacient de MemTrax.

L'exploració anterior que compara MemTrax amb MoCA posa de manifest la justificació i l'evidència preliminar que justifiquen la nostra investigació de modelatge [8]. Tanmateix, aquesta comparació prèvia només va associar les dues mètriques clau de rendiment de MemTrax que vam examinar amb l'estat cognitiu determinat per MoCA i vam definir els intervals i els valors de tall respectius. Hem aprofundit en l'avaluació de la utilitat clínica de MemTrax explorant un enfocament basat en el modelatge predictiu que proporcionaria una consideració més individualitzada d'altres paràmetres específics del pacient potencialment rellevants. A diferència d'altres, no vam trobar cap avantatge en el rendiment del model mitjançant una correcció educativa (ajustament) a la puntuació MoCA o en la variació del llindar de puntuació agregada de MoCA que discrimina la salut cognitiva del 26 al 23 recomanat originalment [12, 15]. De fet, l'avantatge del rendiment de la classificació va afavorir l'ús de la puntuació MoCA no ajustada i el llindar més alt.

Punts clau en la pràctica clínica

L'aprenentatge automàtic s'utilitza sovint i és més eficaç en el modelatge predictiu quan les dades són extenses i multidimensionals, és a dir, quan hi ha nombroses observacions i una àmplia gamma concomitant d'atributs (contributius) d'alt valor. No obstant això, amb aquestes dades actuals, els models filtrats amb només quatre funcions seleccionades van tenir un millor rendiment que els que utilitzen les 10 funcions comunes. Això suggereix que el nostre conjunt de dades hospitalàries agregades no tenia les característiques clínicament adequades (valor alt) per classificar de manera òptima els pacients d'aquesta manera. No obstant això, l'èmfasi de la classificació de funcions a les mètriques de rendiment clau de MemTrax (MTx-% C i MTx-RT) admet fortament la creació de models de cribratge de dèficit cognitiu en fase inicial al voltant d'aquesta prova que és senzilla, fàcil d'administrar, de baix cost i reveladora encertadament. rendiment de la memòria, almenys ara com a pantalla inicial per a una classificació binària de l'estat de salut cognitiu. Atesa la pressió cada cop més gran dels proveïdors i dels sistemes sanitaris, els processos de detecció de pacients i les aplicacions clíniques s'han de desenvolupar adequadament amb èmfasi en la recollida, el seguiment i la modelització d'aquelles característiques del pacient i mètriques de prova que són més útils, avantatjoses i eficaços demostrat en el diagnòstic. i suport a la gestió del pacient.

Com que les dues mètriques clau de MemTrax eren centrals per a la classificació MCI, el nostre aprenent de millor rendiment (Naïve Bayes) va tenir un rendiment predictiu molt alt en la majoria dels models (AUC superior a 0.90) amb una proporció entre positius veritables i falsos positius propera o superior a 4. : 1. Una aplicació clínica translacional que utilitzi aquest aprenent capturaria (classificaria correctament) amb diferència la majoria d'aquells amb un dèficit cognitiu, alhora que minimitza el cost associat a la classificació errònia d'algú amb salut cognitiva normal com a dèficit cognitiu (fals positiu) o falta aquesta classificació en aquells que sí tenen un dèficit cognitiu (fals negatiu). Qualsevol d'aquests escenaris de classificació errònia podria imposar una càrrega psicosocial indeguda al pacient i als cuidadors.

Mentre que a les anàlisis preliminars i completes vam utilitzar els deu aprenents en cada esquema de modelització, vam centrar els nostres resultats en els tres classificadors que mostraven el rendiment més consistent. Això també va ser per destacar, a partir d'aquestes dades, els aprenents que anticipaven un rendiment fiable a un alt nivell en una aplicació clínica pràctica per determinar la classificació de l'estat cognitiu. A més, com que aquest estudi pretenia ser una investigació introductòria sobre la utilitat de l'aprenentatge automàtic en el cribratge cognitiu i aquests reptes clínics oportuns, vam prendre la decisió de mantenir les tècniques d'aprenentatge senzilles i generalitzades, amb un ajustament mínim dels paràmetres. Apreciem que aquest enfocament pot haver limitat el potencial de capacitats predictives específiques del pacient més definides. De la mateixa manera, mentre que l'entrenament dels models utilitzant només les característiques principals (enfocament filtrat) ens informa més sobre aquestes dades (específiques de les deficiències de les dades recollides i destacant el valor d'optimitzar el temps i els recursos clínics valuosos), reconeixem que és prematur reduir-los. l'abast dels models i, per tant, totes (i altres característiques) s'haurien de considerar amb futures investigacions fins que tinguem un perfil més definitiu de les característiques prioritàries que fos aplicable a la població àmplia. Així, també reconeixem plenament que serien necessàries dades i optimització més inclusives i àmpliament representatives d'aquests i altres models abans d'integrar-los en una aplicació clínica eficaç, especialment per adaptar-se a les comorbiditats que afecten el rendiment cognitiu que caldria tenir en compte en una avaluació clínica posterior.

La utilitat de MemTrax es va edificar encara més mitjançant la modelització de la gravetat de la malaltia basada en un diagnòstic clínic separat. No va ser un millor rendiment de classificació global per predir la gravetat de la VaD (en comparació amb l'AD). sorprenent tenint en compte les característiques del perfil del pacient en els models específics de salut vascular i el risc d'ictus, és a dir, hipertensió, hiperlipèmia, diabetis i (per descomptat) antecedents d'ictus. Tot i que hauria estat més desitjable i adequat tenir la mateixa avaluació clínica realitzada en pacients coincidents amb salut cognitiva normal per formar els aprenents amb aquestes dades més inclusives. Això està especialment garantit, ja que MemTrax està pensat per ser utilitzat principalment per a la detecció primerenca d'un dèficit cognitiu i el seguiment posterior del canvi individual. També és plausible que la distribució més desitjable de dades al conjunt de dades VaD contribuís en part al rendiment de modelatge comparativament millor. El conjunt de dades VaD estava ben equilibrat entre les dues classes, mentre que el conjunt de dades AD amb molts menys pacients amb MCI no ho era. Particularment en conjunts de dades petits, fins i tot unes quantes instàncies addicionals poden marcar una diferència mesurable. Ambdues perspectives són arguments raonables subjacents a les diferències en el rendiment de modelització de la gravetat de la malaltia. No obstant això, atribuir proporcionalment un rendiment millorat a les característiques numèriques del conjunt de dades o a les característiques inherents específiques de la presentació clínica considerada és prematur. No obstant això, aquesta novel·la va demostrar la utilitat d'un model de classificació predictiva de MemTrax en el paper de suport de diagnòstic clínic proporciona una perspectiva valuosa i afirma la recerca d'un examen addicional amb pacients en tot el continu de MCI.

La implementació i la utilitat demostrada de MemTrax i aquests models a la Xina, on la llengua i la cultura són dràsticament diferents d'altres regions d'utilitat establerta (per exemple, França, Països Baixos i Estats Units) [7, 8, 27], subratlla encara més el potencial. per a una acceptació global generalitzada i el valor clínic d'una plataforma basada en MemTrax. Aquest és un exemple demostrable d'esforçar-se cap a l'harmonització de dades i el desenvolupament de normes internacionals pràctiques i recursos de modelització per al cribratge cognitiu que s'estandarditzen i s'adapten fàcilment per al seu ús a tot el món.

Pròxims passos en la modelització i aplicació del declivi cognitiu

La disfunció cognitiva en l'AD es produeix en un continu, no en etapes o passos discrets [28, 29]. Tanmateix, en aquesta fase inicial, el nostre objectiu era establir primer la nostra capacitat per construir un model que incorporés MemTrax que pugui distingir fonamentalment "normal" de "no normal". Dades empíriques més inclusives (per exemple, imatges cerebrals, característiques genètiques, biomarcadors, comorbiditats i marcadors funcionals de complexos). activitats que requereixen cognitives control) [30] a diferents regions globals, poblacions i grups d'edat per entrenar i desenvolupar models d'aprenentatge automàtic més sofisticats (incloent-hi un conjunt adequadament ponderat) donaran suport a un major grau de classificació millorada, és a dir, la capacitat de categoritzar grups de pacients amb MCI en subconjunts més petits i definitius al llarg del continu de declivi cognitiu. A més, són essencials els diagnòstics clínics concomitants per a persones de poblacions de pacients regionals diverses entrenar eficaçment aquests models més inclusius i previsiblement robusts. Això facilitarà una gestió de casos estratificada més específica per a aquells amb antecedents, influències i perfils cognitius característics més definits i, per tant, optimitzar el suport a la decisió clínica i l'atenció al pacient.

Gran part de la investigació clínica rellevant fins ara s'ha dirigit a pacients amb almenys demència lleu; i, a la pràctica, massa sovint la intervenció del pacient només s'intenta en etapes avançades. Tanmateix, com que el declivi cognitiu comença molt abans que es compleixin els criteris clínics per a la demència, una pantalla precoç basada en MemTrax aplicada eficaçment podria fomentar l'educació adequada de les persones sobre la malaltia i les seves progressions i demanar intervencions més primerenques i oportunes. Així, la detecció precoç podria donar suport a implicacions adequades que van des de l'exercici, la dieta, el suport emocional i la millora de la socialització fins a la intervenció farmacològica i reforçar els canvis de comportament i percepció relacionats amb el pacient que, per separat o en conjunt, podrien mitigar o potencialment aturar la progressió de la demència [31, 32] . A més, amb eficaç detecció primerenca, es pot demanar a les persones i les seves famílies que considerin assajos clínics o que rebin assessorament i altres serveis socials per ajudar a aclarir les expectatives i les intencions i gestionar les tasques diàries. Una validació addicional i una utilitat pràctica generalitzada d'aquestes maneres podrien ser fonamentals per mitigar o aturar la progressió de MCI, AD i ADRD per a moltes persones.

De fet, l'extrem baix de la franja d'edat dels pacients del nostre estudi no representa la població tradicionalment preocupada per la MA. No obstant això, l'edat mitjana de cada grup utilitzat en els esquemes de modelització de classificació basats en la puntuació/llindar MoCA i la gravetat del diagnòstic (taula 3) subratlla que una majoria clara (més del 80%) té almenys 50 anys. Aquesta distribució és, per tant, molt adequada per a la generalització, donant suport a la utilitat d'aquests models en la població que caracteritza els afectats habitualment per inici precoç i la creixent malaltia neurocognitiva a causa de la MA i la VaD. A més, l'evidència i la perspectiva recents subratllen aquells factors reconeguts (per exemple, hipertensió, obesitat, diabetis i tabaquisme) que poden contribuir a un augment precoç. puntuacions de risc vascular d'adults i de mitjana edat i la consegüent lesió cerebral vascular subtil que es desenvolupa de manera insidiosa amb efectes evidents fins i tot en joves adults [33-35]. En conseqüència, l'oportunitat de cribratge inicial més òptima per a la detecció precoç etapa de dèficits cognitius i iniciar estratègies efectives de prevenció i intervenció per abordar amb èxit la demència sorgirà de l'examen dels factors que contribueixen i dels indicadors antecedents en tot l'espectre d'edat, inclosa l'edat adulta primerenca i fins i tot la infància (tenint en compte la rellevància de factors genètics com l'apolipoproteïna E des de la gestació primerenca).

A la pràctica, els diagnòstics clínics vàlids i els procediments costosos per a la imatge avançada, el perfil genètic i la mesura de biomarcadors prometedors no sempre estan disponibles ni tan sols factibles per a molts proveïdors. Així, en molts casos, la classificació general inicial de l'estat de salut cognitiva pot haver de derivar-se de models que utilitzen altres mètriques senzilles proporcionades pel pacient (p. ex., problemes de memòria, medicaments actuals i limitacions de l'activitat rutinària) i característiques demogràfiques comunes [7]. Registres com ara la Universitat de Califòrnia Brain Health Registre (https://www.brainhealthregistry.org/) [27] i altres amb una major amplitud inherent de símptomes autoinformats, mesures qualitatives (per exemple, son i cognició diària), medicaments, estat de salut i història, i una demografia més detallada serà fonamental per desenvolupar i validar l'aplicació pràctica d'aquests models més primitius a la clínica. A més, una prova com MemTrax, que ha demostrat la utilitat per avaluar la funció de memòria, de fet pot proporcionar una estimació substancialment millor de la patologia de la MA que els marcadors biològics. Atès que la característica principal de la patologia de la MA és la interrupció de la neuroplasticitat i una pèrdua aclaparadorament complexa de sinapsis, que es manifesta com a episòdica. disfunció de la memòria, una mesura que avalua la memòria episòdica de fet proporcionen una millor estimació de la càrrega patològica de la MA que els marcadors biològics en el pacient viu [36].

Amb tots els models predictius, ja siguin complementats amb dades complexes i inclusives de la tecnologia d'última generació i coneixements clínics refinats en múltiples dominis o els limitats a informació més bàsica i fàcilment disponible característica dels perfils de pacients existents, l'avantatge reconegut de la intel·ligència artificial i l'aprenentatge automàtic és que els models resultants poden sintetitzar i "aprendre" de manera inductiva a partir de dades i perspectives noves rellevants proporcionades per la utilització contínua de les aplicacions. Després de la transferència pràctica de tecnologia, a mesura que els models aquí (i que s'han de desenvolupar) s'apliquen i s'enriqueixin amb més casos i dades pertinents (inclosos pacients amb comorbiditats que podrien presentar un declivi cognitiu consegüent), el rendiment de predicció i la classificació de la salut cognitiva seran més robustes. resultant en una utilitat de suport a la decisió clínica més eficaç. Aquesta evolució es realitzarà de manera més completa i pràctica amb la inserció de MemTrax en plataformes personalitzades (orientades a les capacitats disponibles) que els proveïdors sanitaris podrien utilitzar en temps real a la clínica.

Les dades longitudinals significatives molt buscades són imprescindibles per a la validació i la utilitat del model MemTrax per al suport diagnòstic i l'atenció al pacient. Mitjançant l'observació i el registre dels canvis concomitants (si n'hi ha) en l'estat clínic en un rang adequat de normals a través d'un MCI en fase inicial, es poden entrenar i modificar els models per a una avaluació i classificació contínua adequades a mesura que els pacients envelleixen i es tracten. És a dir, la utilitat repetida pot ajudar amb el seguiment longitudinal de canvis cognitius lleus, l'eficàcia de la intervenció i el manteniment d'una atenció estratificada informada. Aquest enfocament s'alinea més estretament amb la pràctica clínica i la gestió de pacients i casos.

Limitacions

Valorem el repte i el valor de la recollida de dades clíniques netes en un entorn clínic/hospital controlat. No obstant això, hauria reforçat el nostre modelatge si els nostres conjunts de dades incloguessin més pacients amb característiques comunes. A més, específic per al nostre model de diagnòstic, hauria estat més desitjable i adequat tenir la mateixa avaluació clínica realitzada en pacients equiparats amb salut cognitiva normal per formar els aprenents. I tal com subratlla el rendiment de classificació més alt mitjançant el conjunt de dades filtrat (només les quatre característiques més destacades), més general i Les mesures/indicadors de salut cognitiva probablement haurien millorat modelar el rendiment amb un major nombre de característiques comunes a tots els pacients.

Alguns participants podrien haver patit simultàniament altres malalties que podrien haver provocat deficiències cognitives transitòries o cròniques. A part del subconjunt de dades XL on els pacients es van classificar diagnòsticament com a AD o VaD, les dades de comorbiditat no es van recollir/informar al conjunt de pacients de YH i la comorbiditat predominant informada amb diferència al subconjunt de dades KM va ser la diabetis. No obstant això, és discutible que incloure pacients als nostres esquemes de modelització amb comorbiditats que podrien provocar o agreujar un nivell de deficiència cognitiva i un consegüent menor rendiment de MemTrax seria més representatiu de la població de pacients objectiu del món real per a aquest cribratge cognitiu precoç més generalitzat. i enfocament de modelització. Avançant, el diagnòstic precís de les comorbiditats que poden afectar el rendiment cognitiu és àmpliament beneficiós per optimitzar els models i les aplicacions resultants d'atenció al pacient.

Finalment, els pacients del subconjunt de dades YH i KM van utilitzar un telèfon intel·ligent per fer la prova MemTrax, mentre que un nombre limitat dels pacients del subconjunt de dades XL van utilitzar un iPad i la resta va utilitzar un telèfon intel·ligent. Això podria haver introduït una diferència menor relacionada amb el dispositiu en el rendiment de MemTrax per al modelatge de classificació MoCA. No obstant això, les diferències (si n'hi ha) en MTx-RT, per exemple, entre dispositius probablement serien insignificants, especialment amb una prova de "pràctica" a cada participant just abans del rendiment de la prova gravada. No obstant això, la utilitat d'aquests dos dispositius de mà pot comprometre la comparació directa i/o la integració amb altres resultats de MemTrax on els usuaris responien a repetir imatges tocant la barra espaiadora del teclat d'un ordinador.

Punts clau sobre la utilitat de modelatge predictiu MemTrax

  • • Els nostres models predictius de millor rendiment que inclouen mètriques de rendiment de MemTrax seleccionades podrien classificar de manera fiable l'estat de salut cognitiva (salut cognitiva normal o MCI) tal com indicaria la prova MoCA àmpliament reconeguda.
  • • Aquests resultats donen suport a la integració de les mètriques de rendiment de MemTrax seleccionades en una aplicació de selecció de models predictius de classificació per al deteriorament cognitiu en fase inicial.
  • • El nostre model de classificació també va revelar el potencial d'utilitzar el rendiment de MemTrax en aplicacions per distingir la gravetat del diagnòstic de demència.

Aquestes noves troballes estableixen evidències definitives que donen suport a la utilitat de l'aprenentatge automàtic per crear models de classificació robustos basats en MemTrax per a un suport diagnòstic en la gestió eficaç de casos clínics i l'atenció al pacient per a persones que pateixen deteriorament cognitiu.

AGRAÏMENTS

Reconeixem el treball de J. Wesson Ashford, Curtis B. Ashford i els seus col·legues per desenvolupar i validar la tasca i l'eina de reconeixement continu en línia (MemTrax) que s'utilitzen aquí i agraïm als nombrosos pacients amb demència que van contribuir a la investigació fonamental crítica. . També donem les gràcies a Xianbo Zhou i als seus col·legues de SJN Biomed LTD, als seus col·legues i col·laboradors als centres hospitalaris/clíniques, especialment als Drs. M. Luo i M. Zhong, que van ajudar amb el reclutament de participants, la programació de proves i la recollida, l'enregistrament i la gestió frontal de les dades, i els participants voluntaris que van donar el seu valuós temps i es van comprometre a fer les proves i oferir les dades valuoses per avaluar-nos en aquest estudi. Això L'estudi va comptar amb el suport de la MD Scientific Research Programa de la Universitat Mèdica de Kunming (Beca núm. 2017BS028 a XL) i el Programa de Recerca del Departament de Ciència i Tecnologia de Yunnan (Beca núm. 2019FE001 (-222) a XL).

J. Wesson Ashford ha presentat una sol·licitud de patent per a l'ús del paradigma específic de reconeixement continu descrit en aquest document per a general prova de memòria.

MemTrax, LLC és una empresa propietat de Curtis Ashford, i aquesta empresa gestiona el prova de memòria sistema descrit en aquest document.

Divulgacions dels autors disponibles en línia (https://www.j-alz.com/manuscript-disclosures/19-1340r2).

prova de memòria prova de demència prova de pèrdua de memòria prova de pèrdua de memòria a curt termini prova ram la dieta de la ment varietat de llibres prova cognitiva en línia
Curtis Ashford – Coordinador de Recerca Cognitiva

REFERÈNCIES

[1] Associació d'Alzheimer (2016) 2016 Fets de la malaltia d'Alzheimer i figures. Alzheimers Dement 12, 459–509.
[2] Gresenz CR, Mitchell JM, Marrone J, Federoff HJ (2019) Efecte de la fase inicial La malaltia d'Alzheimer sobre els resultats financers de les llars. Health Econ 29, 18–29.
[3] Foster NL , Bondi MW , Das R , Foss M , Hershey LA , Koh S , Logan R , Poole C , Shega JW , Sood A , Thothala N , Wicklund M , Yu M , Bennett A , Wang D (2019) Millora de la qualitat a Neurologia: conjunt de mesura de la qualitat del deteriorament cognitiu lleu. Neurologia 93, 705–713.
[4] Tong T, Thokala P, McMillan B, Ghosh R, Brazier J (2017) Cost efectivitat de l'ús proves de cribratge cognitiu per detectar la demència i el deteriorament cognitiu lleu a l'atenció primària. Int J Geriatr Psychiatry 32, 1392–1400.
[5] Ashford JW, Gere E, Bayley PJ (2011) Mesura de la memòria en grups grans mitjançant una prova de reconeixement continu. J Alzheimers Dis 27, 885–895.
[6] Ashford JW, Tarpin-Bernard F, Ashford CB, Ashford MT (2019) Una tasca de reconeixement continu informatitzat per mesurar la memòria episòdica. J Alzheimers Dis 69, 385–399.
[7] Bergeron MF, Landset S, Tarpin-Bernard F, Ashford CB, Khoshgoftaar TM, Ashford JW (2019) Rendiment de la memòria episòdica en el modelatge d'aprenentatge automàtic per predir la classificació de l'estat de salut cognitiu. J Alzheimers Dis 70, 277–286.
[8] van der Hoek MD , Nieuwenhuizen A , Keijer J , Ashford JW (2019) The Prova MemTrax en comparació amb l'estimació de l'avaluació cognitiva de Montreal del deteriorament cognitiu lleu. J Alzheimers Dis 67, 1045–1054.
[9] Falcone M, Yadav N, Poellabauer C, Flynn P (2013) Utilització de sons vocàlics aïllats per a la classificació de lesions cerebrals traumàtiques lleus. El 2013 IEEE International Conference on Acoustics, Speech and Signal Processing, Vancouver, BC, pàgs. 7577–7581.
[10] Dabek F, Caban JJ (2015) Aprofitant les grans dades per modelar la probabilitat de desenvolupar condicions psicològiques després d'una commoció cerebral. Procedia Comput Sci 53, 265–273.
[11] Climent MT, Pardo J, Munoz-Almaraz FJ, Guerrero MD, Moreno L (2018) Arbre de decisió per a la detecció precoç del deteriorament cognitiu per part dels farmacèutics comunitaris. Front Pharmacol 9, 1232.
[12] Nasreddine ZS, Phillips NA, Bedirian V, Charbonneau S, Whitehead V, Collin I, Cummings JL, Chertkow H (2005) The Montreal Cognitive Assessment, MoCA: Una breu eina de cribratge per a un deteriorament cognitiu lleu. J Am Geriatr Soc 53, 695–699.
[13] Yu J, Li J, Huang X (2012) La versió de Beijing de l'avaluació cognitiva de Montreal com a eina de detecció breu per a un deteriorament cognitiu lleu: un estudi basat en la comunitat. BMC Psychiatry 12, 156.
[14] Chen KL, Xu Y, Chu AQ, Ding D, Liang XN, Nasreddine ZS, Dong Q, Hong Z, Zhao QH, Guo QH (2016) Validació de la versió xinesa de l'avaluació cognitiva de Montreal bàsica per a la detecció d'un deteriorament cognitiu lleu. J Am Geriatr Soc 64, e285–e290.
[15] Carson N, Leach L, Murphy KJ (2018) Un reexamen de les puntuacions de tall de l'avaluació cognitiva de Montreal (MoCA). Int J Geriatr Psychiatry 33, 379–388.
[16] Associació Americana de Psiquiatria (2013) Task Force Manual diagnòstic i estadístic de trastorns mentals: DSM-5™, American Psychiatric Publishing, Inc., Washington, DC.
[17] Python. Python Software Foundation, http://www.python.org, consultat el 15 de novembre de 2019.
[18] R Core Group, R: A language and environment for statistical computing R Foundation for Statistical Computing, Viena, Àustria. https://www.R-project.org/, 2018, consultat el 15 de novembre de 2019.
[19] Benavoli A, Corani G, Demšar J, Zaffalon M (2017) Time for a change: A tutorial for comparing multiple classifiers through Bayesian analysis. J Mach Learn Res 18, 1–36.
[20] Frank E, Hall MA, Witten IH (2016) The WEKA Workbench. En Mineria de dades: eines i tècniques pràctiques d'aprenentatge automàtic, Frank E, Hall MA, Witten IH, Pal CJ, eds. Morgan Kaufmann https://www.cs.waikato.ac.nz/ml/weka/Witten_et_al_2016_appendix.pdf
[21] Bergeron MF, Landset S, Maugans TA, Williams VB, Collins CL, Wasserman EB, Khoshgoftaar TM (2019) Aprenentatge automàtic en el modelatge de la resolució de símptomes de commoció cerebral esportiva de secundària. Med Sci Sports Exercic 51, 1362–1371.
[22] Van Hulse J, Khoshgoftaar TM, Napolitano A (2007) Perspectives experimentals sobre l'aprenentatge a partir de dades desequilibrades. En Actes de la 24a Conferència Internacional sobre Aprenentatge Automàtic, Corvalis, Oregon, EUA, pàgs. 935-942.
[23] Ashford JW, Kolm P, Colliver JA, Bekian C, Hsu LN (1989) Avaluació del pacient d'Alzheimer i l'estat minimental: anàlisi de la corba característica de l'ítem.P. J Gerontol 44, 139–146.
[24] Ashford JW, Jarvik L (1985) Malaltia d'Alzheimer: La plasticitat neuronal predisposa a la degeneració neurofibril·lar axonal? N Engl J Med 313, 388–389.
[25] Jack CR Jr , Therneau TM , Weigand SD , ​​Wiste HJ , Knopman DS , Vemuri P , Lowe VJ , Mielke MM , Roberts RO , Machulda MM , Graff-Radford J , Jones DT , Schwarz CG , Gunter JL , Senjem JL , , Rocca WA, Petersen RC (2019) Prevalència d'entitats de l'espectre d'Alzheimer definides biològicament i clínicament mitjançant l'Institut Nacional sobre l'envelliment-Alzheimer Recerca de l'Associació marc. JAMA Neurol 76, 1174–1183.
[26] Zhou X, Ashford JW (2019) Avenços en instruments de cribratge per a La malaltia d'Alzheimer. Aging Med 2, 88–93.
[27] Weiner MW , Nosheny R , Camacho M , Truran-Sacrey D , Mackin RS , Flenniken D , Ulbricht A , Insel P , Finley S , Fockler J , Veitch D (2018) The Brain Health Registre: una plataforma basada en Internet per a la contractació, l'avaluació i el seguiment longitudinal dels participants per a estudis de neurociència. Dement d'Alzheimer 14, 1063–1076.
[28] Ashford JW, Schmitt FA (2001) Modeling the time-course de Demència d'Alzheimer. Curr Psychiatry Rep 3, 20–28.
[29] Li X , Wang X , Su L , Hu X , Han Y (2019) Sino Longitudinal Study on Cognitive Decline (SILCODE): Protocol per a un estudi observacional longitudinal xinès per desenvolupar models de predicció de risc de conversió a un deteriorament cognitiu lleu en individus amb cognició subjectiva. declivi. BMJ Open 9, e028188.
[30] Tarnanas I , Tsolaki A , Wiederhold M , Wiederhold B , Tsolaki M (2015) Variabilitat de la progressió del biomarcador de cinc anys per a demència de la malaltia d'Alzheimer predicció: un marcador d'activitats instrumentals complexes de la vida diària pot omplir els buits? Alzheimers Dement (Amst) 1, 521–532.
[31] McGurran H , Glenn JM , Madero EN , Bott NT (2019) Prevenció i tractament de la malaltia d'Alzheimer: Mecanismes biològics de l'exercici. J Alzheimers Dis 69, 311–338.
[32] Mendiola-Precoma J , Berumen LC , Padilla K , Garcia-Alcocer G (2016) Therapies for prevenció i tractament de la malaltia d'Alzheimer. Biomed Res Int 2016, 2589276.
[33] Lane CA , Barnes J , Nicholas JM , Sudre CH , Cash DM , Malone IB , Parker TD , Keshavan A , Buchanan SM , Keuss SE , James SN , Lu K , Murray-Smith H , Wong A , Gordon E , Coath W , Modat M, Thomas D, Richards M, Fox NC, Schott JM (2020) Associacions entre el risc vascular a l'edat adulta i la patologia cerebral en la vida tardana: evidència d'una cohort britànica de naixement. JAMA Neurol 77, 175–183.
[34] Seshadri S (2020) Prevenció del pensament demència més enllà de l'edat i les caixes amiloides. JAMA Neurol 77, 160–161.
[35] Maillard P, Seshadri S, Beiser A, Himali JJ, Au R, Fletcher E, Carmichael O, Wolf PA, DeCarli C (2012) Efectes de la pressió arterial sistòlica sobre la integritat de la matèria blanca en adults joves al Framingham Heart Study: A cross -estudi seccionat. Lancet Neurol 11, 1039–1047.
[36] Fink HA, Linskens EJ, Silverman PC, McCarten JR, Hemmy LS, Ouellette JM, Greer NL, Wilt TJ, Butler M (2020) Accuracy of biomarker testing for neuropathologically defined Malaltia d'Alzheimer en persones grans amb demència. Ann Intern Med 172, 669–677.

Afiliacions: [a] SIVOTEC Analytics, Boca Raton, FL, EUA | [b] Departament d'Enginyeria Informàtica i Elèctrica i Ciències de la Computació, Florida Atlantic University, Boca Raton, FL, EUA | [c] SJN Biomed LTD, Kunming, Yunnan, Xina | [d] Centre per Recerca de l'Alzheimer, Washington Institute of Clinical Research, Washington, DC, EUA | [e] Departament de Medicina de Rehabilitació, Primer Hospital Afiliat de la Universitat Mèdica de Kunming, Kunming, Yunnan, Xina | [f] Departament de Neurologia, Hospital Popular de Dehong, Dehong, Yunnan, Xina | [g] Departament de Neurologia, Primer Hospital Afiliat de la Universitat Mèdica de Kunming, Districte de Wuhua, Kunming, Província de Yunnan, Xina | [h] Centre d'estudis de lesions i malalties relacionades amb la guerra, VA Palo Alto Cura de la Salut System, Palo Alto, CA, EUA | [i] Departament de Psiquiatria i Ciències del Comportament, Stanford University School of Medicine, Palo Alto, CA, EUA

Correspondència: [*] Correspondència a: Michael F. Bergeron, PhD, FACSM, SIVOTEC Analytics, Boca Raton Innovation Campus, 4800 T-Rex Avenue, Suite 315, Boca Raton, FL 33431, EUA. Correu electrònic: mbergeron@sivotecanalytics.com.; Xiaolei Liu, MD, Departament de Neurologia, Primer Hospital Afiliat de la Universitat Mèdica de Kunming, 295 Xichang Road, Districte de Wuhua, Kunming, Província de Yunnan 650032, Xina. Correu electrònic: ring@vip.163.com.

Paraules clau: envelliment, La malaltia d'Alzheimer, demència, cribratge massiu