Utilidade de MemTrax e do modelado de aprendizaxe automática na clasificación do deterioro cognitivo leve

Artigo de investigación

Autores: Bergeron, Michael F. | Landset, Sara | Zhou, Xianbo | Ding, Tao | Khoshgoftaar, Taghi M. | Zhao, Feng | Du, Bo | Chen, Xinjie | Wang, Xuan | Zhong, Lianmei | Liu, Xiaolei| Ashford, J. Wesson

DOI: 10.3233/JAD-191340

Xornal: Xornal de Enfermidade de Alzheimer, vol. 77, non. 4, pp 1545-1558, 2020

Abstracto

Antecedentes:

A incidencia e prevalencia xeneralizadas de Alzheimer e o deterioro cognitivo leve (MCI) provocou unha chamada urxente de investigación para validar o cribado e a avaliación cognitiva de detección precoz.

Obxectivo:

O noso obxectivo principal de investigación foi determinar se as métricas de rendemento de MemTrax seleccionadas e as características demográficas relevantes e do perfil de saúde poden utilizarse de forma efectiva en modelos preditivos desenvolvidos con aprendizaxe automática para clasificar a saúde cognitiva (normal fronte a MCI), como indicaría o Avaliación Cognitiva de Montreal (MoCA).

Métodos:

Realizamos un estudo transversal sobre 259 pacientes adultos de neuroloxía, clínica de memoria e medicina interna recrutados entre dous hospitais en China. Cada paciente recibiu o MoCA en chinés e autoadministraron o recoñecemento continuo MemTrax episódico en liña proba de memoria en liña no mesmo día. Construíronse modelos de clasificación preditiva mediante a aprendizaxe automática con validación cruzada de 10 veces e mediuse o rendemento do modelo mediante a curva característica de funcionamento do receptor (AUC, Area Under the Receiver Operating Characteristic Curve). Os modelos creáronse utilizando dúas métricas de rendemento de MemTrax (porcentaxe de correcto, tempo de resposta), xunto coas oito características comúns de historial demográfico e persoal.

Resultados:

Comparando os alumnos en combinacións seleccionadas de puntuacións e limiares de MoCA, Naïve Bayes foi xeralmente o alumno de mellor rendemento cun rendemento xeral de clasificación de 0.9093. Ademais, entre os tres primeiros alumnos, o rendemento xeral da clasificación baseada en MemTrax foi superior usando só as catro funcións clasificadas máis arriba (0.9119) en comparación co uso das 10 funcións comúns (0.8999).

Conclusión:

O rendemento de MemTrax pódese utilizar de forma eficaz nun modelo preditivo de clasificación de aprendizaxe automática aplicación de cribado para detectar o deterioro cognitivo en fase inicial.

Introdución

A incidencia e prevalencia xeneralizadas recoñecidas (aínda que infradiagnosticadas) e a escalada paralela médica, social e pública saúde Os custos e a carga da enfermidade de Alzheimer (AD) e o deterioro cognitivo leve (MCI) son cada vez máis esforzados para todas as partes interesadas [1, 2]. Este escenario angustiante e burguese provocou un chamamento urxente á investigación para validar detección precoz instrumentos de cribado e avaliación cognitivos para unha utilidade práctica regular en contextos persoais e clínicos para pacientes maiores en diversas rexións e poboacións [3]. Estes instrumentos tamén deben proporcionar a tradución perfecta dos resultados informativos aos rexistros sanitarios electrónicos. Os beneficios realizaranse informando aos pacientes e axudando aos médicos a recoñecer antes os cambios significativos e, así, permitir unha estratificación, implementación e seguimento máis rápidos e oportunos dun tratamento individualizado e máis rendible para aqueles que comezan a experimentar. decadencia cognitiva [3, 4].

A ferramenta informatizada MemTrax (https://memtrax.com) é unha avaliación de recoñecemento continuo simple e breve que se pode autoadministrar en liña para medir o rendemento da memoria episódica cronometrada desafiante onde o usuario responde a imaxes repetidas e non a unha presentación inicial [5, 6]. As investigacións recentes e as implicacións prácticas resultantes están comezando a demostrar progresiva e colectivamente a eficacia clínica de MemTrax no cribado precoz de DA e MCI [5-7]. Non obstante, comparación directa da utilidade clínica coa existente saúde cognitiva A avaliación e os estándares convencionais están garantidos para informar a perspectiva profesional e corroborar a utilidade de MemTrax na detección precoz e soporte diagnóstico. van der Hoek et al. [8] comparou as métricas de rendemento de MemTrax seleccionadas (velocidade de reacción e porcentaxe correcta) co estado cognitivo determinado polo Montreal Avaliación Cognitiva (MoCA). Non obstante, este estudo limitouse a asociar estas métricas de rendemento coa caracterización do estado cognitivo (según o determinado por MoCA) e definir os intervalos relativos e os valores de corte. En consecuencia, para ampliar esta investigación e mellorar o rendemento e a eficacia da clasificación, a nosa pregunta principal de investigación foi:

  • Poden as métricas de rendemento de MemTrax seleccionadas por un individuo e os datos demográficos e de saúde relevantes perfil utilizarse de forma eficaz nun modelo preditivo desenvolvido coa aprendizaxe automática para clasificar a saúde cognitiva de forma dicotómica (normal versus MCI), como indicaría a puntuación MoCA dunha persoa?

En segundo lugar, queriamos saber:

  • Incluíndo as mesmas características, pódese aplicar un modelo de aprendizaxe automática baseado no rendemento de MemTrax a un paciente para predecir a gravidade (leve versus grave) dentro de categorías seleccionadas de deterioro cognitivo tal e como determinaría un diagnóstico clínico independente?

A chegada e a evolución da aplicación práctica da intelixencia artificial e da aprendizaxe automática no cribado/detección xa demostraron vantaxes prácticas distintas, co modelado preditivo que guía eficazmente aos médicos na avaliación desafiante da saúde cognitiva/cerebral e na xestión do paciente. No noso estudo, escollemos un enfoque similar no modelado de clasificación MCI e a discriminación da gravidade do deterioro cognitivo, segundo o confirmado polo diagnóstico clínico de tres conxuntos de datos que representan pacientes voluntarios seleccionados e pacientes ambulatorios de dous hospitais en China. Usando o modelado preditivo de aprendizaxe automática, identificamos os alumnos con mellor rendemento das distintas combinacións de conxunto de datos/aprendizaxe e clasificamos as funcións para guiarnos na definición das aplicacións de modelos máis clínicamente prácticas.

As nosas hipóteses foron que se pode utilizar un modelo validado baseado en MemTrax para clasificar a saúde cognitiva de forma dicotómica (normal ou MCI) baseándose no criterio do limiar da puntuación agregada de MoCA, e que un modelo preditivo MemTrax similar pode empregarse eficazmente para discriminar a gravidade en categorías seleccionadas de clínicamente diagnosticado discapacidade cognitiva. Demostrar os resultados previstos sería fundamental para apoiar a eficacia de MemTrax como unha pantalla de detección precoz para o deterioro cognitivo e a clasificación do deterioro cognitivo. A comparación favorable cun pretendido estándar da industria complementada cunha facilidade e rapidez de utilidade moito máis altas serían influentes para axudar aos médicos a adoptar esta ferramenta sinxela, fiable e accesible como unha pantalla inicial para detectar déficits cognitivos en fase precoz (incluíndo prodrómicos). Tal enfoque e utilidade poderían provocar así unha atención e intervención do paciente máis oportunas e mellor estratificadas. Estes coñecementos de futuro e métricas e modelos mellorados tamén poden ser útiles para mitigar ou deter a progresión da demencia, incluídas a EA e as demencias relacionadas coa EA (ADRD).

MATERIAIS E MÉTODOS

Poboación de estudo

Entre xaneiro de 2018 e agosto de 2019, completouse a investigación transversal sobre pacientes recrutados en dous hospitais de China. A administración de MemTrax [5] a persoas de 21 anos ou máis e a recollida e análise deses datos foron revisadas e aprobadas e administradas de acordo cos estándares éticos da Humano Comité de Protección de Asuntos da Universidade de Stanford. MemTrax e todas as demais probas para este estudo global realizáronse segundo a declaración de Helsinki de 1975 e aprobadas pola Xunta de Revisión Institucional do Primeiro Hospital Afiliado da Universidade Médica de Kunming en Kunming, Yunnan, China. Cada usuario recibiu un consentimento informado formulario para ler/revisar e logo aceptar voluntariamente participar.

Os participantes foron recrutados do grupo de pacientes ambulatorios da clínica de neuroloxía do Hospital Yanhua (subconxunto de datos YH) e os clínica de memoria no Primeiro Hospital Afiliado de Kunming Medical Universidade (subconxunto de datos XL) en Beijing, China. Os participantes tamén foron recrutados entre pacientes hospitalizados de neuroloxía (subconxunto de datos XL) e medicina interna (subconxunto de datos KM) no Primeiro Hospital Afiliado da Universidade Médica de Kunming. Os criterios de inclusión incluíron 1) homes e mulleres de polo menos 21 anos de idade, 2) capacidade para falar chinés (mandarín) e 3) capacidade para comprender instrucións verbais e escritas. Os criterios de exclusión foron as deficiencias visuais e motrices que impiden que os participantes completaran o Proba MemTrax, así como a incapacidade de comprender as instrucións específicas da proba.

Versión chinesa de MemTrax

O en liña A plataforma de proba MemTrax foi traducida en chinés (URL: https://www.memtrax.com.cn) e adaptado para ser utilizado a través de WeChat (Shenzhen Tencent Computer Systems Co. LTD., Shenzhen, Guangdong, China) para a autoadministración. Os datos almacenáronse nun servidor na nube (Ali Cloud) situado en China e con licenza de Alibaba (Alibaba Technology Co. Ltd., Hangzhou, Zhejiang, China) por SJN Biomed LTD (Kunming, Yunnan, China). Os detalles específicos sobre MemTrax e os criterios de validez das probas usados ​​aquí foron descritos anteriormente [6]. A proba fíxose sen cargo aos pacientes.

Procedementos de estudo

Para os pacientes hospitalizados e ambulatorios, un cuestionario xeral en papel para recoller información demográfica e persoal como idade, sexo, anos de estudos, ocupación, vivir só ou coa familia, e a historia clínica foi administrada por un membro do equipo de estudo. Despois de completar o cuestionario, administráronse as probas MoCA [12] e MemTrax (primeiro MoCA) con non máis de 20 minutos entre probas. A porcentaxe correcta de MemTrax (MTx-% C), o tempo medio de resposta (MTx-RT) e a data e hora da proba foron rexistradas en papel por un membro do equipo de estudo para cada participante probado. O cuestionario cuberto e os resultados do MoCA foron cargados nunha folla de cálculo de Excel polo investigador que administrou as probas e verificados por un compañeiro antes de gardar os ficheiros de Excel para as análises.

Proba MemTrax

A proba en liña de MemTrax incluíu 50 imaxes (25 únicas e 25 repeticións; 5 conxuntos de 5 imaxes de escenas ou obxectos comúns) mostradas nunha orde pseudoaleatoria específica. O participante tocaría (según as instrucións) o botón Iniciar na pantalla para comezar a proba e comezar a ver a serie de imaxes e volver a tocar a imaxe na pantalla o máis rápido posible sempre que aparecía unha imaxe repetida. Cada imaxe apareceu durante 3 s ou ata que se tocou a imaxe da pantalla, o que provocou a presentación inmediata da seguinte imaxe. Usando o reloxo interno do dispositivo local, MTx-RT para cada imaxe determinouse polo tempo transcorrido desde a presentación da imaxe ata cando o participante tocou a pantalla en resposta a indicar o recoñecemento da imaxe como unha que xa se mostrou. durante a proba. MTx-RT foi gravado para cada imaxe, con 3 s completos rexistrados que indican ningunha resposta. MTx-% C calculouse para indicar a porcentaxe de imaxes repetidas e iniciais ás que o usuario respondeu correctamente (verdadero positivo + verdadeiro negativo dividido por 50). Os detalles adicionais da administración e implementación de MemTrax, a redución de datos, os datos non válidos ou "sen resposta" e as análises de datos primarios descríbense noutro lugar [6].

Explicouse en detalle a proba de MemTrax e proporcionouse unha proba práctica (con imaxes únicas distintas das utilizadas na proba para rexistrar os resultados) aos participantes no ámbito hospitalario. Os participantes nos subconxuntos de datos YH e KM realizaron a proba MemTrax nun teléfono intelixente que se cargaba coa aplicación en WeChat; mentres que un número limitado dos pacientes do subconxunto de datos XL utilizaron un iPad e o resto un teléfono intelixente. Todos os participantes realizaron a proba MemTrax cun investigador do estudo observando discretamente.

Avaliación cognitiva de Montreal

A versión de Pequín do MoCA chinés (MoCA-BC) [13] foi administrada e puntuada por investigadores adestrados segundo as instrucións oficiais da proba. Adecuadamente, o MoCA-BC demostrou ser un fiable proba cognitiva cribado en todos os niveis educativos en adultos maiores chineses [14]. Cada proba tardou entre 10 e 30 minutos en administrarse en función das capacidades cognitivas do participante respectivo.

Modelado de clasificación MoCA

Había un total de 29 funcións utilizables, incluíndo dúas MemTrax métricas de rendemento das probas e 27 características relacionadas coa demografía e a saúde información para cada participante. Utilizouse a puntuación total da proba MoCA de cada paciente como cribado cognitivo "benchmark" para adestrar os nosos modelos preditivos. En consecuencia, como se utilizou MoCA para crear a etiqueta de clase, non puidemos usar a puntuación agregada (ou calquera das puntuacións do subconxunto de MoCA) como función independente. Realizamos experimentos preliminares nos que modelamos (clasificando a saúde cognitiva definida por MoCA) os tres subconxuntos de datos orixinais de hospitais/clínicas individualmente e despois combinamos utilizando todas as características. Non obstante, non se recolleron todos os mesmos elementos de datos en cada unha das catro clínicas que representan os tres subconxuntos de datos; así, moitas das nosas funcións do conxunto de datos combinado (ao utilizar todas as funcións) tiñan unha alta incidencia de valores perdidos. Despois construímos modelos co conxunto de datos combinado utilizando só características comúns que deron como resultado un rendemento de clasificación mellorado. Isto probablemente se explicase pola combinación de ter máis instancias coas que traballar combinando os tres subconxuntos de datos do paciente e ningunha función cunha prevalencia indebida de valores que faltan (só unha característica do conxunto de datos combinado, o tipo de traballo, tiña algún valor perdido, o que afecta só tres casos de pacientes), porque só se incluíron características comúns rexistradas nos tres sitios. En particular, non tiñamos un criterio de rexeitamento específico para cada función que finalmente non se incluíu no conxunto de datos combinado. Non obstante, no noso modelado preliminar de conxuntos de datos combinados, primeiro empregamos todas as funcións de cada un dos tres subconxuntos de datos de pacientes separados. Isto resultou amplamente nun rendemento do modelo que foi mensurablemente menor que o modelado preliminar inicial en cada subconxunto de datos individual. Ademais, mentres que o rendemento de clasificación dos modelos construídos usando todas as funcións foi alentador, en todos os alumnos e esquemas de clasificación, o rendemento mellorou para o dobre de modelos cando se usan só características comúns. De feito, entre os que acabaron sendo os nosos principais alumnos, todos os modelos menos un melloraron ao eliminar funcións non comúns.

O conxunto de datos agregados final (YH, XL e KM combinados) incluíu 259 instancias, cada unha representando un participante único que realizou as probas de MemTrax e MoCA. Había 10 funcións independentes compartidas: Métricas de rendemento de MemTrax: MTx-% C e MTx-RT media; información demográfica e de historia clínica: idade, sexo, anos de estudos, tipo de traballo (colo azul/colo branco), apoio social (se o examinado vive só ou coa familia) e respostas si/non sobre se o usuario tiña un antecedentes de diabetes, hiperlipidemia ou lesión cerebral traumática. Dúas métricas adicionais, a puntuación agregada de MoCA e a puntuación agregada de MoCA axustada para os anos de educación [12], utilizáronse por separado para desenvolver etiquetas de clasificación dependentes, creando así dous esquemas de modelado distintos para aplicar ao noso conxunto de datos combinado. Para cada versión (axustada e non axustada) da puntuación MoCA, os datos foron de novo modelados por separado para a clasificación binaria usando dous limiares de criterios diferentes: o recomendado inicialmente [12] e un valor alternativo utilizado e promovido por outros [8, 15]. No esquema de clasificación de limiar alternativo, considerouse que un paciente tiña unha saúde cognitiva normal se tiña unha puntuación ≥23 na proba MoCA e tiña un MCI se a puntuación era 22 ou inferior; mentres que, no formato de clasificación inicial recomendado, o paciente tiña que puntuar un 26 ou mellor no MoCA para ser etiquetado como con saúde cognitiva normal.

Datos filtrados para o modelado de clasificación MoCA

Examinamos ademais a clasificación MoCA utilizando catro técnicas de clasificación de características de uso común: Chi-cuadrado, Ratio de ganancia, Ganancia de información e incerteza simétrica. Para unha perspectiva provisional, aplicamos os clasificadores a todo o conxunto de datos combinado utilizando cada un dos nosos catro esquemas de modelado. Todos os clasificadores coincidiron nas mesmas características principais, é dicir, a idade, o número de anos de educación e as dúas métricas de rendemento de MemTrax (MTx-% C, media MTx-RT). Despois reconstruímos os modelos utilizando cada técnica de selección de funcións para adestrar os modelos só nas catro características principais (ver Selección de funcións abaixo).

As últimas oito variacións resultantes dos esquemas de modelado de clasificación de puntuación MoCA preséntanse na Táboa 1.

Táboa 1

Resumo das variacións do esquema de modelado utilizados para a clasificación MoCA (Normal Saúde Cognitiva versus MCI)

Esquema de modelizaciónSaúde cognitiva normal (clase negativa)MCI (clase positiva)
Axustado-23 Non filtrado/Filtrado101 (39.0%)158 (61.0%)
Axustado-26 Non filtrado/Filtrado49 (18.9%)210 (81.1%)
Sen axustar-23 Non filtrado/Filtrado92 (35.5%)167 (64.5%)
Sen axustar-26 Non filtrado/Filtrado42 (16.2%)217 (83.8%)

O número e a porcentaxe respectivos do total de pacientes en cada clase difírense polo axuste da puntuación para a educación (axustado ou sen axustar) e o limiar de clasificación (23 ou 26), tal e como se aplica a ambos os conxuntos de funcións (sen filtrar e filtrar).

Modelado de avaliación clínica baseado en MemTrax

Dos nosos tres subconxuntos de datos orixinais (YH, XL, KM), só os pacientes do subconxunto de datos XL foron diagnosticados clínicamente de forma independente por deterioro cognitivo (é dicir, as súas respectivas puntuacións MoCA non se utilizaron para establecer unha clasificación de normal versus deteriorado). En concreto, os pacientes XL foron diagnosticados con calquera dos dous Proba da enfermidade de Alzheimer (DA) ou demencia vascular (VaD). Dentro de cada unha destas categorías de diagnóstico primario, houbo unha designación adicional para MCI. Os diagnósticos de MCI, demencia, trastorno neurocognitivo vascular e trastorno neurocognitivo debido á EA baseáronse en criterios de diagnóstico específicos e distintivos descritos no Manual de diagnóstico e estatística de trastornos mentais: DSM-5 [16]. Tendo en conta estes diagnósticos refinados, aplicáronse por separado dous esquemas de modelado de clasificación ao subconxunto de datos XL para distinguir o nivel de gravidade (grao de deterioro) para cada categoría de diagnóstico principal. Os datos utilizados en cada un destes esquemas de modelado diagnóstico (AD e VaD) incluíron información demográfica e de historial do paciente, así como o rendemento de MemTrax (MTx-% C, media MTx-RT). Cada diagnóstico foi etiquetado como leve se designou MCI; en caso contrario, considerábase grave. Inicialmente consideramos incluír a puntuación MoCA nos modelos de diagnóstico (leve versus grave); pero determinamos que iso anularía o propósito do noso esquema de modelado preditivo secundario. Aquí os alumnos serían adestrados utilizando outras características do paciente dispoñibles para o provedor e as métricas de rendemento da proba MemTrax máis sinxela (en lugar do MoCA) contra o "estándar de ouro" de referencia, o diagnóstico clínico independente. Houbo 69 instancias no conxunto de datos de diagnóstico de AD e 76 instancias de VaD (táboa 2). En ambos os conxuntos de datos, había 12 características independentes. Ademais das 10 características incluídas na clasificación da puntuación MoCA, o historial do paciente tamén incluíu información sobre a historia de hipertensión e ictus.

Táboa 2

Resumo das variacións do esquema de modelado utilizados para a clasificación da gravidade do diagnóstico (leve versus grave)

Esquema de modelizaciónLeve (clase negativa)Grave (clase positiva)
MCI-AD versus AD12 (17.4%)57 (82.6%)
MCI-VaD versus VaD38 (50.0%)38 (50.0%)

O número e a porcentaxe respectivos do total de pacientes en cada clase difírense pola categoría de diagnóstico primario (AD ou VaD).

Estatística

A comparación das características dos participantes e outras características numéricas entre os subconxuntos de datos para cada estratexia de clasificación do modelo (para predicir a saúde cognitiva e a gravidade do diagnóstico de MoCA) realizouse mediante a linguaxe de programación Python (versión 2.7.1) [17]. As diferenzas de rendemento do modelo determináronse inicialmente mediante un ANOVA dun ou dous factores (según corresponda) cun intervalo de confianza do 95% e a proba de diferenza significativa honesta (HSD) de Tukey para comparar as medias de rendemento. Este exame das diferenzas entre as actuacións dos modelos realizouse mediante unha combinación de Python e R (versión 3.5.1) [18]. Empregamos este enfoque (aínda que posiblemente menos que óptimo) só como unha axuda heurística neste etapa inicial para comparar o rendemento do modelo inicial na previsión da posible aplicación clínica. Despois utilizamos a proba de rangos con signos bayesianos usando unha distribución posterior para determinar a probabilidade de diferenzas de rendemento do modelo [19]. Para estas análises, utilizouse o intervalo –0.01, 0.01, o que significa que se dous grupos tiñan unha diferenza de rendemento inferior a 0.01, considerábanse iguais (dentro da rexión de equivalencia práctica) ou, en caso contrario, eran diferentes (un mellor que a outra). Para realizar a comparación bayesiana de clasificadores e calcular estas probabilidades, utilizamos a biblioteca baycomp (versión 1.0.2) para Python 3.6.4.

Modelado preditivo

Construímos modelos preditivos utilizando as dez variacións totais dos nosos esquemas de modelización para predecir (clasificar) o resultado da proba MoCA de cada paciente ou a gravidade do diagnóstico clínico. Aplicáronse todos os alumnos e construíronse os modelos utilizando a plataforma de software de código aberto Weka [20]. Para a nosa análise preliminar, empregamos 10 algoritmos de aprendizaxe de uso común: 5-Nearest Neighbors, dúas versións da árbore de decisión C4.5, regresión loxística, multicapa Perceptron, Naïve Bayes, dúas versións de Random Forest, Radial Basis Function Network e Support Vector. Máquina. Os atributos clave e os contrastes destes algoritmos foron descritos noutro lugar [21] (ver o Apéndice respectivo). Estes escolléronse porque representan unha variedade de tipos diferentes de alumnos e porque demostramos o éxito usándoos en análises anteriores sobre datos similares. Os axustes de hiperparámetros elixíronse a partir da nosa investigación anterior, o que indica que son robustos nunha variedade de datos diferentes [22]. Baseándonos nos resultados da nosa análise preliminar utilizando o mesmo conxunto de datos combinado con características comúns que se utilizaron posteriormente na análise completa, identificamos tres alumnos que proporcionaron un rendemento consistente en todas as clasificacións: regresión loxística, naïve Bayes e soporte vectorial máquina.

Validación cruzada e métrica de rendemento do modelo

Para todos os modelos preditivos (incluídas as análises preliminares), cada modelo foi construído mediante validación cruzada de 10 veces, e o rendemento do modelo foi medido mediante a área baixo a curva característica de funcionamento do receptor (AUC). A validación cruzada comezou coa división aleatoria de cada un dos 10 conxuntos de datos do esquema de modelado en 10 segmentos iguais (dobras), utilizando nove destes segmentos respectivos para adestrar o modelo e o segmento restante para probar. Este procedemento repetiuse 10 veces, utilizando un segmento diferente como conxunto de proba en cada iteración. Despois combináronse os resultados para calcular o resultado/rendemento do modelo final. Para cada combinación de alumno/conxunto de datos, todo este proceso repetiuse 10 veces, dividindo os datos de forma diferente cada vez. Este último paso reduciu o sesgo, garantiu a replicabilidade e axudou a determinar o rendemento global do modelo. En total (para puntuación MoCA e esquemas de clasificación da gravidade do diagnóstico combinados), construíronse 6,600 modelos. Isto incluíu 1,800 modelos sen filtrar (6 esquemas de modelado aplicados ao conxunto de datos × 3 alumnos × 10 execucións × 10 dobras = 1,800 modelos) e 4,800 modelos filtrados (4 esquemas de modelado aplicados ao conxunto de datos × 3 alumnos × 4 técnicas de selección de características × 10 execucións × 10 dobras = 4,800 modelos).

Selección de funcións

Para os modelos filtrados, a selección de características (usando os catro métodos de clasificación de características) realizouse dentro da validación cruzada. Para cada unha das 10 dobras, como un 10 % diferente do conxunto de datos eran os datos de proba, só se utilizaron as catro características principais seleccionadas para cada conxunto de datos de adestramento (é dicir, as outras nove dobras ou o 90 % restante do conxunto de datos completo) para construír os modelos. Non puidemos confirmar cales son as catro funcións que se utilizaron en cada modelo, xa que esa información non se almacena nin está dispoñible na plataforma de modelado que utilizamos (Weka). Non obstante, dada a coherencia na nosa selección inicial de características principais cando se aplicaron os clasificadores a todo o conxunto de datos combinado e a posterior semellanza nos rendementos do modelado, estas mesmas características (idade, anos de educación, MTx-% C e media MTx-RT). ) son probablemente os catro principais utilizados concomitantemente coa selección de funcións dentro do proceso de validación cruzada.

RESULTADOS

As características numéricas dos participantes (incluídas as puntuacións MoCA e as métricas de rendemento de MemTrax) dos conxuntos de datos respectivos para cada estratexia de clasificación do modelo para predecir a saúde cognitiva indicada por MoCA (normal versus MCI) e a gravidade do diagnóstico (leve versus grave) móstranse na táboa 3.

Táboa 3

Características dos participantes, puntuacións MoCA e rendemento de MemTrax para cada estratexia de clasificación do modelo

Estratexia de clasificaciónidadeeducaciónMoCA axustadoMoCA sen axustarMTx-% CMTx-RT
Categoría MoCA61.9 anos (13.1)9.6 anos (4.6)19.2 (6.5)18.4 (6.7)74.8% (15.0)1.4 s (0.3)
Gravidade do diagnóstico65.6 anos (12.1)8.6 anos (4.4)16.7 (6.2)15.8 (6.3)68.3% (13.8)1.5 s (0.3)

Os valores mostrados (media, SD) diferenciados polas estratexias de clasificación do modelado son representativos do conxunto de datos combinado utilizado para predecir a saúde cognitiva indicada por MoCA (MCI fronte ao normal) e do subconxunto de datos XL que só se usa para predecir a gravidade do diagnóstico (leve versus grave).

Para cada combinación de puntuación MoCA (axustado/non axustado) e limiar (26/23), houbo unha diferenza estatística (p = 0.000) en cada comparación por parellas (saúde cognitiva normal fronte a MCI) para a idade, a educación e o rendemento de MemTrax (MTx-% C e MTx-RT). Cada subconxunto de datos do paciente da clase MCI respectiva para cada combinación tiña unha media de entre 9 e 15 anos máis vello, informaba duns cinco anos menos de educación e tiña un rendemento de MemTrax menos favorable para ambas as métricas.

Na Táboa 4 móstranse os resultados do rendemento do modelado preditivo para as clasificacións de puntuación de MoCA utilizando os tres primeiros alumnos, regresión loxística, naïve Bayes e soporte vectorial. aplicados aos conxuntos de datos para todos os esquemas de modelización. Para o conxunto de datos e o modelado sen filtrar, cada un dos valores de datos da Táboa 4 indica o rendemento do modelo baseado na media respectiva AUC derivada dos 100 modelos (10 execucións × 10 veces) construídos para cada combinación de alumno/esquema de modelado, coa respectiva máis alta. alumno en rendemento indicado en negra. Mentres que para o modelado de conxuntos de datos filtrados, os resultados que se indican na Táboa 4 reflicten o rendemento medio global do modelo de 400 modelos para cada alumno que utiliza cada un dos métodos de clasificación de funcións (4 métodos de clasificación de funcións × 10 carreiras × 10 veces).

Táboa 4

Resultados da clasificación de puntuación MoCA dicotómicas (AUC; 0.0–1.0) para cada un dos tres alumnos de mellor rendemento para todos os esquemas de modelado respectivos

Conxunto de funcións usadoPuntuación MoCALimiar de corteRegresión loxísticaBayes inxenuoSoporte de máquina vectorial
Sen filtrar (10 funcións)Axustado230.88620.89130.8695
260.89710.92210.9161
Non axustado230.91030.90850.8995
260.88340.91530.8994
Filtrado (4 funcións)Axustado230.89290.89540.8948
260.91880.92470.9201
Non axustado230.91350.91340.9122
260.91590.92360.9177

Usando variacións do conxunto de funcións, da puntuación MoCA e do limiar de corte da puntuación MoCA, o rendemento máis alto para cada esquema de modelado móstrase en (non necesariamente diferente estatisticamente de todos os demais que non están en para o modelo respectivo).

Comparando os alumnos en todas as combinacións de versións e limiares de puntuación MoCA (axustado/sen axustar e 23/26, respectivamente) no conxunto de datos combinado sen filtrar (é dicir, usando as 10 características comúns), Naïve Bayes foi xeralmente o alumno de mellor rendemento cun rendemento de clasificación de 0.9093. Considerando os tres primeiros alumnos, as probas de rango con signos correlacionados co bayesiano indicaron que a probabilidade (Pr) de Naïve Bayes superando á regresión loxística foi do 99.9 %. Ademais, entre Naïve Bayes e Support Vector Machine, unha probabilidade do 21.0% de equivalencia práctica no rendemento do alumno (polo tanto, unha probabilidade do 79.0% de que Naïve Bayes supere a Support Vector Machine), unida á probabilidade do 0.0% de que a Support Vector Machine funcione mellor, mediblemente. reforza a vantaxe de rendemento de Naïve Bayes. Unha comparación adicional da versión de puntuación MoCA en todos os alumnos/limiares suxeriu unha lixeira vantaxe de rendemento usando puntuacións MoCA non axustadas fronte a axustadas (0.9027 fronte a 0.8971, respectivamente; Pr (non axustado > axustado) = 0.988). Do mesmo xeito, unha comparación do limiar de corte entre todos os alumnos e as versións de puntuación MoCA indicou unha pequena vantaxe no rendemento na clasificación usando 26 como limiar de clasificación fronte a 23 (0.9056 fronte a 0.8942, respectivamente); Pr (26 > 23) = 0.999). Por último, ao examinar o rendemento da clasificación para os modelos que empregan só os resultados filtrados (é dicir, só as catro funcións clasificadas no primeiro posto), Naïve Bayes (0.9143) foi numericamente o alumno con maior rendemento en todas as versións/limiares de puntuación de MoCA. Non obstante, en todas as técnicas de clasificación de funcións combinadas, todos os alumnos con mellor rendemento tiveron un desempeño similar. As probas bayesianas de rango asinado mostraron o 100% de probabilidade de equivalencia práctica entre cada par de alumnos filtrados. Do mesmo xeito que cos datos sen filtrar (usando as 10 funcións comúns), houbo de novo unha vantaxe de rendemento para a versión non axustada da puntuación MoCA (Pr (non axustado > axustado) = 1.000), así como unha vantaxe distinta para o limiar de clasificación de 26 (Pr (26 > 23) = 1.000). En particular, o rendemento medio de cada un dos tres primeiros alumnos en todas as versións/limiares de puntuación de MoCA utilizando só as catro funcións clasificadas máis arriba superou o rendemento medio de calquera alumno nos datos non filtrados. Non é sorprendente que o rendemento de clasificación dos modelos filtrados (usando as catro funcións clasificadas máis arriba) en xeral foi superior (0.9119) aos modelos non filtrados (0.8999), independentemente dos modelos do método de clasificación de funcións que se compararon cos modelos respectivos que usan os 10 modelos comúns. características. Para cada método de selección de características, houbo un 100 % de probabilidade dunha vantaxe de rendemento sobre os modelos sen filtrar.

Cos pacientes considerados para a clasificación da gravidade do diagnóstico de DA, as diferenzas entre grupos (MCI-AD versus AD) por idade (p = 0.004), educación (p = 0.028), puntuación MoCA axustada/non axustada (p = 0.000) e MTx-% C (p = 0.008) foron estatisticamente significativos; mentres que para MTx-RT non foi (p = 0.097). Con aqueles pacientes considerados para a clasificación da gravidade do diagnóstico de VaD, as diferenzas entre grupos (MCI-VaD versus VaD) para a puntuación MoCA axustadas/non axustadas (p = 0.007) e MTx-% C (p = 0.026) e MTx-RT (p = 0.001) foron estatisticamente significativos; mentres que para a idade (p = 0.511) e educación (p = 0.157) non houbo diferenzas significativas entre os grupos.

Os resultados do rendemento do modelado preditivo para as clasificacións de gravidade do diagnóstico utilizando os tres alumnos seleccionados previamente, regresión loxística, naïve Bayes e máquina de vectores de apoio, móstranse na táboa 5. Mentres que os alumnos examinados adicionais demostraron rendementos lixeiramente máis fortes individualmente cunha das dúas categorías de diagnóstico clínico. , os tres alumnos que identificaramos como os máis favorables na nosa modelización anterior ofrecían o rendemento máis consistente cos dous novos esquemas de modelado. Ao comparar os alumnos en cada unha das categorías de diagnóstico principal (AD e VaD), non houbo diferenzas de rendemento de clasificación consistente entre os alumnos para MCI-VaD fronte a VaD, aínda que a Máquina Vectorial de Soporte xeralmente tivo un desempeño máis destacado. Do mesmo xeito, non houbo diferenzas significativas entre os alumnos para a clasificación MCI-AD versus AD, aínda que Naïve Bayes (NB) tiña unha lixeira vantaxe de rendemento sobre a Regresión Loxística (LR) e só unha pluralidade insignificante sobre a Máquina Vectorial de Soporte, cunhas probabilidades do 61.4 %. e 41.7% respectivamente. En ambos conxuntos de datos, houbo unha vantaxe de rendemento global para Support Vector Machine (SVM), con Pr (SVM > LR) = 0.819 e Pr (SVM > NB) = 0.934. O noso rendemento xeral de clasificación en todos os alumnos na predicción da gravidade do diagnóstico no subconxunto de datos XL foi mellor na categoría de diagnóstico de VaD fronte a AD (Pr (VAD > AD) = 0.998).

Táboa 5

Resultados da clasificación de gravidade do diagnóstico clínico dicotómico (AUC; 0.0–1.0) para cada un dos tres alumnos de mellor rendemento para os dous esquemas de modelización respectivos

Esquema de modelizaciónRegresión loxísticaBayes inxenuoSoporte de máquina vectorial
MCI-AD versus AD0.74650.78100.7443
MCI-VaD versus VaD0.80330.80440.8338

O rendemento máis alto para cada esquema de modelado móstrase en (non necesariamente diferente estatisticamente a outros que non están en ).

Conversa

A detección precoz dos cambios na saúde cognitiva é importante utilidade práctica na xestión da saúde persoal e na saúde pública. De feito, tamén é unha alta prioridade nos ámbitos clínicos para os pacientes de todo o mundo. O obxectivo compartido é alertar aos pacientes, coidadores e provedores e solicitar un tratamento e atención lonxitudinal apropiados e rendibles antes para aqueles que comezan a experimentar un deterioro cognitivo. Ao fusionar os nosos tres subconxuntos de datos de hospitais/clínicas, identificamos tres aprendices preferibles (cunha destacada: Naïve Bayes) para construír modelos preditivos utilizando Métricas de rendemento de MemTrax que poderían clasificar de forma fiable o estado de saúde cognitivo dicotómicamente (saúde cognitiva normal ou MCI) como indicaría unha puntuación agregada de MoCA. En particular, o rendemento xeral da clasificación para os tres alumnos mellorou cando os nosos modelos utilizaron só as catro funcións clasificadas máis arriba que abarcaban principalmente estas métricas de rendemento de MemTrax. Ademais, revelamos o potencial demostrado para utilizar os mesmos alumnos e as métricas de rendemento de MemTrax nun esquema de modelado de clasificación de soporte diagnóstico para distinguir a gravidade de dúas categorías de diagnóstico de demencia: AD e VaD.

Proba de memoria é fundamental para a detección precoz da EA [23, 24]. Polo tanto, é oportuno que MemTrax sexa unha aplicación en liña aceptable, atractiva e fácil de implementar. proba de detección de memoria episódica na poboación xeral [6]. A precisión do recoñecemento e os tempos de resposta desta tarefa de rendemento continuo son particularmente reveladores para identificar o deterioro precoz e en evolución e os consecuentes déficits nos procesos neuroplásticos relacionados coa aprendizaxe, a memoria e a cognición. É dicir, os modelos aquí baseados en gran medida nas métricas de rendemento de MemTrax son sensibles e teñen máis probabilidades de revelar con facilidade e cun custo mínimo déficits neuropatolóxicos biolóxicos durante a fase asintomática de transición moito antes dunha perda funcional máis substancial [25]. Ashford et al. examinou detidamente os patróns e comportamentos de precisión da memoria de recoñecemento e tempo de resposta en usuarios en liña que participaron por conta propia con MemTrax [6]. Respectando que estas distribucións son fundamentais no modelado óptimo e no desenvolvemento de aplicacións de atención ao paciente válidas e eficaces, a definición de perfís de recoñecemento e tempo de resposta clínicamente aplicables é esencial para establecer unha referencia fundacional valiosa para a utilidade clínica e de investigación. O valor práctico de MemTrax no cribado da EA para o deterioro cognitivo en fase inicial e o apoio diagnóstico diferencial debe ser examinado máis detidamente no contexto dun contexto clínico onde se poidan considerar as comorbilidades e as capacidades cognitivas, sensoriais e motoras que afectan o rendemento da proba. E para informar a perspectiva profesional e fomentar a utilidade clínica práctica, primeiro é imperativo demostrar a comparación cunha proba de avaliación da saúde cognitiva establecida, aínda que esta última poida verse limitada de forma recoñecible pola engorrosa loxística das probas, os impedimentos educativos e lingüísticos e as influencias culturais [26] . A este respecto, a comparación favorable de MemTrax na eficacia clínica con MoCA que se pretende habitualmente como un estándar da industria é significativa, especialmente cando se sopesa a maior facilidade de utilidade e a aceptación do paciente de MemTrax.

A exploración previa que comparaba MemTrax con MoCA destaca a razón e as probas preliminares que xustifican a nosa investigación de modelado [8]. Non obstante, esta comparación previa só asociou as dúas métricas clave de rendemento de MemTrax que examinamos co estado cognitivo determinado por MoCA e definiu os respectivos intervalos e valores de corte. Afondamos na avaliación da utilidade clínica de MemTrax explorando un enfoque baseado en modelos preditivos que proporcionaría unha consideración máis individualizada doutros parámetros específicos do paciente potencialmente relevantes. En contraste con outros, non atopamos vantaxes no rendemento do modelo mediante unha corrección educativa (axuste) á puntuación MoCA ou ao variar o limiar de puntuación agregada de MoCA discriminante para a saúde cognitiva do 26 ao 23 recomendado orixinalmente [12, 15]. De feito, a vantaxe de rendemento da clasificación favoreceu o uso da puntuación MoCA non axustada e do limiar máis alto.

Puntos clave na práctica clínica

A aprendizaxe automática adoita utilizarse mellor e máis eficaz no modelado preditivo cando os datos son extensos e multidimensionais, é dicir, cando hai numerosas observacións e unha ampla gama concomitante de atributos (contributivos) de alto valor. Non obstante, con estes datos actuais, os modelos filtrados con só catro funcións seleccionadas funcionaron mellor que os que utilizan as 10 funcións comúns. Isto suxire que o noso conxunto de datos hospitalarios agregados non tiña as características clínicamente adecuadas (de alto valor) para clasificar de forma óptima aos pacientes deste xeito. Non obstante, a énfase da clasificación das funcións nas métricas de rendemento clave de MemTrax (MTx-% C e MTx-RT) apoia en gran medida a construción de modelos de detección de déficit cognitivo en fase inicial ao redor desta proba que é sinxela, fácil de administrar, de baixo custo e reveladora con respecto rendemento da memoria, polo menos agora mesmo como pantalla inicial para unha clasificación binaria do estado de saúde cognitivo. Dada a tensión cada vez maior sobre os provedores e os sistemas de saúde, os procesos de selección de pacientes e as aplicacións clínicas deberían desenvolverse adecuadamente con énfase na recollida, seguimento e modelado das características dos pacientes e das métricas de proba que sexan máis útiles, vantaxosas e probadas como eficaces no diagnóstico. e apoio á xestión do paciente.

Dado que as dúas métricas clave de MemTrax son fundamentais para a clasificación MCI, o noso alumno de mellor rendemento (Naïve Bayes) tivo un rendemento preditivo moi alto na maioría dos modelos (AUC superior a 0.90) cunha proporción de verdadeiros positivos e falsos positivos preto ou algo superior a 4. : 1. Unha aplicación clínica translacional que use este alumno capturaría (clasificaría correctamente) con moito a maioría dos que teñen un déficit cognitivo, ao tempo que minimizaría o custo asociado coa clasificación errónea de alguén con saúde cognitiva normal como un déficit cognitivo (falso positivo) ou falta esa clasificación nos que si teñen un déficit cognitivo (falso negativo). Calquera destes escenarios de clasificación errónea poderían impor unha carga psicosocial indebida ao paciente e aos seus coidadores.

Mentres que nas análises preliminar e completa utilizamos os dez alumnos en cada esquema de modelado, centramos os nosos resultados nos tres clasificadores que mostraban o rendemento máis consistente e forte. Isto tamén foi para resaltar, en base a estes datos, os alumnos que anticipadamente funcionarían de forma fiable a un alto nivel nunha aplicación clínica práctica para determinar a clasificación do estado cognitivo. Ademais, debido a que este estudo pretendía ser unha investigación introdutoria sobre a utilidade da aprendizaxe automática no cribado cognitivo e estes retos clínicos oportunos, tomamos a decisión de manter as técnicas de aprendizaxe sinxelas e xeneralizadas, cunha axuste de parámetros mínimo. Apreciamos que este enfoque pode limitar o potencial de capacidades preditivas específicas do paciente máis estreitamente definidas. Así mesmo, mentres que adestrar os modelos utilizando só as características principais (enfoque filtrado) infórmanos máis sobre estes datos (específicos sobre as deficiencias dos datos recollidos e destacando o valor da optimización do tempo e dos recursos clínicos), recoñecemos que é prematuro reducir o alcance dos modelos e, polo tanto, todos (e outras características) deberían ser considerados con futuras investigacións ata ter un perfil máis definitivo de características prioritarias que serían aplicables á poboación ampla. Así, tamén recoñecemos plenamente que serían necesarios datos e optimización máis inclusivos e amplamente representativos destes e outros modelos antes de integralos nunha aplicación clínica eficaz, especialmente para acomodar as comorbilidades que afectan o rendemento cognitivo que deberían ser consideradas nunha avaliación clínica posterior.

A utilidade de MemTrax foi aínda máis edificada pola modelización da gravidade da enfermidade baseada nun diagnóstico clínico separado. Non foi un mellor rendemento de clasificación xeral na predicción da gravidade da VaD (en comparación coa DA). sorprendente dadas as características do perfil do paciente nos modelos específicos de saúde vascular e risco de ictus, é dicir, hipertensión, hiperlipidemia, diabetes e (por suposto) historial de ictus. Aínda que tería sido máis desexable e axeitado ter a mesma avaliación clínica realizada en pacientes emparejados con saúde cognitiva normal para formar aos alumnos con estes datos máis inclusivos. Isto está especialmente garantido, xa que MemTrax está pensado para ser usado principalmente para a detección precoz dun déficit cognitivo e o seguimento posterior do cambio individual. Tamén é plausible que a distribución máis desexable de datos no conxunto de datos VaD contribuíse en parte ao rendemento do modelado comparativamente mellor. O conxunto de datos VaD estaba ben equilibrado entre as dúas clases, mentres que o conxunto de datos de AD con moitos menos pacientes con MCI non o estaba. Especialmente en conxuntos de datos pequenos, incluso algunhas instancias adicionais poden marcar unha diferenza medible. Ambas as perspectivas son argumentos razoables que subxacen ás diferenzas no rendemento do modelado da gravidade da enfermidade. Non obstante, é prematuro atribuír proporcionalmente un rendemento mellorado ás características numéricas do conxunto de datos ou ás características inherentes específicas á presentación clínica en consideración. Non obstante, esta novela demostrou a utilidade dun modelo de clasificación preditiva de MemTrax no papel de apoio diagnóstico clínico ofrece unha perspectiva valiosa e afirma a procura de exames adicionais con pacientes a través do continuo de MCI.

A implementación e utilidade demostrada de MemTrax e destes modelos en China, onde a lingua e a cultura son drasticamente diferentes doutras rexións de utilidade establecida (por exemplo, Francia, Países Baixos e Estados Unidos) [7, 8, 27], subliña aínda máis o potencial. para unha aceptación global xeneralizada e o valor clínico dunha plataforma baseada en MemTrax. Este é un exemplo demostrable de esforzo para a harmonización de datos e o desenvolvemento de normas internacionais prácticas e recursos de modelización para o cribado cognitivo que estean estandarizados e facilmente adaptables para o seu uso en todo o mundo.

Próximos pasos no modelado e aplicación do declive cognitivo

A disfunción cognitiva na EA realmente ocorre nun continuo, non en etapas ou pasos discretos [28, 29]. Non obstante, nesta fase inicial, o noso obxectivo era establecer primeiro a nosa capacidade para construír un modelo que incorporase MemTrax que poida distinguir fundamentalmente "normal" de "non normal". Datos empíricos máis inclusivos (por exemplo, imaxes cerebrais, características xenéticas, biomarcadores, comorbilidades e marcadores funcionais de complexos). actividades que requiren cognitivas control) [30] en diversas rexións globais, poboacións e grupos de idade para adestrar e desenvolver modelos de aprendizaxe automática máis sofisticados (incluíndo un conxunto axeitadamente ponderado) apoiarán un maior grao de clasificación mellorada, é dicir, a capacidade de categorizar grupos de pacientes con MCI en subconxuntos máis pequenos e definitivos ao longo do continuo declive cognitivo. Ademais, os diagnósticos clínicos concomitantes para individuos de poboacións de pacientes con diversidade rexional son esenciais adestrar eficazmente estes modelos máis inclusivos e previsiblemente robustos. Isto facilitará unha xestión estratificada de casos máis específica para aqueles con antecedentes, influencias e perfís cognitivos característicos máis estreitamente definidos e optimizar así o apoio á decisión clínica e a atención ao paciente.

Gran parte da investigación clínica relevante ata a data dirixiuse a pacientes con, polo menos, demencia leve; e, na práctica, con demasiada frecuencia a intervención do paciente só se intenta en fases avanzadas. Non obstante, debido a que o declive cognitivo comeza moito antes de que se cumpran os criterios clínicos para a demencia, unha detección precoz baseada en MemTrax aplicada de forma eficaz podería fomentar a educación adecuada dos individuos sobre a enfermidade e as súas progresións e solicitar intervencións máis tempranas e oportunas. Así, a detección precoz podería apoiar implicacións adecuadas que van desde exercicio, dieta, apoio emocional e mellora da socialización ata intervención farmacolóxica e reforzar os cambios de comportamento e percepción relacionados co paciente que, individualmente ou en conxunto, poderían mitigar ou potencialmente deter a progresión da demencia [31, 32] . Ademais, con eficaz detección precoz, é posible que os individuos e as súas familias consideren ensaios clínicos ou reciban asesoramento e outros servizos sociais para axudar a clarificar as expectativas e intencións e xestionar as tarefas diarias. Unha validación adicional e unha utilidade práctica xeneralizada destes xeitos poderían ser fundamentais para mitigar ou deter a progresión de MCI, AD e ADRD para moitas persoas.

De feito, o extremo inferior da franxa de idade do paciente no noso estudo non representa a poboación de preocupación tradicional pola EA. Non obstante, a idade media de cada grupo utilizado nos esquemas de modelos de clasificación baseados na puntuación/limiar MoCA e na gravidade do diagnóstico (táboa 3) subliña que unha maioría clara (máis do 80 %) ten polo menos 50 anos. Esta distribución é, polo tanto, moi apropiada para a súa xeneralización, apoiando a utilidade destes modelos na poboación que caracteriza aos afectados normalmente por inicio precoz e enfermidades neurocognitivas en crecemento debido á EA e á VaD. Ademais, a evidencia recente e a perspectiva subliñan aqueles factores recoñecidos (por exemplo, hipertensión, obesidade, diabetes e tabaquismo) que poden contribuír a un aumento precoz puntuacións de risco vascular de adultos e de mediana idade e a consecuente lesión cerebral vascular sutil que se desenvolve de forma insidiosa con efectos evidentes incluso en mozos. adultos [33-35]. En consecuencia, a oportunidade de detección inicial máis óptima para a detección precoz etapas de déficits cognitivos e iniciando estratexias eficaces de prevención e intervención para abordar con éxito a demencia xurdirá do exame de factores contribuíntes e indicadores de antecedentes en todo o espectro de idade, incluíndo a primeira idade adulta e, potencialmente, incluso a infancia (observando a relevancia de factores xenéticos como a apolipoproteína E desde a xestación temperá).

Na práctica, os diagnósticos clínicos válidos e os custosos procedementos para imaxes avanzadas, perfís xenéticos e medición de biomarcadores prometedores non sempre están dispoñibles ou mesmo factibles para moitos provedores. Así, en moitos casos, a clasificación inicial do estado de saúde cognitivo xeral pode ter que derivarse de modelos que utilicen outras métricas sinxelas proporcionadas polo paciente (por exemplo, problemas de memoria, medicamentos actuais e limitacións da actividade rutineira) e características demográficas comúns [7]. Rexistros como a Universidade de California Saúde cerebral Rexistro (https://www.brainhealthregistry.org/) [27] e outros cunha maior amplitude inherente de síntomas autoinformados, medidas cualitativas (por exemplo, sono e cognición diaria), medicamentos, estado de saúde e historial, e unha demografía máis detallada será fundamental para desenvolver e validar a aplicación práctica destes modelos máis primitivos na clínica. Ademais, unha proba como MemTrax, que demostrou a súa utilidade para avaliar a función da memoria, pode proporcionar unha estimación substancialmente mellor da patoloxía da EA que os marcadores biolóxicos. Dado que a característica principal da patoloxía da EA é a interrupción da neuroplasticidade e unha perda de sinapses extremadamente complexa, que se manifesta como episódica. disfunción da memoria, unha medida que avalía a memoria episódica pode de feito proporcionan unha mellor estimación da carga patolóxica da DA que os marcadores biolóxicos no paciente vivo [36].

Con todos os modelos preditivos, xa sexan complementados con datos complexos e inclusivos procedentes de tecnoloxía de punta e coñecementos clínicos refinados en múltiples dominios ou limitados a información máis básica e facilmente dispoñible característica dos perfís de pacientes existentes, a vantaxe recoñecida da intelixencia artificial. e a aprendizaxe automática é que os modelos resultantes poden sintetizar e "aprender" de forma indutiva a partir de novos datos e perspectivas relevantes proporcionados pola utilización continua das aplicacións. Tras a transferencia de tecnoloxía práctica, a medida que os modelos aquí (e por desenvolver) se apliquen e se enriquezan con máis casos e datos pertinentes (incluídos pacientes con comorbilidades que poidan presentar un deterioro cognitivo conseguinte), o rendemento da predicción e a clasificación da saúde cognitiva serán máis robustos. resultando nunha utilidade de apoio á decisión clínica máis eficaz. Esta evolución realizarase de xeito máis completo e práctico integrando MemTrax en plataformas personalizadas (orientadas ás capacidades dispoñibles) que os provedores de coidados de saúde poderían utilizar en tempo real na clínica.

Os datos lonxitudinais significativos moi buscados son imprescindibles para a validación e utilidade do modelo MemTrax para o apoio diagnóstico e a atención ao paciente. Ao observar e rexistrar os cambios concomitantes (se os houber) no estado clínico nun intervalo adecuado de normais a través do DCL en fase inicial, pódense adestrar e modificar os modelos para a avaliación e clasificación continuas adecuadas a medida que os pacientes envellecen e sexan tratados. É dicir, a utilidade repetida pode axudar co seguimento lonxitudinal de cambios cognitivos leves, a eficacia da intervención e o mantemento de coidados estratificados informados. Este enfoque aliñase máis estreitamente coa práctica clínica e coa xestión de pacientes e casos.

Limitacións

Apreciamos o reto e o valor da recollida de datos clínicos limpos nunha clínica/hospital controlada. Non obstante, reforzaría o noso modelado se os nosos conxuntos de datos incluían máis pacientes con características comúns. Ademais, específico para o noso modelado de diagnóstico, sería máis desexable e axeitado ter a mesma avaliación clínica realizada en pacientes equipados con saúde cognitiva normal para adestrar aos alumnos. E como subliña o rendemento de clasificación máis alto usando o conxunto de datos filtrado (só as catro funcións clasificadas máis arriba), máis xeral e as medidas/indicadores de saúde cognitiva probablemente mellorarían modelando o rendemento cun maior número de características comúns en todos os pacientes.

Algúns participantes poderían estar experimentando simultáneamente outras enfermidades que poderían provocar deficiencias cognitivas transitorias ou crónicas. Ademais do subconxunto de datos XL onde os pacientes foron clasificados diagnósticamente como con EA ou VaD, os datos de comorbilidade non se recolleron/informaron no grupo de pacientes de YH e a comorbilidade comunicada predominante, con moito, no subconxunto de datos KM foi a diabetes. Non obstante, é discutible que incluír pacientes nos nosos esquemas de modelización con comorbilidades que poidan provocar ou exacerbar un nivel de deficiencia cognitiva e un consecuente menor rendemento de MemTrax sería máis representativo da poboación de pacientes obxectivo do mundo real para este cribado cognitivo precoz máis xeneralizado. e enfoque de modelización. Ao avanzar, o diagnóstico preciso das comorbilidades que poden afectar o rendemento cognitivo é amplamente beneficioso para optimizar os modelos e as aplicacións resultantes de coidado do paciente.

Por último, os pacientes do subconxunto de datos YH e KM utilizaron un teléfono intelixente para facer a proba MemTrax, mentres que un número limitado dos pacientes do conxunto de datos XL utilizaron un iPad e o resto un teléfono intelixente. Isto podería ter introducido unha pequena diferenza relacionada co dispositivo no rendemento de MemTrax para o modelado de clasificación MoCA. Non obstante, as diferenzas (se as hai) en MTx-RT, por exemplo, entre dispositivos probablemente serían insignificantes, especialmente cando cada participante recibe unha proba de "práctica" xusto antes do rendemento da proba gravada. Non obstante, a utilidade destes dous dispositivos portátiles compromete potencialmente a comparación directa e/ou a integración con outros resultados de MemTrax nos que os usuarios respondían ás imaxes repetidas tocando a barra espazadora do teclado do ordenador.

Puntos clave sobre a utilidade de modelado preditivo MemTrax

  • • Os nosos modelos preditivos de alto rendemento que abarcan métricas de rendemento de MemTrax seleccionadas poderían clasificar de forma fiable o estado de saúde cognitivo (saúde cognitiva normal ou MCI) como indicaría a proba MoCA amplamente recoñecida.
  • • Estes resultados admiten a integración das métricas de rendemento de MemTrax seleccionadas nunha aplicación de selección de modelos preditivos de clasificación para o deterioro cognitivo en fase inicial.
  • • O noso modelado de clasificación tamén revelou o potencial de utilizar o rendemento de MemTrax en aplicacións para distinguir a gravidade do diagnóstico de demencia.

Estes novos descubrimentos establecen evidencias definitivas que apoian a utilidade da aprendizaxe automática na construción de modelos de clasificación robustos e mellorados baseados en MemTrax para o apoio diagnóstico na xestión eficaz de casos clínicos e na atención ao paciente para persoas que experimentan deterioro cognitivo.

AGRADECEMENTOS

Recoñecemos o traballo de J. Wesson Ashford, Curtis B. Ashford e os seus compañeiros para desenvolver e validar a tarefa e a ferramenta de recoñecemento continuo en liña (MemTrax) utilizadas aquí e agradecemos aos numerosos pacientes con demencia que contribuíron á investigación fundamental fundamental. . Tamén agradecemos a Xianbo Zhou e aos seus colegas de SJN Biomed LTD, aos seus colegas e colaboradores nos hospitais/clínicas, especialmente aos Drs. M. Luo e M. Zhong, que axudaron coa contratación de participantes, a programación de probas e a recompilación, gravación e xestión frontal dos datos, e os participantes voluntarios que doaron o seu valioso tempo e se comprometeron a realizar as probas e proporcionar os datos valiosos para que avaliemos neste estudo. Isto O estudo foi apoiado en parte polo MD Scientific Research Programa da Universidade Médica de Kunming (Boca no 2017BS028 a XL) e o Programa de Investigación do Departamento de Ciencia e Tecnoloxía de Yunnan (Boca no 2019FE001 (-222) a XL).

J. Wesson Ashford presentou unha solicitude de patente para o uso do paradigma específico de recoñecemento continuo descrito neste documento para proba de memoria.

MemTrax, LLC é unha empresa propiedade de Curtis Ashford, e esta empresa está a xestionar proba de memoria sistema descrito neste documento.

Divulgacións dos autores dispoñibles en liña (https://www.j-alz.com/manuscript-disclosures/19-1340r2).

proba de memoria proba de demencia proba de perda de memoria proba de perda de memoria a curto prazo proba de memoria RAM proba a dieta da mente variedade de libros proba cognitiva en liña
Curtis Ashford – Coordinador de Investigación Cognitiva

Referencias

[1] Alzheimer's Association (2016) 2016 Datos da enfermidade de Alzheimer e figuras. Alzheimers Dement 12, 459–509.
[2] Gresenz CR, Mitchell JM, Marrone J, Federoff HJ (2019) Efecto da fase inicial Alzheimer sobre os resultados financeiros dos fogares. Health Econ 29, 18–29.
[3] Foster NL , Bondi MW , Das R , Foss M , Hershey LA , Koh S , Logan R , Poole C , Shega JW , Sood A , Thothala N , Wicklund M , Yu M , Bennett A , Wang D (2019) Mellora da calidade en Neuroloxía: conxunto de medición da calidade do deterioro cognitivo leve. Neuroloxía 93, 705–713.
[4] Tong T , Thokala P , McMillan B , Ghosh R , Brazier J (2017) Cost effectiveness of using probas de cribado cognitivo para detectar demencia e deterioro cognitivo leve en atención primaria. Int J Geriatr Psychiatry 32, 1392–1400.
[5] Ashford JW, Gere E, Bayley PJ (2011) Medición da memoria en grupos grandes mediante unha proba de recoñecemento continuo. J Alzheimers Dis 27, 885–895.
[6] Ashford JW, Tarpin-Bernard F, Ashford CB, Ashford MT (2019) Unha tarefa computarizada de recoñecemento continuo para medir a memoria episódica. J Alzheimers Dis 69, 385–399.
[7] Bergeron MF, Landset S, Tarpin-Bernard F, Ashford CB, Khoshgoftaar TM, Ashford JW (2019) Rendemento da memoria episódica no modelado de aprendizaxe automática para predecir a clasificación do estado de saúde cognitivo. J Alzheimers Dis 70, 277–286.
[8] van der Hoek MD , Nieuwenhuizen A , Keijer J , Ashford JW (2019) The Proba MemTrax en comparación coa estimación da avaliación cognitiva de Montreal do deterioro cognitivo leve. J Alzheimers Dis 67, 1045–1054.
[9] Falcone M, Yadav N, Poellabauer C, Flynn P (2013) Usando sons vocálicos illados para a clasificación da lesión cerebral traumática leve. En 2013 IEEE International Conference on Acoustics, Speech and Signal Processing, Vancouver, BC, páxinas 7577–7581.
[10] Dabek F, Caban JJ (2015) Aproveitando grandes datos para modelar a probabilidade de desenvolver condicións psicolóxicas despois dunha conmoción cerebral. Procedia Comput Sci 53, 265–273.
[11] Climent MT, Pardo J, Muñoz-Almaraz FJ, Guerrero MD, Moreno L (2018) Árbore de decisión para a detección precoz do deterioro cognitivo por parte dos farmacéuticos comunitarios. Front Pharmacol 9, 1232.
[12] Nasreddine ZS, Phillips NA, Bedirian V, Charbonneau S, Whitehead V, Collin I, Cummings JL, Chertkow H (2005) The Montreal Cognitive Assessment, MoCA: A brief screening tool for mild cognitive impairment. J Am Geriatr Soc 53, 695–699.
[13] Yu J, Li J, Huang X (2012) A versión de Pequín da avaliación cognitiva de Montreal como unha ferramenta de detección breve para o deterioro cognitivo leve: un estudo baseado na comunidade. BMC Psychiatry 12, 156.
[14] Chen KL , Xu Y , Chu AQ , Ding D , Liang XN , Nasreddine ZS , Dong Q , Hong Z , Zhao QH , Guo QH (2016) Validación da versión chinesa da avaliación cognitiva de Montreal básica para a detección do deterioro cognitivo leve. J Am Geriatr Soc 64, e285–e290.
[15] Carson N, Leach L, Murphy KJ (2018) Un reexame das puntuacións de corte da Avaliación Cognitiva de Montreal (MoCA). Int J Geriatr Psychiatry 33, 379–388.
[16] Asociación Americana de Psiquiatría (2013) Task Force Manual diagnóstico e estatístico de trastornos mentais: DSM-5™, American Psychiatric Publishing, Inc., Washington, DC.
[17] Python. Python Software Foundation, http://www.python.org, consultado o 15 de novembro de 2019.
[18] R Core Group, R: A language and environment for statistical computing R Foundation for Statistical Computing, Viena, Austria. https://www.R-project.org/, 2018, consultado o 15 de novembro de 2019.
[19] Benavoli A, Corani G, Demšar J, Zaffalon M (2017) Time for a change: A tutorial for comparing multiple classifiers through Bayesian analysis. J Mach Learn Res 18, 1–36.
[20] Frank E, Hall MA, Witten IH (2016) The WEKA Workbench. En Minería de datos: ferramentas e técnicas prácticas de aprendizaxe automática, Frank E, Hall MA, Witten IH, Pal CJ, eds. Morgan Kaufmann https://www.cs.waikato.ac.nz/ml/weka/Witten_et_al_2016_appendix.pdf
[21] Bergeron MF, Landset S, Maugans TA, Williams VB, Collins CL, Wasserman EB, Khoshgoftaar TM (2019) Aprendizaxe automática na modelización da resolución de síntomas de conmoción cerebral do deporte da escola secundaria. Med Sci Sports Exercice 51, 1362–1371.
[22] Van Hulse J, Khoshgoftaar TM, Napolitano A (2007) Perspectivas experimentais sobre a aprendizaxe a partir de datos desequilibrados. En Actas da 24ª Conferencia Internacional sobre Aprendizaxe Automática, Corvalis, Oregón, EUA, pp. 935-942.
[23] Ashford JW, Kolm P, Colliver JA, Bekian C, Hsu LN (1989) Avaliación do paciente de Alzheimer e o estado minimental: análise da curva característica do elemento.P. J Gerontol 44, 139–146.
[24] Ashford JW, Jarvik L (1985) Enfermidade de Alzheimer: A plasticidade neuronal predispón á dexeneración neurofibrilar axonal? N Engl J Med 313, 388–389.
[25] Jack CR Jr , Therneau TM , Weigand SD , ​​Wiste HJ , Knopman DS , Vemuri P , Lowe VJ , Mielke MM , Roberts RO , Machulda MM , Graff-Radford J , Jones DT , Schwarz CG , Gunter JL , Senjem JL , , Rocca WA, Petersen RC (2019) Prevalencia de entidades do espectro de Alzheimer definidas bioloxicamente e clínicamente usando o Instituto Nacional do Envellecemento-Alzheimer Asociación de Investigación marco. JAMA Neurol 76, 1174–1183.
[26] Zhou X, Ashford JW (2019) Avances en instrumentos de cribado para Alzheimer. Aging Med 2, 88–93.
[27] Weiner MW , Nosheny R , Camacho M , Truran-Sacrey D , Mackin RS , Flenniken D , Ulbricht A , Insel P , Finley S , Fockler J , Veitch D (2018) The Saúde cerebral Rexistro: unha plataforma baseada en Internet para a contratación, avaliación e seguimento lonxitudinal de participantes para estudos de neurociencia. Alzheimers Dement 14, 1063–1076.
[28] Ashford JW, Schmitt FA (2001) Modeling the time-course de Demencia de Alzheimer. Curr Psiquiatría Rep 3, 20-28.
[29] Li X , Wang X , Su L , Hu X , Han Y (2019) Sino Longitudinal Study on Cognitive Decline (SILCODE): Protocolo para un estudo observacional lonxitudinal chinés para desenvolver modelos de predición de risco de conversión a un deterioro cognitivo leve en individuos con cognitivo subxectivo. declive. BMJ Open 9, e028188.
[30] Tarnanas I , Tsolaki A , Wiederhold M , Wiederhold B , Tsolaki M (2015) Variabilidade de progresión de biomarcadores de cinco anos para Demencia da enfermidade de Alzheimer predición: un marcador de actividades instrumentais complexas da vida diaria pode cubrir as lagoas? Alzheimers Dement (Amst) 1, 521–532.
[31] McGurran H , Glenn JM , Madero EN , Bott NT (2019) Prevención e tratamento da enfermidade de Alzheimer: Mecanismos biolóxicos do exercicio. J Alzheimers Dis 69, 311–338.
[32] Mendiola-Precoma J, Berumen LC, Padilla K, García-Alcocer G (2016) Therapies for prevención e tratamento da enfermidade de Alzheimer. Biomed Res Int 2016, 2589276.
[33] Lane CA , Barnes J , Nicholas JM , Sudre CH , Cash DM , Malone IB , Parker TD , Keshavan A , Buchanan SM , Keuss SE , James SN , Lu K , Murray-Smith H , Wong A , Gordon E , Coath W , Modat M , Thomas D , Richards M , Fox NC , Schott JM (2020) Asociacións entre o risco vascular na idade adulta e a patoloxía cerebral no final da vida: evidencia dunha cohorte de nacemento británica. JAMA Neurol 77, 175–183.
[34] Seshadri S (2020) Prevención do pensamento de demencia máis aló da idade e das caixas de amiloide. JAMA Neurol 77, 160–161.
[35] Maillard P, Seshadri S, Beiser A, Himali JJ, Au R, Fletcher E, Carmichael O, Wolf PA, DeCarli C (2012) Effects of systolic blood pressure on white-matter integrity in young adults in the Framingham Heart Study: A cross -Estudo seccional. Lancet Neurol 11, 1039–1047.
[36] Fink HA, Linskens EJ, Silverman PC, McCarten JR, Hemmy LS, Ouellette JM, Greer NL, Wilt TJ, Butler M (2020) Accuracy of biomarker testing for neuropathologically defined Enfermidade de Alzheimer en adultos maiores con demencia. Ann Intern Med 172, 669–677.

Afiliacións: [a] SIVOTEC Analytics, Boca Raton, FL, USA | [b] Departamento de Enxeñaría Informática e Eléctrica e Ciencias da Computación, Florida Atlantic University, Boca Raton, FL, EUA | [c] SJN Biomed LTD, Kunming, Yunnan, China | [d] Centro para Investigación do Alzheimer, Instituto de Investigación Clínica de Washington, Washington, DC, EUA | [e] Departamento de Medicina de Rehabilitación, Primeiro Hospital Afiliado da Universidade Médica de Kunming, Kunming, Yunnan, China | [f] Departamento de Neuroloxía, Hospital Popular de Dehong, Dehong, Yunnan, China | [g] Departamento de Neuroloxía, Primeiro Hospital Afiliado da Universidade Médica de Kunming, Distrito de Wuhua, Kunming, Provincia de Yunnan, China | [h] Centro de estudos de feridas e enfermidades relacionadas coa guerra, VA Palo Alto Asistencia médica System, Palo Alto, CA, EUA | [i] Departamento de Psiquiatría e Ciencias do Comportamento, Facultade de Medicina da Universidade de Stanford, Palo Alto, CA, EUA

Correspondencia: [*] Correspondencia a: Michael F. Bergeron, PhD, FACSM, SIVOTEC Analytics, Boca Raton Innovation Campus, 4800 T-Rex Avenue, Suite 315, Boca Raton, FL 33431, USA. Correo electrónico: mbergeron@sivotecanalytics.com.; Xiaolei Liu, MD, Departamento de Neuroloxía, Primeiro Hospital Afiliado da Universidade Médica de Kunming, 295 Xichang Road, Distrito de Wuhua, Kunming, Provincia de Yunnan 650032, China. Correo electrónico: ring@vip.163.com.

Palabras clave: envellecemento, Alzheimer, demencia, cribado masivo