Полезност на MemTrax и моделиране на машинно обучение при класифициране на леко когнитивно увреждане

научна статия

Автори: Бержерон, Майкъл Ф. | Ландсет, Сара | Джоу, Сианбо | Динг, Тао | Khoshgoftaar, Taghi M. | Джао, Фън | Ду, Бо | Чен, Синджи | Уанг, Суан | Zhong, Lianmei | Лиу, Сяолей| Ашфорд, Дж. Уесън

DOI: 10.3233/JAD-191340

Вестник: Вестник на Болестта на Алцхаймер, vol. 77, не. 4, стр. 1545-1558, 2020

абстрактен

Предистория:

Широко разпространената честота и разпространение на болест на Алцхаймер и леко когнитивно увреждане (MCI) предизвика спешен призив за изследване за валидиране на когнитивния скрининг и оценка за ранно откриване.

Обективен:

Нашата основна изследователска цел беше да определим дали избраните показатели за ефективност на MemTrax и съответните демографски и характеристики на здравния профил могат да бъдат ефективно използвани в прогнозни модели, разработени с машинно обучение за класифициране на когнитивното здраве (нормално срещу MCI), както би било посочено от Когнитивна оценка в Монреал (MoCA).

Методи:

Проведохме напречно проучване на 259 възрастни пациенти по неврология, клиника по памет и вътрешна медицина, наети от две болници в Китай. На всеки пациент беше даден MoCA на китайски език и той сам си приложи непрекъснатото разпознаване MemTrax онлайн епизодично онлайн тест на паметта На същия ден. Моделите за предсказуема класификация бяха изградени с помощта на машинно обучение с 10-кратно кръстосано валидиране и производителността на модела беше измерена с помощта на площта под кривата на работната характеристика на приемника (AUC). Моделите са изградени с помощта на два показателя за ефективност на MemTrax (процент правилен, време за реакция), заедно с осемте общи характеристики за демографски данни и лична история.

Резултати:

Сравнявайки обучаемите в избрани комбинации от резултати и прагове на MoCA, Naive Bayes като цяло беше най-добре представилият се обучаем с общо представяне на класификацията от 0.9093. Освен това, сред трима най-добри учащи, представянето на базираната на MemTrax класификация като цяло е по-добро, като се използват само най-високо класираните четири функции (0.9119) в сравнение с използването на всички 10 общи функции (0.8999).

Заключение:

Производителността на MemTrax може да се използва ефективно в предсказуем модел за класификация на машинно обучение приложение за скрининг за откриване на ранен стадий на когнитивно увреждане.

ВЪВЕДЕНИЕ

Признатата (макар и недостатъчно диагностицирана) широко разпространена заболеваемост и разпространение и паралелно нарастваща медицинска, социална и обществена здраве разходите и тежестта на болестта на Алцхаймер (AD) и лекото когнитивно увреждане (MCI) са все по-натоварващи за всички заинтересовани страни [1, 2]. Този тревожен и бурно развиващ се сценарий предизвика спешен призив за изследване, което да потвърди ранно откриване когнитивен скрининг и инструменти за оценка за редовна практическа полза в лични и клинични условия за по-възрастни пациенти в различни региони и популации [3]. Тези инструменти трябва също така да осигуряват безпроблемно превеждане на информативни резултати в електронни здравни досиета. Ползите ще бъдат реализирани чрез информиране на пациентите и подпомагане на лекарите при по-ранното разпознаване на значителни промени и по този начин ще се даде възможност за по-бърза и навременна стратификация, прилагане и проследяване на подходящо индивидуализирано и по-рентабилно лечение и грижи за пациентите за тези, които започват да изпитват когнитивен спад [3, 4].

Компютъризираният инструмент MemTrax (https://memtrax.com) е проста и кратка непрекъсната оценка на разпознаването, която може да се самоадминистрира онлайн за измерване на предизвикателна времева епизодична производителност на паметта, при която потребителят реагира на повтарящи се изображения, а не на първоначално представяне [5, 6]. Последните изследвания и произтичащите от тях практически последици започват прогресивно и колективно да демонстрират клиничната ефикасност на MemTrax при ранен скрининг на AD и MCI [5–7]. Въпреки това, директно сравнение на клиничната полезност със съществуващата когнитивно здраве оценката и конвенционалните стандарти е гарантирано да информира професионалната гледна точка и да потвърждава помощната програма MemTrax при ранно откриване и диагностична поддръжка. ван дер Хоек и др. [8] сравнява избрани показатели за ефективност на MemTrax (скорост на реакция и процент правилни) с когнитивния статус, определен от Монреал Когнитивна оценка (MoCA). Въпреки това, това проучване беше ограничено до свързване на тези показатели за ефективност с характеризиране на когнитивния статус (както е определено от MoCA) и определяне на относителните диапазони и граничните стойности. Съответно, за да разширим това разследване и да подобрим производителността и ефикасността на класификацията, основният ни изследователски въпрос беше:

  • Могат ли избраните от индивида показатели за ефективност на MemTrax и съответните демографски данни и здраве профил характеристиките да бъдат използвани ефективно в предсказуем модел, разработен с машинно обучение, за да класифицира когнитивното здраве дихотомно (нормално спрямо MCI), както би било посочено от резултата на MoCA?

На второ място, ние искахме да знаем:

  • Включвайки същите функции, може ли моделът за машинно обучение, базиран на производителността на MemTrax, да бъде ефективно приложен към пациент за прогнозиране на тежестта (лека срещу тежка) в рамките на избрани категории когнитивно увреждане, както би било определено от независима клинична диагноза?

Появата и развиващото се практическо приложение на изкуствения интелект и машинното обучение при скрининг/откриване вече показаха различни практически предимства, като прогнозното моделиране ефективно насочва клиницистите в предизвикателната оценка на когнитивното/мозъчното здраве и управлението на пациентите. В нашето проучване избрахме подобен подход при моделирането на класификацията на MCI и дискриминацията на тежестта на когнитивното увреждане, както е потвърдено от клинична диагноза от три набора от данни, представляващи избрани доброволци в стационарни и амбулаторни пациенти от две болници в Китай. Използвайки предсказуемо моделиране на машинно обучение, ние идентифицирахме най-добре представящите се обучаеми от различните комбинации набор от данни/обучаем и класирахме характеристиките, за да ни насочат при дефинирането на клинично най-практичните приложения на модела.

Нашите хипотези бяха, че валидиран модел, базиран на MemTrax, може да се използва за дихотомно класифициране на когнитивното здраве (нормално или MCI) въз основа на критерия за праг на общия резултат на MoCA и че подобен предсказуем модел на MemTrax може да бъде използван ефективно за разграничаване на тежестта в избрани категории на клинично диагностициран когнитивно увреждане. Демонстрирането на очакваните резултати би било инструментално в подкрепа на ефикасността на MemTrax като екран за ранно откриване на когнитивен спад и класификация на когнитивните увреждания. Благоприятното сравнение с предполагаем стандарт в индустрията, допълнено от много по-голяма лекота и бързина на полезност, би помогнало на клиницистите да възприемат този прост, надежден и достъпен инструмент като първоначален екран за откриване на когнитивни дефицити в ранен (включително продромален) стадий. По този начин такъв подход и полезност биха могли да подтикнат към по-навременна и по-добре стратифицирана грижа и интервенция за пациентите. Тези далновидни прозрения и подобрени показатели и модели също могат да бъдат полезни за смекчаване или спиране на прогресията на деменция, включително AD и деменции, свързани с AD (ADRD).

МАТЕРИАЛИ И МЕТОДИ

Проучване на популацията

Между януари 2018 г. и август 2019 г. беше завършено кръстосано изследване на пациенти, наети от две болници в Китай. Администрирането на MemTrax [5] на лица на възраст 21 и повече години и събирането и анализирането на тези данни бяха прегледани и одобрени от и администрирани в съответствие с етичните стандарти на Човешки Комитет за защита на предмета на Станфордския университет. MemTrax и всички други тестове за това цялостно проучване са извършени съгласно декларацията от Хелзинки от 1975 г. и са одобрени от Институционалния съвет за преглед на Първата свързана болница на Медицинския университет Кунминг в Кунминг, Юнан, Китай. На всеки потребител беше предоставена информирано съгласие форма, за да прочетете/прегледате и след това доброволно да се съгласите да участвате.

Участниците бяха избрани от набора от амбулаторни пациенти в неврологичната клиника в болница Янхуа (поднабор от данни YH) и клиника за памет в Първата свързана болница на Kunming Medical Университет (XL поднабор от данни) в Пекин, Китай. Участниците също бяха наети от пациенти по неврология (XL поднабор от данни) и вътрешни болести (KM поднабор от данни) в Първата свързана болница на Медицинския университет в Кунминг. Критериите за включване включват 1) мъже и жени на поне 21 години, 2) способност да говорят китайски (мандарин) и 3) способност да разбират устни и писмени указания. Критериите за изключване са зрителни и двигателни увреждания, които не позволяват на участниците да завършат MemTrax тест, както и невъзможността да се разберат специфичните инструкции на теста.

Китайска версия на MemTrax

Онлайн игра Тестовата платформа MemTrax беше преведена на китайски (URL: https://www.memtrax.com.cn) и допълнително адаптиран да се използва чрез WeChat (Shenzhen Tencent Computer Systems Co. LTD., Шенжен, Гуангдонг, Китай) за самостоятелно администриране. Данните се съхраняват на облачен сървър (Ali Cloud), разположен в Китай и лицензиран от Alibaba (Alibaba Technology Co. Ltd., Hangzhou, Zhejiang, Китай) от SJN Biomed LTD (Kunming, Yunnan, Китай). Конкретни подробности за MemTrax и критериите за валидност на теста, използвани тук, са описани по-рано [6]. Тестът беше предоставен безплатно на пациентите.

Процедури за проучване

За болничните и амбулаторните пациенти, общ въпросник на хартиен носител за събиране на демографска и лична информация като възраст, пол, години на образование, професия, живея сам или със семейството, а медицинската история е администрирана от член на екипа на изследването. След попълване на въпросника бяха приложени тестовете MoCA [12] и MemTrax (първо MoCA) с не повече от 20 минути между тестовете. MemTrax процент правилен (MTx-% C), средно време за отговор (MTx-RT) и дата и час на тестването бяха записани на хартия от член на изследователския екип за всеки тестван участник. Попълненият въпросник и резултатите от MoCA бяха качени в електронна таблица на Excel от изследователя, който администрира тестовете, и проверени от колега, преди файловете на Excel да бъдат запазени за анализи.

MemTrax тест

Онлайн тестът на MemTrax включва 50 изображения (25 уникални и 25 повторения; 5 набора от 5 изображения на обичайни сцени или обекти), показани в определен псевдослучаен ред. Участникът (по инструкции) докосва бутона Старт на екрана, за да започне теста и да започне да гледа серията изображения и отново да докосне изображението на екрана възможно най-бързо, когато се появи повтаряща се картина. Всяко изображение се появява за 3 s или докато изображението на екрана бъде докоснато, което подтиква незабавно представяне на следващата снимка. Използвайки вътрешния часовник на локалното устройство, MTx-RT за всяко изображение беше определено от изминалото време от представянето на изображението до момента, в който участникът докосна екрана в отговор на посочване на разпознаване на изображението като вече показано по време на теста. MTx-RT беше записан за всяко изображение, със записани пълни 3 s, показващи липса на отговор. MTx-% C беше изчислен, за да покаже процента на повторение и първоначални изображения, на които потребителят е отговорил правилно (истинско положително + истинско отрицателно, делено на 50). Допълнителни подробности за администрирането и внедряването на MemTrax, намаляването на данните, невалидните данни или данните „без отговор“ и анализите на първичните данни са описани другаде [6].

Тестът MemTrax беше обяснен подробно и на участниците в болнична обстановка беше предоставен практически тест (с уникални изображения, различни от тези, използвани в теста за записване на резултатите). Участниците в поднаборите от данни YH и KM направиха теста MemTrax на смартфон, който беше зареден с приложението на WeChat; като има предвид, че ограничен брой пациенти с XL поднабор от данни са използвали iPad, а останалите са използвали смартфон. Всички участници взеха теста MemTrax под ненатрапчиво наблюдение на изследовател.

Монреалска когнитивна оценка

Пекинската версия на китайския MoCA (MoCA-BC) [13] беше администрирана и оценена от обучени изследователи съгласно официалните инструкции за теста. Подходящо е, че MoCA-BC е доказано надежден тест за когнитивен скрининг във всички образователни нива на китайски възрастни възрастни [14]. Всеки тест отне около 10 до 30 минути за администриране въз основа на когнитивните способности на съответния участник.

Класификационно моделиране на MoCA

Имаше общо 29 използваеми функции, включително две MemTrax тестови показатели за ефективност и 27 характеристики, свързани с демографски и здравни данни информация за всеки участник. Общият резултат от MoCA теста на всеки пациент беше използван като когнитивен скрининг „бенчмарк“ за обучение на нашите прогнозни модели. Съответно, тъй като MoCA беше използван за създаване на етикета на класа, не можахме да използваме общия резултат (или който и да е от резултатите на подгрупата на MoCA) като независима характеристика. Проведохме предварителни експерименти, в които моделирахме (класифицирайки когнитивното здраве, дефинирано от MoCA) оригиналните три поднабора от данни за болница/клиника(и) поотделно и след това комбинирахме, използвайки всички функции. Въпреки това, всички едни и същи елементи от данни не бяха събрани във всяка от четирите клиники, представляващи трите поднабора от данни; по този начин, много от нашите функции в комбинирания набор от данни (когато се използват всички функции) имаха висока честота на липсващи стойности. След това изградихме модели с комбинирания набор от данни, използвайки само общи характеристики, което доведе до подобрена ефективност на класификацията. Това вероятно се обяснява с комбинация от наличие на повече екземпляри, с които да се работи чрез комбиниране на трите поднабора от данни за пациенти и липса на характеристики с неоправдано преобладаване на липсващи стойности (само една характеристика в комбинирания набор от данни, тип работа, имаше липсващи стойности, засягащи само три случая на пациенти), тъй като бяха включени само общи характеристики, записани и на трите места. Трябва да се отбележи, че нямахме конкретен критерий за отхвърляне за всяка функция, която в крайна сметка не беше включена в комбинирания набор от данни. Въпреки това, в нашето предварително комбинирано моделиране на набор от данни, първо използвахме всички функции от всеки от трите отделни поднабора от данни за пациенти. Това до голяма степен доведе до производителност на модела, която беше измеримо по-ниска от първоначалното предварително моделиране на всеки отделен поднабор от данни. Нещо повече, докато представянето на класификацията на моделите, изградени с помощта на всички функции, беше окуражаващо, във всички обучаеми и схеми за класификация, представянето се подобри за два пъти повече модели, когато се използват само общи характеристики. Всъщност, сред тези, които в крайна сметка бяха нашите най-добри учащи, всички модели с изключение на един се подобриха чрез елиминиране на необичайни характеристики.

Окончателният сборен набор от данни (YH, XL и KM комбинирани) включваше 259 екземпляра, всеки от които представляваше уникален участник, преминал както тестовете MemTrax, така и MoCA. Имаше 10 споделени независими функции: MemTrax показатели за ефективност: MTx-% C и средно MTx-RT; информация за демографска и медицинска история: възраст, пол, години на образование, вид работа (синя яка/бяла яка), социална подкрепа (дали полагащият теста живее сам или със семейството) и отговори с да/не дали потребителят е имал анамнеза за диабет, хиперлипидемия или травматично мозъчно увреждане. Два допълнителни показателя, общ резултат на MoCA и сборен резултат на MoCA, коригиран за години на обучение [12], бяха използвани отделно за разработване на зависими класификационни етикети, като по този начин се създадоха две различни схеми за моделиране, които да бъдат приложени към нашия комбиниран набор от данни. За всяка версия (коригирана и некоригирана) на оценката на MoCA, данните отново бяха отделно моделирани за двоична класификация, като се използваха два различни прага на критерия - първоначално препоръчания [12] и алтернативна стойност, използвана и насърчавана от други [8, 15]. В схемата за алтернативна прагова класификация се счита, че пациентът има нормално когнитивно здраве, ако той/тя получи резултат ≥23 на теста MoCA и има MCI, ако резултатът е 22 или по-нисък; като има предвид, че в първоначалния препоръчан формат на класификация пациентът трябваше да получи 26 или по-висока оценка на MoCA, за да бъде етикетиран като имащ нормално когнитивно здраве.

Филтрирани данни за класификационно моделиране на MoCA

Допълнително проучихме класификацията на MoCA, използвайки четири често използвани техники за класиране на функции: Хи-квадрат, коефициент на печалба, печалба на информация и симетрична несигурност. За междинна перспектива ние приложихме ранкерите към целия комбиниран набор от данни, използвайки всяка от нашите четири схеми за моделиране. Всички класиращи се съгласиха за едни и същи основни характеристики, т.е. възраст, брой години на образование и двата показателя за ефективност на MemTrax (MTx-% C, средно MTx-RT). След това изградихме отново моделите, като използвахме всяка техника за избор на характеристики, за да обучим моделите само на най-добрите четири функции (вижте Избор на функции По-долу).

Получените окончателни осем варианта на схемите за моделиране на класификацията на резултатите на MoCA са представени в таблица 1.

маса 1

Обобщение на вариациите на схемата за моделиране, използвани за класификация на MoCA (Нормално Когнитивно здраве срещу MCI)

Схема за моделиранеНормално когнитивно здраве (отрицателен клас)MCI (положителен клас)
Коригирано-23 Нефилтрирано/филтрирано101 (39.0%)158 (61.0%)
Коригирано-26 Нефилтрирано/филтрирано49 (18.9%)210 (81.1%)
Некоригиран-23 Нефилтриран/филтриран92 (35.5%)167 (64.5%)
Некоригиран-26 Нефилтриран/филтриран42 (16.2%)217 (83.8%)

Съответният брой и процент от общия брой пациенти във всеки клас се диференцират чрез корекция на резултата за образование (коригиран или некоригиран) и класификационен праг (23 или 26), както се прилага към двата набора характеристики (нефилтриран и филтриран).

Моделиране на клинична оценка, базирано на MemTrax

От нашите три оригинални поднабора от данни (YH, XL, KM), само пациентите с поднабор от данни XL бяха независимо клинично диагностицирани за когнитивно увреждане (т.е. техните съответни MoCA резултати не бяха използвани при установяване на класификация на нормални спрямо увредени). По-конкретно, пациентите с XL бяха диагностицирани с едно от двете Тест за болестта на Алцхаймер (AD) или съдова деменция (VaD). Във всяка от тези първични диагностични категории имаше допълнително обозначение за MCI. Диагнозите на MCI, деменция, васкуларно неврокогнитивно разстройство и неврокогнитивно разстройство, дължащи се на AD, се основават на специфични и отличителни диагностични критерии, описани в Диагностичния и статистически наръчник за психични разстройства: DSM-5 [16]. Като се имат предвид тези усъвършенствани диагнози, две схеми за моделиране на класификация бяха приложени поотделно към поднабора от данни XL, за да се разграничи нивото на тежест (степен на увреждане) за всяка категория първична диагноза. Данните, използвани във всяка от тези схеми за диагностично моделиране (AD и VaD), включват демографска информация и информация за историята на пациента, както и ефективността на MemTrax (MTx-% C, средно MTx-RT). Всяка диагноза е означена като лека, ако е обозначена като MCI; в противен случай се смяташе за тежко. Първоначално обмисляхме да включим оценката на MoCA в диагностичните модели (лека срещу тежка); но решихме, че това би провалило целта на нашата вторична схема за прогнозно моделиране. Тук обучаемите ще бъдат обучени, като използват други характеристики на пациента, лесно достъпни за доставчика, и показатели за ефективност на по-простия тест MemTrax (вместо MoCA) спрямо референтния „златен стандарт“, независимата клинична диагноза. Имаше 69 случая в набора от данни за диагностика на AD и 76 случая на VaD (Таблица 2). И в двата набора от данни имаше 12 независими функции. В допълнение към 10-те характеристики, включени в класификацията на резултата на MoCA, историята на пациента също включва информация за анамнеза за хипертония и инсулт.

маса 2

Обобщение на вариациите на схемата за моделиране, използвани за класификация на тежестта на диагнозата (лека срещу тежка)

Схема за моделиранеЛек (отрицателен клас)Тежка (положителен клас)
MCI-AD срещу AD12 (17.4%)57 (82.6%)
MCI-VaD срещу VaD38 (50.0%)38 (50.0%)

Съответният брой и процент от общите пациенти във всеки клас се диференцират по първична диагностична категория (AD или VaD).

Статистика

Сравнението на характеристиките на участниците и други числени характеристики между поднабори от данни за всяка стратегия за класифициране на модела (за прогнозиране на когнитивното здраве на MoCA и тежестта на диагнозата) беше извършено с помощта на език за програмиране Python (версия 2.7.1) [17]. Разликите в производителността на модела първоначално бяха определени с помощта на еднофакторен или двуфакторен (според случая) ANOVA с 95% доверителен интервал и теста за честна значима разлика (HSD) на Tukey за сравняване на средните показатели. Това изследване на разликите между производителността на модела беше извършено с помощта на комбинация от Python и R (версия 3.5.1) [18]. Ние използвахме този (макар и вероятно по-малко от оптимален) подход само като евристична помощ при това ранна фаза за първоначални сравнения на ефективността на модела при предвиждане на потенциално клинично приложение. След това използвахме Bayesian signed-rank test, използвайки последващо разпределение, за да определим вероятността от разлики в производителността на модела [19]. За тези анализи използвахме интервала –0.01, 0.01, което означава, че ако две групи имат разлика в представянето по-малка от 0.01, те се считат за еднакви (в рамките на областта на практическа еквивалентност) или в противен случай са различни (една по-добра от другият). За да извършим байесовото сравнение на класификатори и да изчислим тези вероятности, използвахме библиотеката baycomp (версия 1.0.2) за Python 3.6.4.

Прогнозно моделиране

Ние изградихме предсказващи модели, използвайки общо десетте вариации на нашите схеми за моделиране, за да предвидим (класифицираме) резултата от MoCA теста на всеки пациент или тежестта на клиничната диагноза. Всички обучаеми бяха приложени и моделите бяха изградени с помощта на софтуерната платформа с отворен код Weka [20]. За нашия предварителен анализ използвахме 10 често използвани алгоритми за обучение: 5-Nearest Neighbors, две версии на C4.5 дърво на решенията, логистична регресия, многослоен перцептрон, наивен Bayes, две версии на Random Forest, радиална базова функционална мрежа и поддържащ вектор машина. Ключови атрибути и контрасти на тези алгоритми са описани другаде [21] (вижте съответното Приложение). Те бяха избрани, защото представляват разнообразие от различни типове обучаеми и защото ние демонстрирахме успех, използвайки ги в предишни анализи на подобни данни. Настройките на хиперпараметри бяха избрани от нашите предишни изследвания, което показва, че са стабилни върху различни данни [22]. Въз основа на резултатите от нашия предварителен анализ, използвайки същия комбиниран набор от данни с общи характеристики, които бяха използвани впоследствие в пълния анализ, ние идентифицирахме трима обучаеми, които осигуряваха постоянно силна производителност във всички класификации: логистична регресия, Naive Bayes и Support Vector Machine.

Кръстосано валидиране и показател за ефективност на модела

За цялото прогнозно моделиране (включително предварителните анализи), всеки модел е изграден с помощта на 10-кратно кръстосано валидиране и производителността на модела е измерена с помощта на площта под кривата на работната характеристика на приемника (AUC). Кръстосаното валидиране започна с произволно разделяне на всеки от 10 набора от данни на схемата за моделиране на 10 равни сегмента (гънки), като се използват девет от тези съответни сегменти за обучение на модела и оставащия сегмент за тестване. Тази процедура се повтаря 10 пъти, като се използва различен сегмент като набор от тестове във всяка итерация. След това резултатите бяха комбинирани, за да се изчисли резултатът/производителността на крайния модел. За всяка комбинация обучаем/набор от данни, целият този процес се повтаря 10 пъти, като данните се разделят по различен начин всеки път. Тази последна стъпка намали пристрастията, осигури възпроизводимост и помогна за определяне на цялостната производителност на модела. Общо (за комбинирани схеми за оценка на MoCA и диагноза за тежест) са изградени 6,600 модела. Това включва 1,800 нефилтрирани модела (6 схеми за моделиране, приложени към набора от данни × 3 обучаеми × 10 изпълнения × 10 сгъвания = 1,800 модела) и 4,800 4 филтрирани модела (3 схеми за моделиране, приложени към набора от данни × 4 обучаеми × 10 техники за избор на характеристики × 10 изпълнения × 4,800 гънки = XNUMX модела).

Избор на функции

За филтрираните модели изборът на характеристики (като се използват четирите метода за класиране на характеристики) беше извършен в рамките на кръстосаното валидиране. За всяка от 10-те гънки, тъй като различни 10% от набора от данни бяха тестовите данни, бяха използвани само първите четири избрани функции за всеки набор от данни за обучение (т.е. останалите девет гънки или останалите 90% от целия набор от данни). за изграждане на моделите. Не успяхме да потвърдим кои четири функции са използвани във всеки модел, тъй като тази информация не се съхранява или не е предоставена в платформата за моделиране, която използвахме (Weka). Обаче, като се има предвид последователността в нашия първоначален избор на най-добри характеристики, когато рейтингите бяха приложени към целия комбиниран набор от данни и последващото сходство в представянето на моделирането, същите тези характеристики (възраст, години на образование, MTx-% C и средно MTx-RT ) вероятно са най-разпространените топ четири, използвани заедно с избора на функции в процеса на кръстосано валидиране.

РЕЗУЛТАТИ

Числените характеристики на участниците (включително резултати от MoCA и показатели за ефективност на MemTrax) на съответните набори от данни за всяка стратегия за класификация на модела за прогнозиране на когнитивното здраве, указано от MoCA (нормално спрямо MCI) и тежестта на диагнозата (лека спрямо тежка) са показани в таблица 3.

маса 3

Характеристики на участниците, резултати от MoCA и представяне на MemTrax за всяка стратегия за класифициране на модела

Стратегия за класификациявъзрастобразованиеMoCA КоригиранMoCA НекоригиранMTx-% CMTx-RT
Категория MoCA61.9 години (13.1)9.6 години (4.6)19.2 (6.5)18.4 (6.7)74.8% (15.0)1.4 s (0.3)
Тежест на диагнозата65.6 години (12.1)8.6 години (4.4)16.7 (6.2)15.8 (6.3)68.3% (13.8)1.5 s (0.3)

Показаните стойности (средно, SD), диференцирани чрез стратегии за класифициране на моделиране, са представителни за комбинирания набор от данни, използван за прогнозиране на когнитивно здраве, указано от MoCA (MCI спрямо нормално), и XL поднабор от данни, използван само за прогнозиране на тежестта на диагнозата (лека срещу тежка).

За всяка комбинация от резултат на MoCA (коригиран/некоригиран) и праг (26/23), имаше статистическа разлика (p = 0.000) във всяко сравнение по двойки (нормално когнитивно здраве спрямо MCI) за възраст, образование и ефективност на MemTrax (MTx-% C и MTx-RT). Всеки поднабор от данни за пациенти в съответния MCI клас за всяка комбинация е бил средно с около 9 до 15 години по-възрастен, съобщава около пет години по-малко образование и е имал по-неблагоприятно представяне на MemTrax и за двата показателя.

Резултати от ефективността на прогнозното моделиране за класификациите на резултатите на MoCA, използващи най-добрите трима обучаеми, логистична регресия, наивен Bayes и поддържаща векторна машина, са показани в таблица 4. Тези три бяха избрани въз основа на най-постоянно високото абсолютно представяне на обучаемите във всички различни модели приложен към наборите от данни за всички схеми за моделиране. За нефилтрирания набор от данни и моделиране, всяка от стойностите на данните в таблица 4 показва ефективността на модела въз основа на съответната средна стойност на AUC, получена от 100 модела (10 изпълнения × 10 сгъвания), изградени за всяка комбинация от обучаем/схема за моделиране, със съответната най-висока стойност добър обучаем, отбелязан с удебелен шрифт. Докато за моделирането на филтрирания набор от данни резултатите, докладвани в Таблица 4, отразяват общите средни показатели на модела от 400 модела за всеки обучаем, използвайки всеки от методите за класиране на функции (4 метода за класиране на характеристики × 10 изпълнения × 10 сгъвания).

маса 4

Резултати от дихотомна класификация на оценката на MoCA (AUC; 0.0–1.0) за всеки от тримата обучаеми с най-добри резултати за всички съответни схеми за моделиране

Използван набор от функцииРезултат от MoCAПраг на прекъсванеЛогистична регресияНаивен БайесПоддържаща векторна машина
Нефилтриран (10 функции)Коригирана230.88620.89130.8695
260.89710.92210.9161
Ненастроена230.91030.90850.8995
260.88340.91530.8994
Филтриран (4 функции)Коригирана230.89290.89540.8948
260.91880.92470.9201
Ненастроена230.91350.91340.9122
260.91590.92360.9177

Използвайки вариации на набор от функции, резултат на MoCA и праг на прекъсване на резултата на MoCA, най-високата производителност за всяка схема за моделиране е показана в удебелен шрифт (не е непременно статистически различно от всички останали, които не са включени удебелен шрифт за съответния модел).

Сравнявайки обучаемите във всички комбинации от версии и прагове на резултата на MoCA (съответно коригирани/некоригирани и 23/26) в комбинирания нефилтриран набор от данни (т.е. използвайки 10-те общи характеристики), Naive Bayes като цяло беше най-добре представилият се обучаем с общ класификационен резултат от 0.9093. Като се имат предвид първите трима учащи, байесово корелираните със знак ранг тестове показват, че вероятността (Pr) на наивен Бейс, превъзхождащ логистичната регресия, е 99.9%. Нещо повече, между Naive Bayes и Support Vector Machine, 21.0% вероятност за практическа еквивалентност в представянето на обучаемия (по този начин, 79.0% вероятност Naive Bayes да надмине Support Vector Machine), съчетано с 0.0% вероятност Support Vector Machine да се представи по-добре, измеримо засилва предимството в производителността за Naive Bayes. По-нататъшно сравнение на версията на резултата на MoCA за всички учащи/прагове предполага леко предимство в представянето при използване на некоригирани резултати на MoCA спрямо коригирани (0.9027 спрямо 0.8971, съответно; Pr (некоригиран > коригиран) = 0.988). По подобен начин, сравнение на граничния праг за всички обучаеми и версиите на резултата на MoCA показа малко предимство в ефективността на класификацията, използвайки 26 като праг за класификация спрямо 23 (0.9056 срещу 0.8942, съответно; Pr (26 > 23) = 0.999). И накрая, изследвайки представянето на класификацията за моделите, използващи само филтрираните резултати (т.е. само най-високо класираните четири характеристики), Naive Bayes (0.9143) е числено най-добре представящият се обучаем във всички версии/прагове на MoCA резултати. Въпреки това, при всички комбинирани техники за класиране на функции, всички най-добре представящи се учащи се представиха по подобен начин. Тестовете със знаков ранг на Байес показаха 100% вероятност за практическа еквивалентност между всяка двойка филтрирани обучаеми. Както при нефилтрираните данни (с използване на всички 10 общи характеристики), отново имаше предимство в производителността за некоригираната версия на резултата на MoCA (Pr (некоригиран > коригиран) = 1.000 26), както и подобно ясно предимство за класификационния праг от XNUMX (Pr (26 > 23) = 1.000 0.9119). Трябва да се отбележи, че средното представяне на всеки от трима най-добри обучаеми във всички версии/прагове на резултатите на MoCA, използвайки само най-високо класираните четири функции, надвишава средното представяне на всеки обучаем върху нефилтрираните данни. Не е изненадващо, че ефективността на класификацията на филтрираните модели (използвайки най-високо класираните четири характеристики) като цяло е по-добра (0.8999) от нефилтрираните модели (10), независимо от моделите на метода за класиране на характеристиките, които са сравнени с тези съответни модели, използващи всички 100 общи Характеристика. За всеки метод за избор на функция имаше XNUMX% вероятност за предимство в производителността спрямо нефилтрираните модели.

При пациентите, разглеждани за класификация на тежестта на диагнозата AD, разликите между групите (MCI-AD спрямо AD) за възрастта (p = 0.004), образование (p = 0.028), MoCA резултат коригиран/некоригиран (p = 0.000) и MTx-% C (p = 0.008) са статистически значими; докато за MTx-RT не беше (p = 0.097). При пациентите, обмислени за класифициране на тежестта на диагнозата VaD, разликите между групите (MCI-VaD спрямо VaD) за MoCA резултат коригиран/некоригиран (p = 0.007) и MTx-% C (p = 0.026) и MTx-RT (p = 0.001) са статистически значими; докато за възрастта (p = 0.511) и образование (p = 0.157) няма значими разлики между групите.

Резултатите от ефективността на прогнозното моделиране за класификациите на тежестта на диагнозата с помощта на трите избрани по-рано обучаеми, логистична регресия, наивен Bayes и поддържаща векторна машина, са показани в таблица 5. Докато допълнително изследваните обучаеми демонстрират малко по-добри резултати поотделно с една от двете категории клинични диагнози , тримата обучаеми, които идентифицирахме като най-благоприятни в нашето предишно моделиране, предложиха най-последователното представяне и с двете нови схеми за моделиране. Сравнявайки обучаемите във всяка от основните диагностични категории (AD и VaD), нямаше последователна разлика в представянето на класификацията между обучаемите за MCI-VaD спрямо VaD, въпреки че Support Vector Machine като цяло се представи по-видно. По същия начин няма значителни разлики между обучаемите за MCI-AD спрямо AD класификацията, въпреки че Naive Bayes (NB) има леко предимство в производителността пред Logistic Regression (LR) и съвсем незначително множество спрямо Support Vector Machine, с вероятности от 61.4% и съответно 41.7%. И в двата набора от данни имаше цялостно предимство в производителността за Support Vector Machine (SVM), с Pr (SVM > LR) = 0.819 и Pr (SVM > NB) = 0.934. Цялостното ни класифициране на всички обучаеми при прогнозиране на тежестта на диагнозата в поднабора от данни XL беше по-добро в категорията на диагнозата VaD спрямо AD (Pr (VAD > AD) = 0.998).

маса 5

Резултати от дихотомна класификация на тежестта на клиничната диагноза (AUC; 0.0–1.0) за всеки от тримата обучаеми с най-добри резултати и за двете съответни схеми за моделиране

Схема за моделиранеЛогистична регресияНаивен БайесПоддържаща векторна машина
MCI-AD срещу AD0.74650.78100.7443
MCI-VaD срещу VaD0.80330.80440.8338

Най-високата производителност за всяка схема за моделиране е показана в удебелен шрифт (не непременно статистически различни от други, които не са включени удебелен шрифт).

ДИСКУСИЯ

Ранното откриване на промени в когнитивното здраве е важно практическа полза както при управлението на личното здраве, така и в общественото здраве. Наистина, това също е много висок приоритет в клиничните условия за пациентите по целия свят. Общата цел е да се предупредят пациентите, лицата, които се грижат за тях, и доставчиците и да се подкани по-ранно подходящо и рентабилно лечение и продължителна грижа за тези, които започват да изпитват когнитивен спад. Обединявайки нашите три подмножества от данни за болници/клиники, ние идентифицирахме трима отчетливо предпочитани обучаеми (с един забележителен отличител – Naive Bayes), за да изградим прогнозни модели, използвайки Показатели за ефективност на MemTrax, които биха могли надеждно да класифицират състоянието на когнитивното здраве дихотомно (нормално когнитивно здраве или MCI), както би било посочено от общ резултат на MoCA. Трябва да се отбележи, че цялостната производителност на класификацията и за тримата обучаеми се подобри, когато нашите модели използваха само най-високо класираните четири функции, които основно обхващаха тези показатели за ефективност на MemTrax. Освен това, ние разкрихме доказания потенциал за използване на едни и същи показатели за ефективност на обучаемите и MemTrax в схема за моделиране на класификация на диагностична подкрепа, за да се разграничи тежестта на две категории диагноза на деменция: AD и VaD.

Тестване на паметта е от основно значение за ранното откриване на AD [23, 24]. Поради това е уместно MemTrax да е приемливо, ангажиращо и лесно за внедряване онлайн скринингов тест за епизодична памет в общата популация [6]. Точността на разпознаване и времето за реакция от тази задача за непрекъснато изпълнение са особено показателни при идентифицирането на ранно и развиващо се влошаване и последващи дефицити в невропластичните процеси, свързани с ученето, паметта и познанието. Това означава, че моделите тук, които се основават до голяма степен на показателите за ефективност на MemTrax, са чувствителни към и е по-вероятно да разкрият лесно и с минимални разходи биологични невропатологични дефицити по време на преходния асимптоматичен стадий много преди по-съществена функционална загуба [25]. Ашфорд и др. внимателно изследва моделите и поведението на точността на паметта за разпознаване и времето за реакция при онлайн потребители, които са участвали сами с MemTrax [6]. Отчитайки, че тези разпределения са от решаващо значение за оптималното моделиране и разработването на валидни и ефективни приложения за грижа за пациентите, дефинирането на клинично приложими профили за разпознаване и време за реакция е от съществено значение за установяването на ценна основополагаща справка за клинична и изследователска полезност. След това практическата стойност на MemTrax при скрининга на AD за ранен стадий на когнитивно увреждане и диференциалната диагностична подкрепа трябва да бъдат по-отблизо проучени в контекста на клинична обстановка, където могат да бъдат взети под внимание съпътстващи заболявания и когнитивни, сензорни и двигателни способности, влияещи върху представянето на теста. И за да се информира професионалната гледна точка и да се насърчи практическата клинична полезност, първо е наложително да се демонстрира сравнение с установен тест за оценка на когнитивното здраве, въпреки че последният може да бъде разпознаваемо ограничен от тромавата логистика на тестването, образованието и езиковите възпиращи фактори и културните влияния [26] . В това отношение благоприятното сравнение на MemTrax по отношение на клиничната ефикасност с MoCA, което обикновено се смята за индустриален стандарт, е значително, особено когато се претегля по-голямата лекота на полезност и приемане от пациентите на MemTrax.

Предишно проучване, сравняващо MemTrax с MoCA, подчертава обосновката и предварителните доказателства, които оправдават нашето изследване на моделирането [8]. Въпреки това, това предишно сравнение просто свързва двата ключови показателя за ефективност на MemTrax, които изследвахме, с когнитивния статус, определен от MoCA и дефинирани съответните диапазони и гранични стойности. Ние задълбочихме оценката на клиничната полезност на MemTrax, като проучихме подход, базиран на прогнозно моделиране, който би осигурил по-индивидуализирано разглеждане на други потенциално релевантни специфични за пациента параметри. За разлика от други, ние не открихме предимство в представянето на модела, използвайки образователна корекция (корекция) на оценката на MoCA или в промяната на дискриминиращия когнитивното здраве общ праг на резултата на MoCA от първоначално препоръчаните 26 до 23 [12, 15]. В действителност, предимството на ефективността на класификацията е предпочитано при използване на некоригирания MoCA резултат и по-високия праг.

Основни моменти в клиничната практика

Машинното обучение често се използва най-добре и е най-ефективно при прогнозно моделиране, когато данните са обширни и многоизмерни, т.е. когато има множество наблюдения и съпътстващ широк набор от атрибути с висока стойност (принос). И все пак, с тези текущи данни, филтрираните модели само с четири избрани функции се представиха по-добре от тези, използващи всички 10 общи функции. Това предполага, че нашият общ набор от болнични данни не е имал най-подходящите клинично характеристики (с висока стойност), за да класифицира оптимално пациентите по този начин. Независимо от това, акцентът при класирането на характеристиките върху ключовите показатели за ефективност на MemTrax — MTx-% C и MTx-RT — силно подкрепя изграждането на модели за скрининг на ранен етап на когнитивния дефицит около този тест, който е прост, лесен за администриране, евтин и подходящо разкриващ производителност на паметта, поне в момента като начален екран за двоична класификация на когнитивния здравен статус. Като се има предвид непрекъснато нарастващото напрежение върху доставчиците и здравните системи, процесите за скрининг на пациенти и клиничните приложения трябва да бъдат подходящо разработени с акцент върху събирането, проследяването и моделирането на онези характеристики на пациентите и показателите за тестване, които са най-полезни, изгодни и доказани ефективност при диагностициране и подкрепа за управление на пациентите.

Тъй като двата ключови показателя на MemTrax са централни за класификацията на MCI, нашият най-добре представящ се обучаем (Naive Bayes) имаше много висока прогнозна производителност в повечето модели (AUC над 0.90) със съотношение на истински положителни към фалшиво положителни резултати, близо до или малко надвишаващо 4 : 1. Транслационно клинично приложение, използващо този обучаем, по този начин би уловило (правилно класифицирало) много от тези с когнитивен дефицит, като същевременно минимизира разходите, свързани с погрешното класифициране на някой с нормално когнитивно здраве като с когнитивен дефицит (фалшиво положителен) или липсва тази класификация при тези, които имат когнитивен дефицит (фалшиво отрицателен). Всеки един от тези сценарии на грешна класификация може да наложи неоправдана психо-социална тежест за пациента и лицата, които се грижат за него.

Докато в предварителните и пълни анализи използвахме всичките десет обучаеми във всяка схема за моделиране, ние фокусирахме нашите резултати върху трите класификатора, показващи най-последователно силно представяне. Това също така трябваше да подчертае, въз основа на тези данни, обучаемите, които се очакваше да се представят надеждно на високо ниво в практическо клинично приложение при определяне на класификацията на когнитивния статус. Освен това, тъй като това проучване беше замислено като въвеждащо изследване на полезността на машинното обучение върху когнитивния скрининг и тези навременни клинични предизвикателства, ние взехме решение да запазим техниките за обучение прости и обобщени, с минимална настройка на параметрите. Оценяваме, че този подход може да е ограничил потенциала за по-тясно дефинирани способности за прогнозиране, специфични за пациента. По същия начин, докато обучението на моделите, използвайки само най-добрите характеристики (филтриран подход), ни информира допълнително относно тези данни (специфични за недостатъците в събраните данни и подчертаващи стойността при оптимизиране на ценното клинично време и ресурси), ние осъзнаваме, че е преждевременно да се стесняват обхватът на моделите и следователно всички (и други характеристики) трябва да бъдат взети под внимание при бъдещи изследвания, докато не получим по-категоричен профил на приоритетни характеристики, които биха били приложими за широката популация. По този начин, ние също напълно признаваме, че по-всеобхватни и широко представителни данни и оптимизиране на тези и други модели биха били необходими, преди да бъдат интегрирани в ефективно клинично приложение, особено за приспособяване на съпътстващи заболявания, засягащи когнитивното представяне, което трябва да се вземе предвид при по-нататъшна клинична оценка.

Полезността на MemTrax беше допълнително подобрена чрез моделиране на тежестта на заболяването въз основа на отделна клинична диагноза. По-добро цялостно класифициране при прогнозиране на тежестта на VaD (в сравнение с AD) не беше изненадващо предвид характеристиките на профила на пациента в моделите, специфични за съдовото здраве и риск от инсулт, т.е. хипертония, хиперлипидемия, диабет и (разбира се) история на инсулт. Въпреки че би било по-желателно и подходящо същата клинична оценка да бъде извършена върху съвпадащи пациенти с нормално когнитивно здраве, за да се обучат обучаемите с тези по-всеобхватни данни. Това е особено оправдано, тъй като MemTrax е предназначен да се използва предимно за ранно откриване на когнитивен дефицит и последващо проследяване на индивидуалната промяна. Също така е правдоподобно, че по-желаното разпределение на данни в набора от данни VaD е допринесло отчасти за сравнително по-доброто представяне на моделирането. Наборът от данни VaD беше добре балансиран между двата класа, докато наборът от данни за AD с много по-малко пациенти с MCI не беше. Особено при малки набори от данни, дори няколко допълнителни екземпляра могат да направят измерима разлика. И двете гледни точки са разумни аргументи в основата на разликите в ефективността на моделиране на тежестта на заболяването. Въпреки това пропорционалното приписване на подобрена производителност на числените характеристики на набора от данни или присъщите характеристики, специфични за разглежданата клинична проява, е преждевременно. Независимо от това, тази нова демонстрирана полезност на предсказуем класификационен модел на MemTrax в ролята на клинична диагностична подкрепа предоставя ценна перспектива и потвърждава преследването на допълнителни изследвания с пациенти в целия континуум на MCI.

Внедряването и демонстрираната полезност на MemTrax и тези модели в Китай, където езикът и културата са драстично различни от други региони с установена полезност (напр. Франция, Холандия и Съединените щати) [7, 8, 27], допълнително подчертава потенциала за широко разпространено глобално приемане и клинична стойност на платформа, базирана на MemTrax. Това е очевиден пример за стремеж към хармонизиране на данните и разработване на практически международни норми и ресурси за моделиране за когнитивен скрининг, които са стандартизирани и лесно адаптирани за използване в световен мащаб.

Следващи стъпки в моделирането и приложението на когнитивния спад

Когнитивната дисфункция при AD наистина възниква в континуум, а не на отделни етапи или стъпки [28, 29]. Въпреки това, в тази ранна фаза, нашата цел беше първо да установим способността си да изградим модел, включващ MemTrax, който може фундаментално да разграничи „нормалното“ от „ненормалното“. По-всеобхватни емпирични данни (напр. изображения на мозъка, генетични характеристики, биомаркери, съпътстващи заболявания и функционални маркери на сложни дейности, изискващи когнитивни контрол) [30] в различни глобални региони, популации и възрастови групи за обучение и разработване на по-сложни (включително подходящо претеглен ансамбъл) модели на машинно обучение ще поддържат по-висока степен на подобрена класификация, тоест капацитетът за категоризиране на групи от пациенти с MCI на по-малки и по-категорични подмножества по протежение на континуума на когнитивния спад. Освен това, съпътстващите клинични диагнози за индивиди от регионално различни популации пациенти са от съществено значение за ефективно тренирайте тези по-всеобхватни и предвидимо стабилни модели. Това ще улесни по-специфично стратифицирано управление на случаи за тези с подобен произход, влияния и по-тясно дефинирани характерни когнитивни профили и по този начин ще оптимизира подкрепата за клинични решения и грижите за пациентите.

Голяма част от съответните клинични изследвания до момента са насочени към пациенти с поне лека деменция; и на практика твърде често интервенцията на пациентите се опитва само в напреднал стадий. Въпреки това, тъй като когнитивният спад започва доста преди да бъдат изпълнени клиничните критерии за деменция, ефективно приложен ранен скрининг, базиран на MemTrax, би могъл да насърчи подходящо обучение на хората относно болестта и нейните прогресии и да подтикне към по-ранни и по-навременни интервенции. По този начин ранното откриване може да подкрепи подходящи включвания, вариращи от упражнения, диета, емоционална подкрепа и подобрена социализация до фармакологична интервенция и да засили свързаните с пациента промени в поведението и възприятието, които самостоятелно или в съвкупност биха могли да смекчат или потенциално да спрат прогресията на деменцията [31, 32] . При това с ефективни ранен скрининг, хората и техните семейства може да бъдат подканени да обмислят клинични изпитвания или да получат консултация и друга подкрепа от социални услуги, за да помогнат за изясняване на очакванията и намеренията и за справяне с ежедневните задачи. По-нататъшното валидиране и широко разпространената практическа полезност по тези начини биха могли да бъдат инструмент за смекчаване или спиране на прогресията на MCI, AD и ADRD за много индивиди.

Наистина, долният край на възрастовия диапазон на пациентите в нашето проучване не представлява населението, което традиционно се интересува от AD. Независимо от това, средната възраст за всяка група, използвана в схемите за моделиране на класификация въз основа на резултата/прага на MoCA и тежестта на диагнозата (Таблица 3), подчертава ясно мнозинство (над 80%), които са на възраст поне 50 години. Следователно това разпределение е много подходящо за обобщение, подкрепящо полезността на тези модели в популацията, характеризираща тези, които обикновено са засегнати от ранно начало и процъфтяващо неврокогнитивно заболяване, дължащо се на AD и VaD. Също така, последните доказателства и перспектива подчертават тези признати фактори (напр. хипертония, затлъстяване, диабет и тютюнопушене), които потенциално допринасят за по-високи ранни съдови рискови резултати за възрастни и средна възраст и последващо фино съдово мозъчно увреждане, което се развива коварно с очевидни ефекти дори при млади възрастни [33–35]. Съответно, най-оптималната възможност за първоначален скрининг за ранно откриване стадий на когнитивни дефицити и иницииране на ефективни стратегии за превенция и интервенция за успешно справяне с деменцията ще се появи от изследване на допринасящи фактори и предшестващи индикатори в целия възрастов спектър, включително ранна зряла възраст и потенциално дори детство (отбелязвайки значението на генетични фактори като аполипопротеин Е от ранна бременност).

На практика валидните клинични диагнози и скъпите процедури за усъвършенствани изображения, генетично профилиране и измерване на обещаващи биомаркери не винаги са лесно достъпни или дори осъществими за много доставчици. По този начин, в много случаи може да се наложи първоначалната цялостна класификация на когнитивния здравен статус да бъде извлечена от модели, използващи други прости показатели, предоставени от пациента (напр. проблеми с паметта, текущи лекарства и ограничения на рутинната активност) и общи демографски характеристики [7]. Регистри като Калифорнийския университет Здравето на мозъка Регистър (https://www.brainhealthregistry.org/) [27] и други с присъща по-голяма широчина на самоотчитани симптоми, качествени мерки (напр. сън и ежедневна когнитивност), лекарства, здравен статус и анамнеза, и по-подробните демографски данни ще бъдат инструментални за разработването и валидирането на практическото приложение на тези по-примитивни модели в клиниката. Освен това, тест като MemTrax, който демонстрира полезност при оценката на функцията на паметта, може всъщност да осигури значително по-добра оценка на патологията на AD, отколкото биологичните маркери. Като се има предвид, че основната характеристика на патологията на AD е нарушаването на невропластичността и изключително сложната загуба на синапси, която се проявява като епизодична дисфункция на паметта, мярка, която оценява епизодичната памет, всъщност може осигуряват по-добра оценка на патологичното натоварване на AD, отколкото биологичните маркери при живия пациент [36].

С всички прогнозни модели – независимо дали са допълнени от сложни и всеобхватни данни от най-съвременна технология и усъвършенствани клинични прозрения в множество домейни или такива, ограничени до по-основна и лесно достъпна информация, характерна за съществуващите профили на пациентите – признатото предимство на изкуствения интелект и машинното обучение е, че получените модели могат да синтезират и индуктивно да „учат“ от съответните нови данни и перспектива, предоставени от текущото използване на приложения. След практически трансфер на технологии, тъй като моделите тук (и предстои да бъдат разработени) се прилагат и обогатяват с повече случаи и уместни данни (включително пациенти със съпътстващи заболявания, които биха могли да се проявят с последващ когнитивен спад), ефективността на прогнозиране и класификацията на когнитивното здраве ще бъдат по-стабилни, което води до по-ефективна помощ за клинично вземане на решения. Тази еволюция ще бъде по-пълно и практически реализирана с вграждането на MemTrax в персонализирани (насочени към наличните възможности) платформи, които доставчиците на здравни услуги биха могли да използват в реално време в клиниката.

Наложително за валидирането и полезността на модела MemTrax за диагностична подкрепа и грижа за пациентите са силно търсени значими надлъжни данни. Чрез наблюдение и записване на съпътстващите промени (ако има такива) в клиничния статус в адекватен диапазон от нормално през ранен стадий на MCI, моделите за подходяща текуща оценка и класификация могат да бъдат обучени и модифицирани с възрастта на пациентите и лечението. Това означава, че повторната полезност може да помогне с надлъжно проследяване на леки когнитивни промени, ефективност на интервенцията и поддържане на информирана стратифицирана грижа. Този подход се съгласува по-тясно с клиничната практика и управлението на пациенти и случаи.

Ограничения

Ние оценяваме предизвикателството и стойността на събирането на чисти клинични данни в контролирана клиника/болница. Независимо от това, би засилило нашето моделиране, ако нашите набори от данни включват повече пациенти с общи характеристики. Освен това, специфично за нашето моделиране на диагнозата, би било по-желателно и подходящо същата клинична оценка да бъде извършена върху съответстващи пациенти с нормално когнитивно здраве, за да се обучат обучаващите се. И както се подчертава от по-високата производителност на класификацията с помощта на филтрирания набор от данни (само най-високо класираните четири функции), по-общи и мерките/показателите за когнитивно здраве вероятно биха се подобрили моделиране на производителност с по-голям брой общи характеристики за всички пациенти.

Някои участници може да са имали съпътстващи други заболявания, които биха могли да предизвикат преходни или хронични когнитивни недостатъци. Освен поднабора от данни XL, където пациентите са били диагностично класифицирани като имащи или AD, или VaD, данните за коморбидността не са събрани/отчетени в набора от пациенти YH, а преобладаващата докладвана коморбидност в поднабора от данни KM е диабет. Може да се спори обаче, че включването на пациенти в нашите схеми за моделиране със съпътстващи заболявания, които биха могли да предизвикат или изострят ниво на когнитивен дефицит и последващо по-ниско представяне на MemTrax, би било по-представително за целевата популация пациенти в реалния свят за този по-обобщен ранен когнитивен скрининг и моделиращ подход. Продължавайки напред, точната диагностика на съпътстващи заболявания, потенциално засягащи когнитивните резултати, е широко полезна за оптимизиране на моделите и произтичащите от тях приложения за грижа за пациентите.

И накрая, пациентите с поднабор от данни YH и KM използваха смартфон, за да направят теста MemTrax, докато ограничен брой пациенти с поднабор от данни XL използваха iPad, а останалите използваха смартфон. Това може да доведе до незначителна свързана с устройството разлика в производителността на MemTrax за класификационното моделиране на MoCA. Въпреки това, разликите (ако има такива) в MTx-RT, например, между устройствата вероятно биха били незначителни, особено когато на всеки участник е даден „практически“ тест точно преди записаното изпълнение на теста. Независимо от това, полезността на тези две преносими устройства потенциално компрометира директното сравнение с и/или интегрирането с други резултати на MemTrax, където потребителите отговарят на повтарящи се снимки чрез докосване на интервала на компютърната клавиатура.

Ключови точки относно помощната програма за предсказуемо моделиране MemTrax

  • • Нашите най-ефективни предсказуеми модели, обхващащи избрани показатели за ефективност на MemTrax, биха могли надеждно да класифицират състоянието на когнитивното здраве (нормално когнитивно здраве или MCI), както би било посочено от широко признатия тест MoCA.
  • • Тези резултати поддържат интегрирането на избрани показатели за ефективност на MemTrax в приложение за скрининг на предсказуем модел на класификация за ранен стадий на когнитивно увреждане.
  • • Нашето класификационно моделиране също разкри потенциала за използване на ефективността на MemTrax в приложения за разграничаване на тежестта на диагнозата деменция.

Тези нови открития установяват категорични доказателства в подкрепа на полезността на машинното обучение при изграждането на подобрени стабилни класификационни модели, базирани на MemTrax, за диагностична подкрепа при ефективно управление на клинични случаи и грижа за пациенти за лица, изпитващи когнитивно увреждане.

БЛАГОДАРНОСТИ

Признаваме работата на Дж. Уесън Ашфорд, Къртис Б. Ашфорд и колеги за разработването и валидирането на онлайн задачата за непрекъснато разпознаване и инструмента (MemTrax), използвани тук, и сме благодарни на многобройните пациенти с деменция, които допринесоха за критичното основополагащо изследване . Благодарим също на Xianbo Zhou и неговите колеги от SJN Biomed LTD, неговите колеги и сътрудници в сайтовете на болниците/клиниките, особено на д-р. M. Luo и M. Zhong, които помогнаха с набирането на участници, насрочването на тестове и събирането, записването и управлението на данните от предния край, както и участниците доброволци, които дариха ценното си време и поеха ангажимент да вземат тестовете и да предоставят ценните данни, които да оценим в това проучване. Това проучването е подкрепено отчасти от MD Scientific Research Програма на Медицинския университет Кунминг (грант № 2017BS028 до XL) и изследователската програма на отдела за наука и технологии в Юнан (грант № 2019FE001 (-222) до XL).

J. Wesson Ashford е подал заявка за патент за използването на специфичната парадигма за непрекъснато разпознаване, описана в този документ за общо тестване на паметта.

MemTrax, LLC е компания, собственост на Къртис Ашфорд, и тази компания управлява тестване на паметта система, описана в този документ.

Разкритията на авторите са достъпни онлайн (https://www.j-alz.com/manuscript-disclosures/19-1340r2).

тест за памет тест за деменция тест за загуба на памет краткосрочен тест за загуба на памет ram тест ума диета разнообразие от книги когнитивен тест онлайн
Къртис Ашфорд – Координатор на когнитивните изследвания

СПРАВКИ

[1] Асоциация на Алцхаймер (2016) 2016 Факти за болестта на Алцхаймер и фигури. Демент на Алцхаймер 12, 459–509.
[2] Gresenz CR, Mitchell JM, Marrone J, Federoff HJ (2019) Ефект на ранен стадий болест на Алцхаймер върху финансовите резултати на домакинствата. Health Econ 29, 18–29.
[3] Foster NL, Bondi MW, Das R, Foss M, Hershey LA, Koh S, Logan R, Poole C, Shega JW, Sood A, Thothala N, Wicklund M, Yu M, Bennett A, Wang D (2019) Подобряване на качеството в неврология: комплект за измерване на качеството на леко когнитивно увреждане. Неврология 93, 705–713.
[4] Tong T, Thokala P, McMillan B, Ghosh R, Brazier J (2017) Ефективност на разходите от използването когнитивни скринингови тестове за откриване на деменция и леко когнитивно увреждане в първичната медицинска помощ. Int J Geriatr Psychiatry 32, 1392–1400.
[5] Ashford JW, Gere E, Bayley PJ (2011) Измерване на паметта в настройки на голяма група, като се използва непрекъснат тест за разпознаване. J Alzheimers Dis 27, 885–895.
[6] Ashford JW, Tarpin-Bernard F, Ashford CB, Ashford MT (2019) Компютъризирана задача за непрекъснато разпознаване за измерване на епизодична памет. J Alzheimers Dis 69, 385–399.
[7] Bergeron MF, Landset S, Tarpin-Bernard F, Ashford CB, Khoshgoftaar TM, Ashford JW (2019) Изпълнение на епизодична памет при моделиране на машинно обучение за прогнозиране на класификация на когнитивния здравен статус. J Alzheimers Dis 70, 277–286.
[8] van der Hoek MD, Nieuwenhuizen A, Keijer J, Ashford JW (2019) The MemTrax тест в сравнение с оценката на когнитивната оценка на Монреал за леко когнитивно увреждане. J Alzheimers Dis 67, 1045–1054.
[9] Falcone M, Yadav N, Poellabauer C, Flynn P (2013) Използване на изолирани гласни звуци за класифициране на леко травматично мозъчно увреждане. През 2013 г. Международната конференция на IEEE по акустика, реч и обработка на сигнали, Ванкувър, Британска Колумбия, стр. 7577–7581.
[10] Dabek F, Caban JJ (2015) Използване на големи данни за моделиране на вероятността от развитие на психологически състояния след сътресение. Procedia Comput Sci 53, 265–273.
[11] Climent MT, Pardo J, Munoz-Almaraz FJ, Guerrero MD, Moreno L (2018) Дърво на решения за ранно откриване на когнитивно увреждане от фармацевти в общността. Front Pharmacol 9, 1232.
[12] Nasreddine ZS, Phillips NA, Bedirian V, Charbonneau S, Whitehead V, Collin I, Cummings JL, Chertkow H (2005) The Montreal Cognitive Assessment, MoCA: Кратък инструмент за скрининг за леко когнитивно увреждане. J Am Geriatr Soc 53, 695–699.
[13] Yu J, Li J, Huang X (2012) Пекинската версия на Монреалската когнитивна оценка като кратък инструмент за скрининг за леко когнитивно увреждане: Проучване в общността. BMC Психиатрия 12, 156.
[14] Chen KL, Xu Y, Chu AQ, Ding D, Liang XN, Nasreddine ZS, Dong Q, Hong Z, Zhao QH, Guo QH (2016) Валидиране на китайската версия на основната когнитивна оценка в Монреал за скрининг на леко когнитивно увреждане. J Am Geriatr Soc 64, e285–e290.
[15] Carson N, Leach L, Murphy KJ (2018) Преразглеждане на граничните резултати на Montreal Cognitive Assessment (MoCA). Int J Geriatr Psychiatry 33, 379–388.
[16] Американската психиатрична асоциация (2013) Диагностичен и статистически наръчник на работната група за психични разстройства: DSM-5™, American Psychiatric Publishing, Inc., Вашингтон, окръг Колумбия.
[17] Python. Python Software Foundation, http://www.python.org, достъп до 15 ноември 2019 г.
[18] R Core Group, R: Език и среда за статистически изчисления R Foundation for Statistical Computing, Виена, Австрия. https://www.R-project.org/, 2018 г., достъп до 15 ноември 2019 г.
[19] Benavoli A, Corani G, Demšar J, Zaffalon M (2017) Време е за промяна: Урок за сравняване на множество класификатори чрез байесов анализ. J Mach Learn Res 18, 1–36.
[20] Frank E, Hall MA, Witten IH (2016) Работната маса на WEKA. в Извличане на данни: Практически инструменти и техники за машинно обучение, Frank E, Hall MA, Witten IH, Pal CJ, eds. Морган Кауфман https://www.cs.waikato.ac.nz/ml/weka/Witten_et_al_2016_appendix.pdf
[21] Bergeron MF, Landset S, Maugans TA, Williams VB, Collins CL, Wasserman EB, Khoshgoftaar TM (2019) Машинно обучение при моделиране на отстраняване на симптомите на мозъчно сътресение в гимназията. Med Sci Sports Exerc 51, 1362–1371.
[22] Van Hulse J, Khoshgoftaar TM, Napolitano A (2007) Експериментални перспективи за учене от небалансирани данни. в Доклади на 24-та международна конференция за машинно обучение, Корвалис, Орегон, САЩ, стр. 935-942.
[23] Ashford JW, Kolm P, Colliver JA, Bekian C, Hsu LN (1989) Оценка на пациента с Алцхаймер и мини-психичното състояние: Анализ на кривата на характеристиката на елемента.P. J Gerontol 44, 139–146.
[24] Ashford JW, Jarvik L (1985) Болест на Алцхаймер: Пластичността на неврона предразполага ли към аксонална неврофибриларна дегенерация? N Engl J Med 313, 388–389.
[25] Jack CR Jr, Therneau TM, Weigand SD, Wiste HJ, Knopman DS, Vemuri P, Lowe VJ, Mielke MM, Roberts RO, Machulda MM, Graff-Radford J, Jones DT, Schwarz CG, Gunter JL, Senjem ML , Rocca WA, Petersen RC (2019) Разпространение на биологично спрямо клинично дефинирани единици от спектъра на Алцхаймер с помощта на Националния институт по стареене - Алцхаймер Изследване на асоциацията рамка. JAMA Neurol 76, 1174–1183.
[26] Zhou X, Ashford JW (2019) Напредък в скрининговите инструменти за болест на Алцхаймер. Стареене Med 2, 88–93.
[27] Weiner MW, Nosheny R, Camacho M, Truran-Sacrey D, Mackin RS, Flenniken D, Ulbricht A, Insel P, Finley S, Fockler J, Veitch D (2018) The Здравето на мозъка Регистър: Интернет-базирана платформа за набиране, оценка и надлъжно наблюдение на участници за невронаучни изследвания. Демент на Алцхаймер 14, 1063–1076.
[28] Ashford JW, Schmitt FA (2001) Моделиране на времевия курс на деменция на Алцхаймер. Curr Psychiatry Rep 3, 20–28.
[29] Li X, Wang X, Su L, Hu X, Han Y (2019) Китайско надлъжно проучване на когнитивния спад (SILCODE): Протокол за китайско надлъжно обсервационно проучване за разработване на модели за прогнозиране на риска от превръщане в леко когнитивно увреждане при лица със субективни когнитивни упадък. BMJ Open 9, e028188.
[30] Tarnanas I, Tsolaki A, Wiederhold M, Wiederhold B, Tsolaki M (2015) Петгодишна вариабилност на прогресията на биомаркера за Деменция от болестта на Алцхаймер прогноза: Могат ли сложни инструментални дейности от ежедневния живот да запълнят празнините? Алцхаймеров демент (Amst) 1, 521–532.
[31] McGurran H, Glenn JM, Madero EN, Bott NT (2019) Профилактика и лечение на болестта на Алцхаймер: Биологични механизми на упражнение. J Alzheimers Dis 69, 311–338.
[32] Mendiola-Precoma J, Berumen LC, Padilla K, Garcia-Alcocer G (2016) Терапии за профилактика и лечение на болестта на Алцхаймер. Biomed Res Int 2016, 2589276.
[33] Lane CA, Barnes J, Nicholas JM, Sudre CH, Cash DM, Malone IB, Parker TD, Keshavan A, Buchanan SM, Keuss SE, James SN, Lu K, Murray-Smith H, Wong A, Gordon E, Coath W, Modat M, Thomas D, Richards M, Fox NC, Schott JM (2020) Асоциации между съдовия риск в зряла възраст и мозъчната патология в късния живот: Доказателство от британска кохорта при раждане. JAMA Neurol 77, 175–183.
[34] Seshadri S (2020) Предотвратяване на деменция - мислене отвъд възрастта и амилоидните кутии. JAMA Neurol 77, 160–161.
[35] Maillard P, Seshadri S, Beiser A, Himali JJ, Au R, Fletcher E, Carmichael O, Wolf PA, DeCarli C (2012) Ефекти на систоличното кръвно налягане върху целостта на бялото вещество при млади възрастни в Framingham Heart Study: A cross -секционно изследване. Lancet Neurol 11, 1039–1047.
[36] Fink HA, Linskens EJ, Silverman PC, McCarten JR, Hemmy LS, Ouellette JM, Greer NL, Wilt TJ, Butler M (2020) Точност на тестването на биомаркери за невропатологично дефинирани Болест на Алцхаймер при по-възрастни хора с деменция. Ann Intern Med 172, 669–677.

Членства: [a] SIVOTEC Analytics, Бока Ратън, Флорида, САЩ | [b] Катедра по компютърно и електротехника и компютърни науки, Флорида Атлантически университет, Бока Ратън, Флорида, САЩ | [c] SJN Biomed LTD, Кунмин, Юнан, Китай | [d] Център за Изследване на Алцхаймер, Вашингтонски институт за клинични изследвания, Вашингтон, окръг Колумбия, САЩ | [e] Катедра по рехабилитационна медицина, Първата свързана болница на Медицинския университет Кунмин, Кунмин, Юнан, Китай | [f] Отделение по неврология, Народна болница Dehong, Dehong, Юнан, Китай | [g] Катедра по неврология, Първата свързана болница на Медицинския университет Кунмин, област Ухуа, Кунмин, провинция Юнан, Китай | [h] Център за изследване на заболявания и наранявания, свързани с войната, Вирджиния Пало Алто Здравеопазване System, Пало Алто, Калифорния, САЩ | [i] Катедра по психиатрия и поведенчески науки, Факултет по медицина на Станфордския университет, Пало Алто, Калифорния, САЩ

Кореспонденция: [*] Кореспонденция до: Michael F. Bergeron, PhD, FACSM, SIVOTEC Analytics, Boca Raton Innovation Campus, 4800 T-Rex Avenue, Suite 315, Boca Raton, FL 33431, САЩ. Електронна поща: mbergeron@sivotecanalytics.com.; Xiaolei Liu, MD, Катедра по неврология, Първа свързана болница на Медицинския университет в Кунминг, 295 Xichang Road, Wuhua District, Kunming, провинция Юнан 650032, Китай. Имейл: ring@vip.163.com.

Ключови думи: стареене, болест на Алцхаймер, деменция, масов скрининг