Полезность MemTrax и моделирования машинного обучения в классификации легких когнитивных нарушений

научная статья

Авторы: Бержерон, Майкл Ф. | Ландсет, Сара | Чжоу, Сяньбо | Дин, Тао | Хошгофтаар, Таги М. | Чжао, Фэн | Ду, Бо | Чен, Синьцзе | Ван, Сюань | Чжун, Ляньмэй | Лю, Сяолэй | Эшфорд, Дж. Вессон

DOI: 10.3233/JAD-191340

Журнал: Журнал Болезнь Альцгеймератом 77, нет 4, стр. 1545-1558, 2020

Абстрактные

Задний план:

Широкая заболеваемость и распространенность Болезнь Альцгеймера и легкие когнитивные нарушения (MCI) вызвали срочный призыв к исследованиям для подтверждения раннего выявления когнитивного скрининга и оценки.

Цель:

Наша основная цель исследования заключалась в том, чтобы определить, можно ли эффективно использовать выбранные показатели производительности MemTrax и соответствующие демографические характеристики и характеристики профиля здоровья в прогностических моделях, разработанных с помощью машинного обучения, для классификации когнитивного здоровья (нормальное по сравнению с MCI), как будет указано Монреальская когнитивная оценка (МОКА).

Методы:

Мы провели кросс-секционное исследование 259 взрослых пациентов, специализирующихся в неврологии, клинике памяти и внутренних болезней, набранных из двух больницы в китае. Каждому пациенту был предоставлен MoCA на китайском языке, и он самостоятельно провел непрерывное распознавание онлайн-эпизода MemTrax. тест памяти онлайн в тот же день. Модели прогнозной классификации были построены с использованием машинного обучения с 10-кратной перекрестной проверкой, а производительность модели измерялась с помощью площади под кривой рабочих характеристик приемника (AUC). Модели были построены с использованием двух показателей производительности MemTrax (процент правильных ответов, время отклика), а также восьми общих демографических и личных характеристик истории.

Результаты:

Сравнивая учащихся по выбранным комбинациям баллов и пороговых значений MoCA, Наивный Байес, как правило, был лучшим учеником с общей эффективностью классификации 0.9093. Кроме того, среди трех лучших учащихся эффективность классификации на основе MemTrax в целом была выше при использовании только четырех лучших функций (0.9119) по сравнению с использованием всех 10 общих функций (0.8999).

Вывод:

Производительность MemTrax может быть эффективно использована в модели прогнозирования классификации машинного обучения. Приложение для скрининга для выявления ранних стадий когнитивных нарушений.

ВВЕДЕНИЕ

Признанная (хотя и не диагностируемая) широкая заболеваемость и распространенность и параллельная эскалация медицинских, социальных и общественных здоровье затраты и бремя болезни Альцгеймера (БА) и легких когнитивных нарушений (УКН) становятся все более тяжелым испытанием для всех заинтересованных сторон [1, 2]. Этот удручающий и зарождающийся сценарий вызвал срочный призыв к исследованиям, чтобы подтвердить раннее выявление инструменты когнитивного скрининга и оценки для регулярного практического использования в личных и клинических условиях для пожилых пациентов в различных регионах и группах населения [3]. Эти инструменты также должны обеспечивать беспрепятственный перевод информативных результатов в электронные медицинские карты. Преимущества будут реализованы за счет информирования пациентов и оказания помощи врачам в распознавании значительных изменений на более раннем этапе, что позволит более оперативно и своевременно проводить стратификацию, внедрение и отслеживание соответствующего индивидуального и более экономичного лечения и ухода за пациентами для тех, кто начинает испытывать снижение когнитивных способностей [3, 4].

Компьютеризированный инструмент MemTrax (https://memtrax.com) представляет собой простую и краткую непрерывную оценку узнавания, которую можно проводить самостоятельно в режиме онлайн для измерения сложной временной производительности эпизодической памяти, когда пользователь реагирует на повторяющиеся изображения, а не на первоначальную презентацию [5, 6]. Недавние исследования и вытекающие из них практические результаты начинают постепенно и коллективно демонстрировать клиническую эффективность MemTrax в раннем скрининге AD и MCI [5–7]. Однако прямое сравнение клинической полезности с существующими когнитивное здоровье оценка и общепринятые стандарты должны информировать профессиональную точку зрения и подтверждать полезность MemTrax для раннего обнаружения и диагностической поддержки. ван дер Хук и др. [8] сравнили отдельные показатели производительности MemTrax (скорость реакции и процент правильных ответов) с когнитивным статусом, определенным Монреальским Когнитивная оценка (МОКА). Однако это исследование ограничивалось связыванием этих показателей производительности с характеристикой когнитивного статуса (согласно MoCA) и определением относительных диапазонов и пороговых значений. Соответственно, чтобы расширить это исследование и улучшить производительность и эффективность классификации, нашим основным исследовательским вопросом было:

  • Могут ли выбранные показатели производительности MemTrax и соответствующие демографические данные и здоровье профиль характеристики могут быть эффективно использованы в прогностической модели, разработанной с помощью машинного обучения, для дихотомической классификации когнитивного здоровья (нормальное или MCI), на что указывает оценка MoCA?

Кроме того, мы хотели знать:

  • Включая те же функции, может ли модель машинного обучения MemTrax, основанная на производительности, быть эффективно применена к пациенту для прогнозирования тяжести (легкая или тяжелая) в рамках выбранных категорий когнитивных нарушений, как это будет определено независимой клинической диагностикой?

Появление и развитие практического применения искусственного интеллекта и машинного обучения в скрининге/обнаружении уже продемонстрировали явные практические преимущества, а прогностическое моделирование эффективно помогает клиницистам в сложной оценке когнитивного здоровья/здоровья мозга и ведении пациентов. В нашем исследовании мы выбрали аналогичный подход к моделированию классификации MCI и различению тяжести когнитивных нарушений, что подтверждается клиническим диагнозом из трех наборов данных, представляющих выбранных стационарных и амбулаторных пациентов-добровольцев из двух больниц в Китае. Используя прогностическое моделирование машинного обучения, мы определили наиболее эффективных учащихся из различных комбинаций наборов данных/учащихся и ранжировали функции, которые помогут нам определить наиболее клинически практичные приложения модели.

Наша гипотеза заключалась в том, что проверенную модель на основе MemTrax можно использовать для дихотомической классификации когнитивного здоровья (нормальное или MCI) на основе порогового критерия совокупного балла MoCA, и что аналогичную прогностическую модель MemTrax можно эффективно использовать для различения тяжести в выбранных категориях нарушений. клинически диагностированный когнитивные нарушения. Демонстрация ожидаемых результатов сыграла бы важную роль в подтверждении эффективности MemTrax в качестве скрининга раннего выявления снижения когнитивных функций и классификации когнитивных нарушений. Благоприятное сравнение с предполагаемым отраслевым стандартом, дополненное гораздо большей простотой и быстротой использования, могло бы помочь клиницистам использовать этот простой, надежный и доступный инструмент в качестве начального скрининга при выявлении когнитивных нарушений на ранней (включая продромальную) стадии. Таким образом, такой подход и полезность могут способствовать более своевременному и лучшему стратифицированному уходу за пациентами и вмешательству. Эти дальновидные идеи и улучшенные показатели и модели также могут быть полезны для смягчения или остановки прогрессирования деменции, включая БА и деменцию, связанную с БА (ADRD).

МАТЕРИАЛЫ И МЕТОДЫ

Исследование населения

В период с января 2018 г. по август 2019 г. было завершено поперечное исследование пациентов, набранных из двух больниц в Китае. Введение MemTrax [5] лицам в возрасте 21 года и старше, а также сбор и анализ этих данных были рассмотрены, одобрены и проведены в соответствии с этическими стандартами Человек Комитет по защите субъектов Стэнфордского университета. MemTrax и все другие тесты для этого общего исследования были выполнены в соответствии с Хельсинкской декларацией 1975 года и одобрены Институциональным наблюдательным советом Первой аффилированной больницы Куньминского медицинского университета в Куньмине, Юньнань, Китай. Каждому пользователю был предоставлен информированное согласие форма для чтения/просмотра, а затем добровольное согласие на участие.

Участники были набраны из пула амбулаторных пациентов в неврологической клинике больницы Яньхуа (суб-набор данных YH) и клиника памяти в Первой дочерней больнице Куньмин Медикал Университет (поднабор данных XL) в Пекине, Китай. Участники также были набраны из стационарных пациентов в области неврологии (поднабор данных XL) и внутренних болезней (поднабор данных KM) в Первой дочерней больнице Куньминского медицинского университета. Критерии включения включали 1) мужчин и женщин в возрасте не моложе 21 года, 2) способность говорить по-китайски (мандаринский диалект) и 3) способность понимать устные и письменные указания. Критериями исключения были нарушения зрения и моторики, препятствовавшие выполнению задания участниками. Тест MemTrax, а также неспособность понять конкретные инструкции по тестированию.

Китайская версия MemTrax

Онлайн Переведена тестовая платформа MemTrax на китайский язык (URL: https://www.memtrax.com.cn) и дополнительно адаптирован для использования через WeChat (Shenzhen Tencent Computer Systems Co. LTD., Шэньчжэнь, провинция Гуандун, Китай) для самостоятельного администрирования. Данные хранились на облачном сервере (Ali Cloud), расположенном в Китае, по лицензии Alibaba (Alibaba Technology Co. Ltd., Ханчжоу, Чжэцзян, Китай) компанией SJN Biomed LTD (Куньмин, Юньнань, Китай). Конкретные сведения о MemTrax и используемых здесь критериях достоверности теста были описаны ранее [6]. Испытание было обеспечено на безвозмездной основе к пациентам.

Учебные процедуры

Для стационарных и амбулаторных больных: общая бумажная анкета для сбора демографической и личной информации, такой как возраст, пол, годы образования, профессия, одиноких или с семьей, и история болезни велась членом исследовательской группы. После заполнения анкеты были проведены тесты MoCA [12] и MemTrax (сначала MoCA) с интервалом между тестами не более 20 минут. Процент правильности MemTrax (MTx-% C), среднее время отклика (MTx-RT), а также дата и время тестирования были записаны на бумаге членом исследовательской группы для каждого тестируемого участника. Заполненный вопросник и результаты MoCA были загружены в электронную таблицу Excel исследователем, проводившим тесты, и проверены коллегой до того, как файлы Excel были сохранены для анализа.

Тест MemTrax

Онлайн-тест MemTrax включал 50 изображений (25 уникальных и 25 повторных; 5 наборов из 5 изображений общих сцен или объектов), показанных в определенном псевдослучайном порядке. Участник (в соответствии с инструкциями) должен был коснуться кнопки «Пуск» на экране, чтобы начать тест и начать просмотр серии изображений, и снова касаться изображения на экране как можно быстрее всякий раз, когда появлялось повторяющееся изображение. Каждое изображение появлялось на 3 с или до касания изображения на экране, что вызывало немедленное предъявление следующего изображения. Используя внутренние часы локального устройства, MTx-RT для каждого изображения определяли по времени, прошедшему с момента представления изображения до момента, когда участник коснулся экрана в ответ на указание на распознавание изображения как уже показанного. во время теста. MTx-RT записывался для каждого изображения, при этом регистрировались полные 3 секунды, что указывало на отсутствие ответа. MTx-% C был рассчитан для указания процента повторных и исходных изображений, на которые пользователь отреагировал правильно (истинно положительный + истинно отрицательный, разделенный на 50). Дополнительные сведения об администрировании и реализации MemTrax, сокращении данных, недействительных данных или данных «нет ответа» и анализе первичных данных описаны в другом месте [6].

Тест MemTrax был подробно объяснен, и участникам в условиях больницы был предоставлен практический тест (с уникальными изображениями, отличными от тех, которые использовались в тесте для записи результатов). Участники субнаборов данных YH и KM прошли тест MemTrax на смартфоне, на который было загружено приложение WeChat; тогда как ограниченное количество пациентов из подгруппы данных XL использовали iPad, а остальные использовали смартфон. Все участники прошли тест MemTrax под ненавязчивым наблюдением исследователя.

Монреальская когнитивная оценка

Пекинская версия китайского MoCA (MoCA-BC) [13] проводилась и оценивалась обученными исследователями в соответствии с официальными инструкциями по тестированию. Соответственно, было показано, что MoCA-BC является надежным тест на познавательный скрининг на всех уровнях образования у пожилых людей в Китае [14]. На проведение каждого теста уходило от 10 до 30 минут в зависимости от когнитивных способностей соответствующего участника.

Классификационное моделирование MoCA

Всего было 29 полезных функций, в том числе две MemTrax. тестировать показатели производительности и 27 функций, связанных с демографией и здоровьем информация для каждого участника. Совокупный балл теста MoCA каждого пациента использовался в качестве когнитивный скрининг «контрольный показатель» для обучения наших прогностических моделей. Соответственно, поскольку MoCA использовался для создания метки класса, мы не могли использовать совокупную оценку (или любую из оценок подмножества MoCA) в качестве независимого признака. Мы провели предварительные эксперименты, в которых мы смоделировали (классифицируя когнитивное здоровье, определенное MoCA) исходные три поднабора данных больниц/клиник по отдельности, а затем объединили, используя все функции. Однако не все одни и те же элементы данных были собраны в каждой из четырех клиник, представляющих три поднабора данных; таким образом, многие из наших функций в комбинированном наборе данных (при использовании всех функций) имели высокую частоту пропущенных значений. Затем мы построили модели с комбинированным набором данных, используя только общие функции, что привело к повышению эффективности классификации. Вероятно, это было объяснено наличием большего количества экземпляров для работы путем объединения трех поднаборов данных пациентов и отсутствием признаков с неправомерным преобладанием пропущенных значений (только один признак в комбинированном наборе данных, тип работы, имел какие-либо пропущенные значения, влияющие на только у трех пациентов), потому что были включены только общие признаки, зарегистрированные во всех трех местах. Примечательно, что у нас не было конкретного критерия отклонения для каждой функции, которая в конечном итоге не была включена в объединенный набор данных. Однако в нашем предварительном моделировании комбинированного набора данных мы сначала использовали все функции из каждого из трех отдельных поднаборов данных о пациентах. Это привело к тому, что производительность модели была значительно ниже, чем при первоначальном предварительном моделировании для каждого отдельного поднабора данных. Более того, в то время как эффективность классификации моделей, построенных с использованием всех функций, была обнадеживающей, для всех обучающихся и схем классификации производительность улучшилась вдвое для большего количества моделей при использовании только общих функций. На самом деле, среди тех, кто в конечном итоге стал нашими лучшими учениками, все модели, кроме одной, улучшились за счет исключения необычных функций.

Окончательный совокупный набор данных (объединенные YH, XL и KM) включал 259 экземпляров, каждый из которых представлял уникального участника, прошедшего тесты MemTrax и MoCA. Было 10 общих независимых функций: показатели производительности MemTrax: MTx-% C и среднее значение MTx-RT; демографические данные и данные медицинского анамнеза: возраст, пол, годы образования, тип работы (синий воротничок/белый воротничок), социальная поддержка (независимо от того, живет ли тестируемый один или с семьей), а также ответы да/нет на то, имел ли пользователь Диабет в анамнезе, гиперлипидемия или черепно-мозговая травма. Две дополнительные метрики, совокупный балл MoCA и совокупный балл MoCA, скорректированный с учетом лет обучения [12], использовались отдельно для разработки зависимых классификационных меток, создавая таким образом две отдельные схемы моделирования, которые будут применяться к нашему объединенному набору данных. Для каждой версии (скорректированной и нескорректированной) оценки MoCA данные снова были отдельно смоделированы для бинарной классификации с использованием двух разных пороговых значений критерия — первоначально рекомендованного [12] и альтернативного значения, используемого и продвигаемого другими [8, 15]. В схеме альтернативной пороговой классификации считалось, что у пациента нормальное когнитивное здоровье, если он / она набрал ≥23 баллов по тесту MoCA, и наличие MCI, если балл был 22 или ниже; тогда как в первоначальном рекомендованном формате классификации пациент должен был набрать 26 баллов или выше по шкале MoCA, чтобы иметь нормальное когнитивное здоровье.

Отфильтрованные данные для моделирования классификации MoCA

Далее мы изучили классификацию MoCA с использованием четырех широко используемых методов ранжирования признаков: хи-квадрат, коэффициент усиления, информационный прирост и симметричная неопределенность. Для промежуточной перспективы мы применили ранжировщики ко всему комбинированному набору данных, используя каждую из наших четырех схем моделирования. Все составители рейтинга согласились с одними и теми же главными характеристиками, т. е. возрастом, количеством лет обучения и обоими показателями производительности MemTrax (MTx-% C, среднее значение MTx-RT). Затем мы перестроили модели, используя каждый метод выбора признаков, чтобы обучить модели только четырем основным признакам (см. Выбор функции ниже).

Итоговые восемь вариантов схем моделирования классификации баллов MoCA представлены в таблице 1.

Таблица 1

Резюме вариантов схемы моделирования, используемых для классификации MoCA (Нормальный Когнитивное здоровье по сравнению с МКИ)

Схема моделированияНормальное когнитивное здоровье (отрицательный класс)MCI (положительный класс)
Скорректировано-23 Нефильтрованное/фильтрованное101 (39.0%)158 (61.0%)
Скорректировано-26 Нефильтрованное/фильтрованное49 (18.9%)210 (81.1%)
Нескорректированный-23 Нефильтрованный/фильтрованный92 (35.5%)167 (64.5%)
Нескорректированный-26 Нефильтрованный/фильтрованный42 (16.2%)217 (83.8%)

Соответствующее количество и процент от общего числа пациентов в каждом классе различаются корректировкой баллов по образованию (с поправкой или без поправки) и порогом классификации (23 или 26) применительно к обоим наборам характеристик (без фильтрации и с фильтрацией).

Моделирование клинической оценки на основе MemTrax

Из наших трех исходных субнаборов данных (YH, XL, KM) только пациенты с субнабором XL были независимо клинически диагностированы в отношении когнитивных нарушений (т. е. их соответствующие баллы MoCA не использовались при установлении классификации нормальных и нарушенных). В частности, у пациентов XL был диагностирован либо тест на болезнь альцгеймера (AD) или сосудистой деменции (VaD). В рамках каждой из этих первичных диагностических категорий было дополнительное обозначение ЛКН. Диагнозы MCI, деменции, сосудистого нейрокогнитивного расстройства и нейрокогнитивного расстройства, вызванного AD, были основаны на специфических и отличительных диагностических критериях, изложенных в Диагностическом и статистическом руководстве по психическим расстройствам: DSM-5 [16]. Принимая во внимание эти уточненные диагнозы, две схемы моделирования классификации были отдельно применены к поднабору данных XL, чтобы различать уровень серьезности (степень нарушения) для каждой категории основного диагноза. Данные, использованные в каждой из этих схем диагностического моделирования (AD и VaD), включали демографическую информацию и информацию об истории болезни пациента, а также производительность MemTrax (MTx-% C, среднее значение MTx-RT). Каждый диагноз считался легким, если он обозначался MCI; в противном случае это считалось серьезным. Первоначально мы рассматривали возможность включения оценки MoCA в диагностические модели (легкая или тяжелая форма); но мы решили, что это противоречит цели нашей схемы вторичного прогнозного моделирования. Здесь учащиеся будут обучаться, используя другие характеристики пациента, легко доступные поставщику, и показатели эффективности более простого теста MemTrax (вместо MoCA) в сравнении с эталонным «золотым стандартом», независимым клиническим диагнозом. В наборе данных диагностики AD было 69 случаев и 76 случаев VaD (таблица 2). В обоих наборах данных было 12 независимых признаков. В дополнение к 10 характеристикам, включенным в классификацию баллов MoCA, история болезни пациента также включала информацию об истории гипертонии и инсульта.

Таблица 2

Резюме вариантов схемы моделирования, используемых для классификации серьезности диагноза (легкая или тяжелая)

Схема моделированияЛегкий (отрицательный класс)Тяжелая (положительный класс)
MCI-AD по сравнению с AD12 (17.4%)57 (82.6%)
MCI-VaD против VaD38 (50.0%)38 (50.0%)

Соответствующее количество и процент от общего числа пациентов в каждом классе дифференцируются по категории первичного диагноза (БА или СД).

Показатели

Сравнение характеристик участников и других числовых характеристик между поднаборами данных для каждой стратегии классификации модели (для прогнозирования когнитивного здоровья MoCA и тяжести диагноза) было выполнено с использованием языка программирования Python (версия 2.7.1) [17]. Различия в производительности моделей первоначально определялись с использованием однофакторного или двухфакторного (в зависимости от обстоятельств) дисперсионного анализа с доверительным интервалом 95% и теста честной значимой разницы Тьюки (HSD) для сравнения средних значений производительности. Это исследование различий между производительностью моделей было выполнено с использованием комбинации Python и R (версия 3.5.1) [18]. Мы использовали этот (хотя, возможно, и менее оптимальный) подход только в качестве эвристической помощи на этом этапе. ранняя стадия для начального сравнения производительности модели в ожидании потенциального клинического применения. Затем мы использовали байесовский критерий знакового ранга с использованием апостериорного распределения для определения вероятности различий в производительности модели [19]. Для этих анализов мы использовали интервал –0.01, 0.01, означающий, что если две группы имели разницу в результатах менее 0.01, они считались одинаковыми (в пределах области практической эквивалентности), или в противном случае они были разными (одна лучше, чем другой). Для выполнения байесовского сравнения классификаторов и расчета этих вероятностей мы использовали библиотеку baycomp (версия 1.0.2) для Python 3.6.4.

Прогнозное моделирование

Мы построили прогностические модели, используя десять полных вариантов наших схем моделирования, чтобы предсказать (классифицировать) результат теста MoCA каждого пациента или тяжесть клинического диагноза. Все учащиеся были применены, и модели были построены с использованием программной платформы с открытым исходным кодом Weka [20]. Для нашего предварительного анализа мы использовали 10 часто используемых алгоритмов обучения: 5 ближайших соседей, две версии дерева решений C4.5, логистическую регрессию, многослойный персептрон, наивный байесовский метод, две версии случайного леса, радиальную базисную функциональную сеть и опорный вектор. Машина. Ключевые атрибуты и отличия этих алгоритмов описаны в другом месте [21] (см. соответствующее Приложение). Они были выбраны потому, что они представляют множество различных типов учащихся, и потому что мы продемонстрировали их успешное использование в предыдущих анализах аналогичных данных. Настройки гиперпараметров были выбраны из нашего предыдущего исследования, что указывает на то, что они устойчивы к множеству различных данных [22]. Основываясь на результатах нашего предварительного анализа с использованием того же комбинированного набора данных с общими характеристиками, которые впоследствии использовались в полном анализе, мы определили три обучающихся, которые показали стабильно высокие результаты во всех классификациях: логистическая регрессия, наивный байесовский алгоритм и метод опорных векторов.

Метрика перекрестной проверки и производительности модели

Для всего прогностического моделирования (включая предварительный анализ) каждая модель была построена с использованием 10-кратной перекрестной проверки, а производительность модели измерялась с использованием площади под кривой рабочих характеристик приемника (AUC). Перекрестная проверка началась со случайного разделения каждого из 10 наборов данных схемы моделирования на 10 равных сегментов (сгибов), с использованием девяти из этих соответствующих сегментов для обучения модели и оставшегося сегмента для тестирования. Эту процедуру повторяли 10 раз, используя в каждой итерации в качестве тестового набора разные сегменты. Затем результаты были объединены для расчета окончательного результата/производительности модели. Для каждой комбинации учащегося/набора данных весь этот процесс повторялся 10 раз, при этом данные каждый раз разделялись по-разному. Этот последний шаг уменьшил систематическую ошибку, обеспечил воспроизводимость и помог определить общую производительность модели. Всего (для шкалы MoCA и схем классификации тяжести диагноза вместе взятых) было построено 6,600 моделей. Это включало 1,800 нефильтрованных моделей (6 схем моделирования, примененных к набору данных × 3 обучающихся × 10 прогонов × 10 кратностей = 1,800 моделей) и 4,800 отфильтрованных моделей (4 схемы моделирования, примененных к набору данных × 3 обучающихся × 4 метода выбора признаков × 10 прогонов × 10 складок = 4,800 моделей).

Выбор функции

Для отфильтрованных моделей выбор признаков (с использованием четырех методов ранжирования признаков) выполнялся в рамках перекрестной проверки. Для каждой из 10 кратностей, поскольку различные 10 % набора данных были тестовыми данными, использовались только четыре верхних выбранных признака для каждого обучающего набора данных (т. е. остальные девять кратностей или оставшиеся 90 % всего набора данных). для построения моделей. Нам не удалось подтвердить, какие четыре функции использовались в каждой модели, поскольку эта информация не хранится и не предоставляется в рамках используемой нами платформы моделирования (Weka). Однако, учитывая согласованность в нашем первоначальном выборе основных характеристик, когда ранжировщики применялись ко всему объединенному набору данных, и последующее сходство в характеристиках моделирования, эти же характеристики (возраст, годы образования, MTx-% C и среднее значение MTx-RT ), вероятно, являются наиболее распространенными четырьмя лучшими, используемыми одновременно с выбором функций в процессе перекрестной проверки.

РЕЗУЛЬТАТЫ

Численные характеристики участников (включая баллы MoCA и показатели производительности MemTrax) соответствующих наборов данных для каждой стратегии классификации моделей для прогнозирования когнитивного здоровья, указанного MoCA (нормальное по сравнению с MCI), и серьезности диагноза (легкое или тяжелое) показаны в таблице 3.

Таблица 3

Характеристики участников, баллы MoCA и производительность MemTrax для каждой стратегии классификации моделей

Стратегия классификацииВозрастОбучениеMoCA скорректированоMoCA без поправокМТх-%СМТх-РТ
Категория MoCA61.9 года (13.1)9.6 года (4.6)19.2 (6.5)18.4 (6.7)74.8% (15.0)1.4 с (0.3)
Диагноз Серьезность65.6 года (12.1)8.6 года (4.4)16.7 (6.2)15.8 (6.3)68.3% (13.8)1.5 с (0.3)

Показанные значения (среднее, SD), дифференцированные с помощью стратегий классификации моделирования, представляют собой комбинированный набор данных, используемый для прогнозирования когнитивного здоровья, указанного MoCA (MCI по сравнению с нормальным), и поднабор данных XL, используемый только для прогнозирования тяжести диагноза (легкая или тяжелая).

Для каждой комбинации оценки MoCA (скорректированной/нескорректированной) и порогового значения (26/23) наблюдалась статистическая разница (p = 0.000) в каждом попарном сравнении (нормальное когнитивное здоровье по сравнению с MCI) для возраста, образования и производительности MemTrax (MTx-% C и MTx-RT). Каждый поднабор данных пациентов в соответствующем классе MCI для каждой комбинации был в среднем примерно на 9–15 лет старше, сообщал о примерно на пять лет меньше образования и имел менее благоприятные показатели MemTrax для обоих показателей.

Результаты прогнозного моделирования для классификаций баллов MoCA с использованием трех лучших учащихся, логистической регрессии, наивного байесовского метода и метода опорных векторов показаны в таблице 4. Эти три были выбраны на основе наиболее стабильно высоких абсолютных показателей учащихся во всех различных моделях. применяется к наборам данных для всех схем моделирования. Для нефильтрованного набора данных и моделирования каждое из значений данных в таблице 4 указывает на производительность модели на основе соответствующего среднего значения AUC, полученного из 100 моделей (10 прогонов × 10 кратностей), построенных для каждой комбинации схемы обучения/моделирования, с соответствующим самым высоким значением. выступающий учащийся выделен жирным шрифтом. Принимая во внимание, что для моделирования отфильтрованного набора данных результаты, представленные в таблице 4, отражают общие средние характеристики модели из 400 моделей для каждого учащегося с использованием каждого из методов ранжирования признаков (4 метода ранжирования признаков × 10 прогонов × 10 кратностей).

Таблица 4

Результаты оценки дихотомической оценки MoCA (AUC; 0.0–1.0) для каждого из трех учащихся с лучшими показателями для всех соответствующих схем моделирования.

Используемый набор функцийОценка МоСАПорог отсечкиЛогистическая регрессияНаивный БайесМашина опорных векторов
Нефильтрованное (10 функций)Отрегулированный230.88620.89130.8695
260.89710.92210.9161
Без корректировки230.91030.90850.8995
260.88340.91530.8994
Отфильтровано (4 функции)Отрегулированный230.89290.89540.8948
260.91880.92470.9201
Без корректировки230.91350.91340.9122
260.91590.92360.9177

Используя различные наборы функций, оценку MoCA и пороговое значение оценки MoCA, самая высокая производительность для каждой схемы моделирования показана на рис. булавка (не обязательно статистически отличается от всех остальных, не булавка для соответствующей модели).

Сравнивая учащихся по всем комбинациям версий и порогов оценки MoCA (скорректированные/нескорректированные и 23/26 соответственно) в комбинированном нефильтрованном наборе данных (т. классификационная эффективность 10. Принимая во внимание трех лучших учащихся, байесовские критерия знакового ранга показали, что вероятность (Pr) наивного байесовского алгоритма превосходит логистическую регрессию на 99.9%. Более того, между наивным байесовским методом и методом опорных векторов 21.0% вероятность практической эквивалентности в производительности учащегося (таким образом, 79.0% вероятность того, что наивный байесовский метод превзойдет метод опорных векторов), в сочетании с 0.0% вероятностью того, что метод опорных векторов работает лучше, что значительно усиливает преимущество в производительности для наивного байесовского алгоритма. Дальнейшее сравнение версии оценки MoCA по всем учащимся/пороговым значениям показало небольшое преимущество в производительности при использовании нескорректированных оценок MoCA по сравнению со скорректированными (0.9027 против 0.8971 соответственно; Pr (без поправки > с поправкой) = 0.988). Аналогичным образом, сравнение порога отсечения для всех учащихся и версий оценок MoCA показало небольшое преимущество в эффективности классификации при использовании 26 в качестве порога классификации по сравнению с 23 (0.9056 против 0.8942 соответственно; Pr (26 > 23) = 0.999). Наконец, при изучении эффективности классификации для моделей, использующих только отфильтрованные результаты (т. е. только четыре признака с наивысшим рейтингом), наивный байесовский метод (0.9143) был численно лучшим учеником по всем версиям/пороговым значениям оценки MoCA. Тем не менее, по всем методам ранжирования функций все наиболее успешные учащиеся показали одинаковые результаты. Байесовские знаковые ранговые тесты показали 100% вероятность практической эквивалентности между каждой парой отфильтрованных учащихся. Как и в случае с нефильтрованными данными (с использованием всех 10 общих признаков), нескорректированная версия оценки MoCA снова показала преимущество в производительности (Pr (нескорректированный > скорректированный) = 1.000), а также такое же явное преимущество для порога классификации 26 (Pr (26 > 23) = 1.000). Примечательно, что средняя производительность каждого из трех лучших учащихся по всем версиям/пороговым значениям оценки MoCA с использованием только четырех лучших функций превышала среднюю производительность любого учащегося на нефильтрованных данных. Неудивительно, что эффективность классификации отфильтрованных моделей (использующих четыре наиболее важных признака) в целом была выше (0.9119) по сравнению с неотфильтрованными моделями (0.8999), независимо от моделей метода ранжирования признаков, которые сравнивались с соответствующими моделями, использующими все 10 распространенных признаков. Особенности. Для каждого метода выбора признаков существовала 100% вероятность преимущества в производительности по сравнению с нефильтрованными моделями.

У пациентов, рассматриваемых для классификации тяжести диагноза БА, различия между группами (MCI-AD по сравнению с БА) по возрасту (p = 0.004), образование (p = 0.028), оценка MoCA с поправкой/без поправки (p = 0.000), и MTx-%C (p = 0.008) были статистически значимыми; тогда как для MTx-RT этого не было (p = 0.097). С теми пациентами, которые рассматривались для классификации тяжести диагноза СД, межгрупповые (MCI-VAD по сравнению с СД) различия по шкале MoCA с поправкой/без поправки (p = 0.007) и MTx-%C (p = 0.026) и MTx-RT (p = 0.001) были статистически значимыми; а по возрасту (p = 0.511) и образование (p = 0.157) достоверных межгрупповых различий не было.

Результаты прогнозного моделирования для классификаций серьезности диагноза с использованием трех ранее выбранных обучаемых, логистической регрессии, наивного байесовского метода и метода опорных векторов, показаны в таблице 5. Принимая во внимание, что дополнительные обследованные обучающиеся продемонстрировали несколько более высокие результаты индивидуально с одной из двух категорий клинического диагноза. , три ученика, которых мы определили как наиболее подходящих в нашем предыдущем моделировании, показали наиболее стабильную работу с обеими новыми схемами моделирования. При сравнении учащихся по каждой из категорий первичного диагноза (AD и VaD) не было последовательной разницы в эффективности классификации между учащимися для MCI-VAD по сравнению с VaD, хотя машина опорных векторов в целом работала более заметно. Точно так же не было значительных различий между учащимися для классификации MCI-AD и AD, хотя наивный байесовский метод (NB) имел небольшое преимущество в производительности по сравнению с логистической регрессией (LR) и лишь незначительное множество по сравнению с методом опорных векторов с вероятностью 61.4%. и 41.7% соответственно. В обоих наборах данных было общее преимущество в производительности для машины опорных векторов (SVM), с Pr (SVM > LR) = 0.819 и Pr (SVM > NB) = 0.934. Наша общая эффективность классификации среди всех учащихся в прогнозировании серьезности диагноза в поднаборе данных XL была лучше в категории диагноза СД по сравнению с БА (Pr (VAD > AD) = 0.998).

Таблица 5

Результаты дихотомической классификации тяжести клинического диагноза (AUC; 0.0–1.0) для каждого из трех учащихся с лучшими показателями для обеих соответствующих схем моделирования

Схема моделированияЛогистическая регрессияНаивный БайесМашина опорных векторов
MCI-AD по сравнению с AD0.74650.78100.7443
MCI-VaD против VaD0.80330.80440.8338

Наивысшая производительность для каждой схемы моделирования показана на булавка (не обязательно статистически отличается от других, не булавка).

ОБСУЖДЕНИЕ

Важное значение имеет раннее обнаружение изменений в когнитивном здоровье. практическая полезность как в управлении личным здоровьем, так и в общественном здравоохранении. Действительно, это также является очень важным приоритетом в клинических условиях для пациентов во всем мире. Общая цель состоит в том, чтобы предупредить пациентов, лиц, осуществляющих уход, и поставщиков медицинских услуг и предложить более раннее надлежащее и экономически эффективное лечение и долгосрочный уход для тех, кто начинает испытывать снижение когнитивных функций. Объединив наши три подмножества данных о больницах/клиниках, мы определили трех отчетливо предпочтительных учащихся (с одним заметным выдающимся игроком — наивным байесовским алгоритмом) для построения прогностических моделей с использованием Показатели производительности MemTrax, которые могут надежно классифицировать состояние когнитивного здоровья дихотомически (нормальное когнитивное здоровье или MCI), на что указывает совокупный балл MoCA. Примечательно, что общая эффективность классификации для всех трех учащихся улучшилась, когда в наших моделях использовались только четыре функции с наивысшим рейтингом, которые в основном охватывают эти показатели производительности MemTrax. Кроме того, мы выявили обоснованный потенциал использования одних и тех же учащихся и показателей производительности MemTrax в схеме моделирования классификации диагностической поддержки, чтобы различать серьезность двух категорий диагноза деменции: AD и VaD.

Проверка памяти занимает центральное место в раннем выявлении БА [23, 24]. Таким образом, вполне уместно, что MemTrax является приемлемым, привлекательным и простым в реализации онлайн-приложением. скрининг-тест на эпизодическую память в общей популяции [6]. Точность распознавания и время отклика в этой непрерывной задаче особенно показательны для выявления раннего и развивающегося ухудшения и последующего дефицита нейропластических процессов, связанных с обучением, памятью и познанием. То есть модели здесь, которые в основном основаны на показателях производительности MemTrax, чувствительны и с большей вероятностью легко и с минимальными затратами выявляют биологические нейропатологические дефициты во время переходной бессимптомной стадии задолго до более значительной функциональной потери [25]. Эшфорд и др. внимательно изучили закономерности и поведение точности распознавания памяти и времени отклика у онлайн-пользователей, которые самостоятельно участвовали в MemTrax [6]. Учитывая, что эти распределения имеют решающее значение для оптимального моделирования и разработки надежных и эффективных приложений для ухода за пациентами, определение клинически применимых профилей распознавания и времени отклика имеет важное значение для создания ценной основополагающей ссылки для клинической и исследовательской полезности. Практическая ценность MemTrax в скрининге AD на ранние стадии когнитивных нарушений и в дифференциальной диагностической поддержке должна быть затем более тщательно изучена в контексте клинических условий, где можно учитывать сопутствующие заболевания, а также когнитивные, сенсорные и двигательные способности, влияющие на выполнение теста. И чтобы информировать профессиональную перспективу и поощрять практическую клиническую полезность, в первую очередь необходимо продемонстрировать сравнение с установленным тестом для оценки когнитивного здоровья, даже если последний может быть заметно ограничен громоздкой логистикой тестирования, образованием и языковыми сдерживающими факторами, а также культурными влияниями [26]. . В этом отношении благоприятное сравнение MemTrax по клинической эффективности с MoCA, которое обычно считается отраслевым стандартом, имеет большое значение, особенно с учетом большей простоты использования и приемлемости MemTrax для пациентов.

Предыдущее исследование, сравнивающее MemTrax с MoCA, подчеркивает обоснование и предварительные доказательства, оправдывающие наше исследование моделирования [8]. Однако это предварительное сравнение просто связывало два ключевых показателя производительности MemTrax, которые мы исследовали, с когнитивным статусом, определенным MoCA, и определяло соответствующие диапазоны и пороговые значения. Мы углубили оценку клинической полезности MemTrax, изучив подход, основанный на прогнозном моделировании, который обеспечил бы более индивидуализированный учет других потенциально важных параметров для конкретного пациента. В отличие от других, мы не обнаружили преимущества в производительности модели с использованием поправки на образование (корректировки) к баллу MoCA или в изменении порога совокупного балла MoCA, различающего когнитивное здоровье, с первоначально рекомендованных 26 до 23 [12, 15]. Фактически, преимущество в производительности классификации благоприятствовало использованию нескорректированного показателя MoCA и более высокого порога.

Ключевые моменты в клинической практике

Машинное обучение часто лучше всего используется и наиболее эффективно в прогнозном моделировании, когда данные обширны и многомерны, то есть когда есть многочисленные наблюдения и сопутствующий широкий набор ценных (влияющих) атрибутов. Тем не менее, с этими текущими данными отфильтрованные модели только с четырьмя выбранными функциями работали лучше, чем модели, использующие все 10 общих функций. Это говорит о том, что наш совокупный набор больничных данных не имел наиболее клинически подходящих (высоких значений) признаков для оптимальной классификации пациентов таким образом. Тем не менее, акцент при ранжировании функций на ключевых показателях производительности MemTrax — MTx-% C и MTx-RT — убедительно поддерживает создание моделей скрининга когнитивного дефицита на ранней стадии на основе этого теста, который является простым, легким в администрировании, недорогим и точно раскрывающим в отношении производительность памяти, по крайней мере, прямо сейчас в качестве начального экрана для бинарной классификации когнитивного статуса здоровья. Учитывая постоянно растущую нагрузку на поставщиков и системы здравоохранения, процессы скрининга пациентов и клинические приложения должны быть соответствующим образом разработаны с упором на сбор, отслеживание и моделирование тех характеристик пациентов и тестовых показателей, которые являются наиболее полезными, выгодными и доказали свою эффективность в диагностике. и поддержка управления пациентами.

С двумя ключевыми показателями MemTrax, играющими центральную роль в классификации MCI, наш лучший ученик (наивный байесовский метод) имел очень высокую прогностическую эффективность в большинстве моделей (AUC более 0.90) с соотношением истинно положительных и ложноположительных результатов, приближающимся или несколько превышающим 4. : 1. Трансляционное клиническое приложение, использующее этот обучающий модуль, таким образом, охватит (правильно классифицирует) подавляющее большинство людей с когнитивным дефицитом, минимизируя при этом затраты, связанные с ошибочной классификацией человека с нормальным когнитивным здоровьем как человека с когнитивным дефицитом (ложноположительный результат) или отсутствие этой классификации у тех, у кого действительно есть когнитивный дефицит (ложноотрицательный результат). Любой из этих сценариев неправильной классификации может создать чрезмерное психосоциальное бремя для пациента и лиц, осуществляющих уход.

В то время как в предварительном и полном анализе мы использовали все десять учащихся в каждой схеме моделирования, мы сосредоточили наши результаты на трех классификаторах, демонстрирующих наиболее стабильно высокие результаты. Это также должно было выделить на основе этих данных учащихся, которые, как ожидается, будут надежно работать на высоком уровне в практическом клиническом применении при определении классификации когнитивного статуса. Более того, поскольку это исследование было задумано как вводное исследование полезности машинного обучения для когнитивного скрининга и этих своевременных клинических проблем, мы приняли решение сохранить простые и обобщенные методы обучения с минимальной настройкой параметров. Мы понимаем, что этот подход, возможно, ограничивал возможности более узко определенных прогностических возможностей для конкретных пациентов. Аналогичным образом, в то время как обучение моделей с использованием только основных функций (фильтрованный подход) информирует нас об этих данных (в частности, о недостатках в собранных данных и подчеркивает ценность оптимизации драгоценного клинического времени и ресурсов), мы признаем, что преждевременно сужать объем моделей и, следовательно, все (и другие функции) следует учитывать в будущих исследованиях, пока у нас не будет более определенного профиля приоритетных функций, которые будут применимы к широкой популяции. Таким образом, мы также полностью осознаем, что потребуются более полные и широко репрезентативные данные и оптимизация этих и других моделей, прежде чем интегрировать их в эффективное клиническое приложение, особенно для учета сопутствующих заболеваний, влияющих на когнитивные функции, которые необходимо будет учитывать при дальнейшей клинической оценке.

Полезность MemTrax была дополнительно подтверждена моделированием тяжести заболевания на основе отдельного клинического диагноза. Лучшей общей эффективности классификации в прогнозировании тяжести СД (по сравнению с БА) не было. удивительно, учитывая особенности профиля пациента в моделях, специфичных для здоровья сосудов и риск инсульта, то есть гипертония, гиперлипидемия, диабет и (конечно) инсульт в анамнезе. Хотя было бы более желательно и уместно провести такую ​​же клиническую оценку на соответствующих пациентах с нормальным когнитивным здоровьем, чтобы обучать учащихся с помощью этих более инклюзивных данных. Это особенно оправдано, поскольку MemTrax предназначен в первую очередь для раннего выявления когнитивного дефицита и последующего отслеживания индивидуальных изменений. Также вероятно, что более желательное распределение данных в наборе данных VaD частично способствовало сравнительно лучшей производительности моделирования. Набор данных VaD был хорошо сбалансирован между двумя классами, тогда как набор данных AD с гораздо меньшим количеством пациентов с MCI не был таким. В частности, в небольших наборах данных даже несколько дополнительных экземпляров могут иметь измеримое значение. Обе точки зрения являются разумными аргументами, лежащими в основе различий в эффективности моделирования тяжести заболевания. Однако пропорциональное приписывание улучшенных характеристик числовым характеристикам набора данных или неотъемлемым особенностям, характерным для рассматриваемой клинической картины, преждевременно. Тем не менее, эта новая продемонстрированная полезность модели прогностической классификации MemTrax в роли клинической диагностической поддержки обеспечивает ценную перспективу и подтверждает стремление к дополнительному обследованию пациентов по всему континууму MCI.

Внедрение и продемонстрированная полезность MemTrax и этих моделей в Китае, где язык и культура резко отличаются от других регионов с установившейся полезностью (например, Франции, Нидерландов и США) [7, 8, 27], еще больше подчеркивает потенциал за широкое глобальное признание и клиническую ценность платформы на основе MemTrax. Это наглядный пример стремления к гармонизации данных и разработке практических международных норм и ресурсов моделирования для когнитивного скрининга, которые стандартизированы и легко адаптируются для использования во всем мире.

Следующие шаги в моделировании и применении когнитивных нарушений

Когнитивная дисфункция при БА действительно происходит непрерывно, а не отдельными стадиями или шагами [28, 29]. Однако на этом раннем этапе наша цель состояла в том, чтобы сначала установить нашу способность построить модель, включающую MemTrax, которая может фундаментально отличать «нормальное» от «ненормального». Более полные эмпирические данные (например, изображения головного мозга, генетические особенности, биомаркеры, сопутствующие заболевания и функциональные маркеры сложных деятельность, требующая познавательного контроля) [30] в различных глобальных регионах, популяциях и возрастных группах для обучения и разработки более сложных (включая правильно взвешенный ансамбль) моделей машинного обучения будет поддерживать более высокую степень расширенной классификации, то есть способность классифицировать группы пациентов с MCI на более мелкие и более определенные подмножества вдоль континуума снижения когнитивных функций. Более того, сопутствующие клинические диагнозы у людей из различных популяций пациентов в разных регионах имеют важное значение для эффективно тренировать эти более инклюзивные и предсказуемо надежные модели. Это облегчит более конкретное стратифицированное ведение пациентов с аналогичным происхождением, влиянием и более узко определенными характерными когнитивными профилями и, таким образом, оптимизирует поддержку принятия клинических решений и уход за пациентами.

Большая часть релевантных клинических исследований, проведенных на сегодняшний день, была посвящена пациентам, по крайней мере, с легкой деменцией; и на практике слишком часто вмешательство пациента предпринимается только на поздних стадиях. Однако, поскольку снижение когнитивных функций начинается задолго до того, как будут соблюдены клинические критерии деменции, эффективно применяемый ранний скрининг на основе MemTrax может стимулировать надлежащее информирование людей о болезни и ее прогрессировании и побуждать к более ранним и своевременным вмешательствам. Таким образом, раннее выявление может поддерживать подходящие мероприятия, начиная от упражнений, диеты, эмоциональной поддержки и улучшения социализации и заканчивая фармакологическим вмешательством, а также усиливать связанные с пациентом изменения в поведении и восприятии, которые по отдельности или в совокупности могут смягчить или потенциально остановить прогрессирование деменции [31, 32]. . Более того, при эффективном ранний скрининг, людям и их семьям может быть предложено рассмотреть клинические испытания или получить консультацию и другие социальные услуги, чтобы помочь прояснить ожидания и намерения и справиться с повседневными задачами. Дальнейшая проверка и широкое практическое применение этих способов могут сыграть важную роль в смягчении или остановке прогрессирования MCI, AD и ADRD для многих людей.

Действительно, нижняя граница возрастного диапазона пациентов в нашем исследовании не представляет популяцию, которую традиционно беспокоят БА. Тем не менее, средний возраст для каждой группы, использованной в схемах моделирования классификации на основе оценки/порогового значения MoCA и тяжести диагноза (таблица 3), подчеркивает явное большинство (более 80%) в возрасте не менее 50 лет. Таким образом, это распределение очень подходит для обобщения, подтверждая полезность этих моделей в популяции, характеризующей тех, кто обычно страдает от раннее начало и развивающееся нейрокогнитивное заболевание из-за AD и VaD. Кроме того, недавние данные и перспективы подчеркивают те признанные факторы (например, гипертония, ожирение, диабет и курение), которые потенциально способствуют более высокому оценки сердечно-сосудистого риска во взрослом и зрелом возрасте и последующее малозаметное сосудистое повреждение головного мозга, которое развивается коварно с очевидными последствиями даже у молодых взрослые [33–35]. Соответственно, наиболее оптимальная первичная скрининговая возможность для раннего выявления стадию когнитивного дефицита и инициирование эффективных стратегий профилактики и вмешательства для успешного лечения деменции будет выявлено при изучении способствующих факторов и предшествующих показателей по всему возрастному спектру, включая ранний взрослый возраст и, возможно, даже детство (отмечая актуальность генетических факторов, таких как аполипопротеин Е на ранних сроках беременности).

На практике достоверные клинические диагнозы и дорогостоящие процедуры расширенной визуализации, генетического профилирования и измерения многообещающих биомаркеров не всегда доступны или даже осуществимы для многих поставщиков медицинских услуг. Таким образом, во многих случаях первоначальная классификация общего когнитивного состояния здоровья может быть получена из моделей с использованием других простых показателей, предоставленных пациентом (например, проблемы с памятью, текущие лекарства и ограничения рутинной активности) и общие демографические особенности [7]. Реестры, такие как Калифорнийский университет Здоровье мозга Registry (https://www.brainhealthregistry.org/) [27] и другие с присущей большей широтой самоотчетных симптомов, качественных показателей (например, сон и повседневное познание), лекарств, состояния здоровья и анамнеза, а также более подробные демографические данные будут способствовать разработке и проверке практического применения этих более примитивных моделей в клинике. Кроме того, такой тест, как MemTrax, который продемонстрировал полезность для оценки функции памяти, может на самом деле обеспечить значительно лучшую оценку патологии AD, чем биологические маркеры. Учитывая, что основной особенностью патологии БА является нарушение нейропластичности и крайне сложная потеря синапсов, которая проявляется в виде эпизодических дисфункция памяти, мера, которая оценивает эпизодическую память, на самом деле может обеспечивают лучшую оценку патологического бремени болезни Альцгеймера, чем биологические маркеры у живого пациента [36].

Со всеми прогностическими моделями — независимо от того, дополняются ли они комплексными и инклюзивными данными, полученными с помощью новейших технологий и уточненными клиническими данными в нескольких областях, или моделями, ограниченными более простой и доступной информацией, характерной для существующих профилей пациентов, — признанное преимущество искусственного интеллекта а машинное обучение заключается в том, что результирующие модели могут синтезировать и индуктивно «учиться» на соответствующих новых данных и перспективах, предоставляемых текущим использованием приложений. После практической передачи технологий, по мере того как модели, которые здесь (и которые будут разработаны), применяются и обогащаются большим количеством случаев и соответствующих данных (включая пациентов с сопутствующими заболеваниями, которые могут проявляться последующим снижением когнитивных функций), эффективность прогнозирования и классификация когнитивного здоровья будут более надежными. что приводит к более эффективной полезности поддержки принятия клинических решений. Эта эволюция будет реализована более полно и практически за счет встраивания MemTrax в настраиваемые (ориентированные на доступные возможности) платформы, которые медицинские работники смогут использовать в режиме реального времени в клинике.

Обязательным условием проверки и полезности модели MemTrax для диагностической поддержки и ухода за пациентами являются востребованные значимые продольные данные. Наблюдая и регистрируя сопутствующие изменения (если таковые имеются) в клиническом состоянии в адекватном диапазоне от нормального до ранней стадии MCI, модели для соответствующей текущей оценки и классификации могут быть обучены и изменены по мере старения пациентов и лечения. То есть повторная полезность может помочь в лонгитюдном отслеживании умеренных когнитивных изменений, эффективности вмешательства и поддержании информированного стратифицированного лечения. Этот подход более тесно связан с клинической практикой и ведением пациентов и случаев.

ограничения

Мы понимаем сложность и ценность сбора чистых клинических данных в контролируемых условиях клиники/больницы. Тем не менее, наше моделирование было бы лучше, если бы наши наборы данных включали больше пациентов с общими чертами. Более того, с учетом нашего моделирования диагноза было бы более желательно и уместно провести такую ​​же клиническую оценку на соответствующих пациентах с нормальным когнитивным здоровьем для обучения учащихся. И, как подчеркивается более высокой эффективностью классификации с использованием отфильтрованного набора данных (только четыре верхних признака), более общие и показатели/показатели когнитивного здоровья, вероятно, улучшились бы производительность моделирования с большим количеством общих признаков для всех пациентов.

Некоторые участники могли одновременно страдать другими заболеваниями, которые могли вызвать временные или хронические когнитивные нарушения. За исключением поднабора данных XL, где пациенты были диагностически классифицированы как страдающие БА или СД, данные о сопутствующих заболеваниях не собирались и не сообщались в пуле пациентов с YH, а преобладающим зарегистрированным сопутствующим заболеванием на сегодняшний день в поднаборе данных KM был диабет. Однако можно утверждать, что включение в наши схемы моделирования пациентов с сопутствующими заболеваниями, которые могут спровоцировать или усугубить уровень когнитивного дефицита и, как следствие, более низкую производительность MemTrax, будет более репрезентативным для реальной целевой популяции пациентов для этого более общего раннего когнитивного скрининга. и подход к моделированию. В дальнейшем точная диагностика сопутствующих заболеваний, потенциально влияющих на когнитивные функции, в целом полезна для оптимизации моделей и соответствующих приложений для ухода за пациентами.

Наконец, пациенты из подгруппы данных YH и KM использовали смартфон для прохождения теста MemTrax, тогда как ограниченное число пациентов из подгруппы данных XL использовали iPad, а остальные использовали смартфон. Это могло привести к незначительной разнице в производительности MemTrax, связанной с устройством, для моделирования классификации MoCA. Однако различия (если они есть) в MTx-RT, например, между устройствами, вероятно, будут незначительными, особенно если каждому участнику будет предложен «тренировочный» тест непосредственно перед записанным выполнением теста. Тем не менее, полезность этих двух портативных устройств потенциально ставит под угрозу прямое сравнение и/или интеграцию с другими результатами MemTrax, когда пользователи реагировали на повторяющиеся изображения, нажимая пробел на клавиатуре компьютера.

Ключевые моменты утилиты прогнозного моделирования MemTrax

  • • Наши самые эффективные прогностические модели, охватывающие выбранные показатели производительности MemTrax, могут надежно классифицировать состояние когнитивного здоровья (нормальное когнитивное здоровье или MCI), как показывает широко признанный тест MoCA.
  • • Эти результаты поддерживают интеграцию выбранных показателей производительности MemTrax в приложение для скрининга прогностической модели классификации на ранние стадии когнитивных нарушений.
  • • Наше классификационное моделирование также выявило потенциал использования производительности MemTrax в приложениях для определения тяжести диагноза деменции.

Эти новые результаты устанавливают убедительные доказательства, подтверждающие полезность машинного обучения для создания усовершенствованных надежных моделей классификации на основе MemTrax для диагностической поддержки в эффективном ведении клинических случаев и уходе за пациентами с когнитивными нарушениями.

Авторы

Мы признательны Дж. Вессону Эшфорду, Кертису Б. Эшфорду и их коллегам за разработку и проверку онлайн-задачи и инструмента непрерывного распознавания (MemTrax), использованных здесь, и мы благодарны многочисленным пациентам с деменцией, которые внесли свой вклад в фундаментальное исследование. . Мы также благодарим Xianbo Zhou и его коллег из SJN Biomed LTD, его коллег и сотрудников в больницах и клиниках, особенно Drs. М. Луо и М. Чжун, которые помогали с набором участников, планированием тестов, а также сбором, записью и предварительным управлением данными, а также участники-добровольцы, которые пожертвовали своим драгоценным временем и взяли на себя обязательство пройти тесты и предоставить ценные данные для нас, чтобы оценить в этом исследовании. Этот исследование было частично поддержано MD Scientific Research Программа Куньминского медицинского университета (грант № 2017BS028 до XL) и Исследовательская программа Департамента науки и технологий Юньнани (грант № 2019FE001 (-222) до XL).

Дж. Вессон Эшфорд подал заявку на патент на использование конкретной парадигмы непрерывного распознавания, описанной в этой статье, для общего тестирование памяти.

MemTrax, LLC — компания, принадлежащая Кертису Эшфорду, и эта компания управляет тестирование памяти системы, описанной в этой статье.

Раскрытия авторов доступны в Интернете (https://www.j-alz.com/manuscript-disclosures/19-1340r2).

тест на память тест на слабоумие тест на потерю памяти тест на кратковременную потерю памяти тест на RAM разум диета разнообразие книг когнитивный тест онлайн
Кертис Эшфорд - координатор когнитивных исследований

Ссылки

[1] Ассоциация Альцгеймера (2016) 2016 Факты о болезни Альцгеймера и цифры. Демент Альцгеймера 12, 459–509.
[2] Gresenz CR , Mitchell JM , Marrone J , Federoff HJ (2019) Влияние ранней стадии Болезнь Альцгеймера на финансовые результаты домохозяйства. Экономика здоровья 29, 18–29.
[3] Фостер Н.Л., Бонди М.В., Дас Р., Фосс М., Херши Л.А., Кох С., Логан Р., Пул С., Шега Дж.В., Суд А., Тотала Н., Виклунд М., Ю М., Беннетт А., Ван Д. (2019) Повышение качества в неврология: набор для измерения качества легких когнитивных нарушений. Неврология 93, 705–713.
[4] Tong T, Thokala P, McMillan B, Ghosh R, Brazier J (2017) Экономическая эффективность использования когнитивные скрининговые тесты для выявления деменции и легких когнитивных нарушений в учреждениях первичной медико-санитарной помощи. Int J Geriatr Psychiatry 32, 1392–1400.
[5] Эшфорд Дж.В., Гир Э., Бэйли П.Дж. (2011) Измерение памяти в условиях большой группы с использованием непрерывного теста распознавания. J Alzheimers Dis 27, 885–895.
[6] Эшфорд Дж. В., Тарпин-Бернард Ф., Эшфорд С. Б., Эшфорд М. Т. (2019) Компьютеризированная задача непрерывного распознавания для измерения эпизодической памяти. J Alzheimers Dis 69, 385–399.
[7] Бержерон М.Ф., Ландсет С., Тарпин-Бернард Ф., Эшфорд С.Б., Хошгофтаар Т.М., Эшфорд Дж.В. (2019)Производительность эпизодической памяти в моделировании машинного обучения для прогнозирования классификации когнитивного состояния здоровья. J Alzheimers Dis 70, 277–286.
[8] van der Hoek MD, Nieuwenhuizen A, Keijer J, Ashford JW (2019) Тест MemTrax по сравнению с Монреальской оценкой когнитивной оценки легких когнитивных нарушений. J Alzheimers Dis 67, 1045–1054.
[9] Falcone M , Yadav N , Poellabauer C , Flynn P (2013) Использование изолированных гласных звуков для классификации легкой черепно-мозговой травмы. В 2013 г. Международная конференция IEEE по акустике, обработке речи и сигналов, Ванкувер, Британская Колумбия, стр. 7577–7581.
[10] Дабек Ф., Кабан Дж. Дж. (2015) Использование больших данных для моделирования вероятности развития психологических состояний после сотрясения мозга. Procedia Comput Sci 53, 265–273.
[11] Климент М.Т., Пардо Дж., Муньос-Альмараз Ф.Дж., Герреро М.Д., Морено Л. (2018)Дерево принятия решений для раннего выявления когнитивных нарушений внебольничными фармацевтами. Фронт Фармакол 9, 1232.
[12] Насреддин З.С., Филлипс Н.А., Бедириан В., Шарбонно С., Уайтхед В., Коллин И., Каммингс Дж.Л., Чертков Х. (2005) Монреальская когнитивная оценка, MoCA: краткий инструмент скрининга легких когнитивных нарушений. J Am Geriatr Soc 53, 695–699.
[13] Yu J, Li J, Huang X (2012)Пекинская версия монреальской когнитивной оценки как краткого инструмента скрининга легких когнитивных нарушений: исследование на уровне сообщества. BMC Психиатрия 12, 156.
[14] Chen KL, Xu Y, Chu AQ, Ding D, Liang XN, Nasreddine ZS, Dong Q, Hong Z, Zhao QH, Guo QH (2016) Валидация китайской версии Монреальской базовой оценки когнитивных функций для скрининга легких когнитивных нарушений. J Am Geriatr Soc 64, e285–e290.
[15] Карсон Н., Лич Л., Мерфи К.Дж. (2018) Повторное рассмотрение предельных показателей Монреальской когнитивной оценки (MoCA). Int J Geriatr Psychiatry 33, 379–388.
[16] Американская психиатрическая ассоциация (2013 г.) Целевая группа Руководство по диагностике и статистике психических расстройств: DSM-5™, American Psychiatric Publishing, Inc., Вашингтон, округ Колумбия.
[17] Питон. Python Software Foundation, http://www.python.org, по состоянию на 15 ноября 2019 г.
[18] R Core Group, R: язык и среда для статистических вычислений R Foundation for Statistical Computing, Вена, Австрия. https://www.R-project.org/, 2018 г., по состоянию на 15 ноября 2019 г.
[19] Бенаволи А., Корани Г., Демшар Дж., Заффалон М. (2017) Время перемен: руководство по сравнению нескольких классификаторов с помощью байесовского анализа. J Mach Learn Res 18, 1–36.
[20] Фрэнк Э., Холл М.А., Виттен И.Х. (2016) Верстак WEKA. В Data Mining: практические инструменты и методы машинного обучения, Фрэнк Э., Холл М.А., Виттен И.Х., Пал С.Дж., ред. Морган Кауфман https://www.cs.waikato.ac.nz/ml/weka/Witten_et_al_2016_appendix.pdf
[21] Бержерон М.Ф., Ландсет С., Моганс Т.А., Уильямс В.Б., Коллинз К.Л., Вассерман Э.Б., Хошгофтаар Т.М. (2019)Машинное обучение в моделировании устранения симптомов сотрясения мозга при занятиях спортом в средней школе. Медицинские научные спортивные упражнения 51, 1362–1371.
[22] Van Hulse J, Khoshgoftaar TM, Napolitano A (2007) Экспериментальные перспективы обучения на несбалансированных данных. В Материалы 24-й Международной конференции по машинному обучению, Корвалис, Орегон, США, стр. 935-942.
[23] Ashford JW, Kolm P, Colliver JA, Bekian C, Hsu LN (1989)Оценка пациента с болезнью Альцгеймера и мини-психическое состояние: анализ характеристической кривой пункта.P. Дж Геронтол 44, 139–146.
[24] Эшфорд Дж. В., Ярвик Л. (1985) Болезнь Альцгеймера: Предрасполагает ли пластичность нейронов к аксональной нейрофибриллярной дегенерации? N Engl J Med 313, 388–389.
[25] Jack CR Jr, Therneau TM, Weigand SD, Wiste HJ, Knopman DS, Vemuri P, Lowe VJ, Mielke MM, Roberts RO, Machulda MM, Graff-Radford J, Jones DT, Schwarz CG, Gunter JL, Senjem ML , Рокка В.А., Петерсен Р.К. (2019) Распространенность биологических и клинически определенных сущностей спектра Альцгеймера с использованием Национального института старения и болезни Альцгеймера Ассоциация исследований рамки. ДЖАМА Нейрол 76, 1174–1183.
[26] Zhou X, Ashford JW (2019) Достижения в инструментах скрининга для Болезнь Альцгеймера. Медицина старения 2, 88–93.
[27] Вайнер М.В., Ношени Р., Камачо М., Труран-Сакри Д., Маккин Р.С., Фленникен Д., Ульбрихт А., Инсел П., Финли С., Фоклер Дж., Вейтч Д. (2018) Здоровье мозга Реестр: интернет-платформа для набора, оценки и лонгитюдного мониторинга участников нейробиологических исследований. Демент Альцгеймера 14, 1063–1076.
[28] Ashford JW, Schmitt FA (2001) Моделирование временного хода Слабоумие Альцгеймера. Curr Psychiatry Rep 3, 20–28.
[29] Li X , Wang X , Su L , Hu X , Han Y (2019) Китайское лонгитюдное исследование снижения когнитивных функций (SILCODE): протокол китайского продольного обсервационного исследования по разработке моделей прогнозирования риска конверсии в легкие когнитивные нарушения у лиц с субъективными когнитивными нарушениями. отклонить. BMJ Open 9, e028188.
[30] Tarnanas I, Tsolaki A, Wiederhold M, Wiederhold B, Tsolaki M (2015) Пятилетняя вариабельность биомаркеров для Деменция при болезни Альцгеймера прогноз: Может ли маркер сложной инструментальной деятельности повседневной жизни заполнить пробелы? Демент Альцгеймера (Амст) 1, 521–532.
[31] McGurran H, Glenn JM, Madero EN, Bott NT (2019) Профилактика и лечение болезни Альцгеймера: Биологические механизмы физических упражнений. J Alzheimers Dis 69, 311–338.
[32] Mendiola-Precoma J, Berumen LC, Padilla K, Garcia-Alcocer G (2016) Therapies for профилактика и лечение болезни Альцгеймера. Биомед Рез Инт 2016, 2589276.
[33] Лейн К.А., Барнс Дж., Николас Дж.М., Судре Ч., Кэш Д.М., Мэлоун И.Б., Паркер Т.Д., Кешаван А., Бьюкенен С.М., Кеусс С.Э., Джеймс С.Н., Лу К., Мюррей-Смит Х., Вонг А., Гордон Э., Коут В., Модат М., Томас Д., Ричардс М., Фокс Н.К., Шотт Дж.М. (2020)Связи между сосудистым риском во взрослом возрасте и патологией головного мозга в пожилом возрасте: данные британской когорты рождения. ДЖАМА Нейрол 77, 175–183.
[34] Сешадри С. (2020) Профилактика слабоумия — мышление за пределами возраста и амилоидных ящиков. ДЖАМА Нейрол 77, 160–161.
[35] Maillard P, Seshadri S, Beiser A, Himali JJ, Au R, Fletcher E, Carmichael O, Wolf PA, DeCarli C (2012) Влияние систолического артериального давления на целостность белого вещества у молодых людей в Framingham Heart Study: A cross -секционное исследование. Ланцет Нейрол 11, 1039–1047.
[36] Fink HA, Linskens EJ, Silverman PC, McCarten JR, Hemmy LS, Ouellette JM, Greer NL, Wilt TJ, Butler M (2020) Точность тестирования биомаркеров для невропатологически определенных Болезнь Альцгеймера у пожилых людей с деменцией. Энн Интерн Мед 172, 669–677.

Принадлежности: [a] SIVOTEC Analytics, Бока-Ратон, Флорида, США | [b] Факультет вычислительной техники, электротехники и компьютерных наук, Атлантический университет Флориды, Бока-Ратон, Флорида, США | [c] SJN Biomed LTD, Куньмин, Юньнань, Китай | [г] Центр Исследования болезни Альцгеймера, Вашингтонский институт клинических исследований, Вашингтон, округ Колумбия, США | [e] Отделение реабилитационной медицины, Первая дочерняя больница Куньминского медицинского университета, Куньмин, Юньнань, Китай | [f] Отделение неврологии, Народная больница Дехонг, Дехонг, Юньнань, Китай | [g] Отделение неврологии, Первая дочерняя больница Куньминского медицинского университета, район Ухуа, Куньмин, провинция Юньнань, Китай | [h] Центр изучения болезней и травм, связанных с войной, Пало-Альто, штат Вирджиния. Товары для здоровья Систем, Пало-Альто, Калифорния, США | [i] Кафедра психиатрии и поведенческих наук, Медицинская школа Стэнфордского университета, Пало-Альто, Калифорния, США

Переписка: [*] Переписка: Майкл Ф. Бержерон, доктор философии, FACSM, SIVOTEC Analytics, инновационный кампус Бока-Ратон, 4800 T-Rex Avenue, Suite 315, Бока-Ратон, Флорида 33431, США. Электронная почта: mbergeron@sivotecanalytics.com.; Сяолэй Лю, доктор медицинских наук, отделение неврологии, Первая дочерняя больница Куньминского медицинского университета, 295 Xichang Road, район Ухуа, Куньмин, провинция Юньнань 650032, Китай. Электронная почта: ring@vip.163.com.

Ключевые слова: старение, Болезнь Альцгеймера, деменция, массовый скрининг