軽度認知障害の分類における MemTrax と機械学習モデリングの有用性

研究論文

著者: Bergeron、Michael F. | ランドセット、サラ | 周、仙波 | タオ・ディン | Khoshgoftaar、Taghi M. | | 風水趙 | デュ、ボー | チェン、シンジェ | 王玄 | 鍾、連美 | リュウ・シャオレイ| アシュフォード、J.ウェッソン

doi:10.3233/jad-191340

ジャーナル: Journal of アルツハイマー病、vol。 77、いいえ。 4、pp。1545-1558、2020

抽象

背景:

の広範な発生率と有病率 アルツハイマー病 および軽度認知障害 (MCI) は、早期発見の認知スクリーニングと評価を検証するための研究の緊急の呼びかけを促しました。

目的:

私たちの主な研究目的は、機械学習で開発された予測モデルで、選択された MemTrax パフォーマンス メトリックと関連する人口統計および健康プロファイル特性を効果的に利用して、認知健康 (正常対 MCI) を分類できるかどうかを判断することでした。 モントリオール認知評価 (MoCA)。

メソッド:

259 名の神経科、記憶クリニック、内科の成人患者を対象に横断研究を実施しました。 中国の病院. 各患者には中国語の MoCA が与えられ、継続的な認識 MemTrax オンライン エピソードを自己管理しました メモリテストオンライン 同じ日に。 予測分類モデルは、機械学習と 10 倍の交差検証を使用して構築され、モデルのパフォーマンスは、受信者動作特性曲線 (AUC) の下の領域を使用して測定されました。 モデルは、XNUMX つの MemTrax パフォーマンス メトリック (正答率、応答時間) と、XNUMX つの一般的な人口統計および個人履歴機能を使用して構築されました。

結果について

選択した MoCA スコアとしきい値の組み合わせで学習者を比較すると、ナイーブ ベイズは全体的な分類パフォーマンスが 0.9093 で、一般的に最もパフォーマンスの高い学習者でした。 さらに、上位 0.9119 人の学習者の中で、MemTrax ベースの分類パフォーマンスは、10 個の一般的な特徴すべてを使用した場合 (0.8999) と比較して、上位 XNUMX つの特徴のみを使用した場合 (XNUMX) で全体的に優れていました。

結論:

MemTrax のパフォーマンスは、機械学習の分類予測モデルで有効に活用できます 初期段階の認知障害を検出するためのスクリーニング アプリケーション.

はじめに

認知されている(過小診断されているにもかかわらず)広範な発生率と有病率、および並行してエスカレートしている医学的、社会的、および公的 健康 アルツハイマー病 (AD) および軽度認知障害 (MCI) のコストと負担は、すべての利害関係者にとってますます負担になっています [1、2]。 この悲惨で急成長しているシナリオは、検証するための研究の緊急の呼びかけを促しました 早期発見 さまざまな地域や集団にわたる高齢患者の個人的および臨床的設定での定期的な実用性のための認知スクリーニングおよび評価手段[3]。 これらの機器は、有益な結果を電子医療記録にシームレスに変換する機能も提供する必要があります。 この利点は、患者に情報を提供し、医師が重大な変化を早期に認識できるよう支援することで実現されます。これにより、より迅速かつタイムリーな層別化、実施、および適切な個別化された費用対効果の高い治療と、経験し始めた患者に対する患者ケアの追跡が可能になります。 認知機能低下 [3、4]。

コンピューター化された MemTrax ツール (https://memtrax.com) は、ユーザーが最初のプレゼンテーションではなく、繰り返される画像に反応する場合に、時間指定エピソード記憶のパフォーマンスを測定するためにオンラインで自己管理できる、シンプルで簡潔な連続認識評価です [5、6]。 最近の研究とその結果としての実用的な意味合いは、AD および MCI の早期スクリーニングにおける MemTrax の臨床的有効性を徐々にかつ集合的に示し始めています [5–7]。 ただし、臨床的有用性を既存のものと直接比較する 認知の健康 評価と従来の基準は、専門家の視点に情報を提供し、早期発見と診断サポートにおけるMemTraxユーティリティを裏付けるために保証されています. ファンデルフックら。 [8] は、選択された MemTrax パフォーマンス メトリクス (反応速度と正解率) を、モントリオールによって決定された認知状態と比較しました。 認知評価 (MoCA)。 ただし、この研究は、これらのパフォーマンス メトリックを (MoCA によって決定される) 認知状態の特徴付けと関連付け、相対範囲とカットオフ値を定義することに限定されていました。 したがって、この調査を拡張し、分類のパフォーマンスと有効性を改善するために、私たちの主な研究課題は次のとおりでした。

  • 個人が選択した MemTrax パフォーマンス メトリックと、関連する人口統計および健康状態 プロフィール 自分の MoCA スコアによって示されるように、認知的健康を二分法 (正常対 MCI) に分類するために機械学習で開発された予測モデルで特性を効果的に利用できますか?

これに続いて、次のことを知りたいと考えました。

  • 同じ機能を含めて、MemTrax パフォーマンスベースの機械学習モデルを患者に効果的に適用して、独立した臨床診断によって決定される認知障害の選択されたカテゴリ内の重症度 (軽度または重度) を予測できますか?

スクリーニング/検出における人工知能と機械学習の出現と進化する実用的なアプリケーションは、認知/脳の健康と患者管理の困難な評価において臨床医を効果的に導く予測モデリングにより、明確な実用上の利点をすでに実証しています。 私たちの研究では、中国のXNUMXつの病院からの選択されたボランティアの入院患者と外来患者を表すXNUMXつのデータセットからの臨床診断によって確認されるように、MCI分類モデリングと認知障害の重症度の識別において同様のアプローチを選択しました。 機械学習の予測モデリングを使用して、さまざまなデータセット/学習者の組み合わせから最も成績の良い学習者を特定し、特徴をランク付けして、最も臨床的に実用的なモデル アプリケーションを定義するガイドを作成しました。

私たちの仮説は、検証済みの MemTrax ベースのモデルを利用して、MoCA 集計スコアしきい値基準に基づいて認知的健康を二分法 (正常または MCI) に分類できること、および同様の MemTrax 予測モデルを、選択されたカテゴリーの重症度の判別に効果的に使用できることでした。臨床的に診断された 認識機能障害. 予想される結果を実証することは、認知機能低下および認知障害分類の早期検出スクリーニングとして MemTrax の有効性をサポートするのに役立ちます。 はるかに容易で迅速な有用性によって補完された、業界で主張されている標準との有利な比較は、臨床医が初期 (前駆期を含む) 段階の認知障害を検出するための最初のスクリーニングとして、このシンプルで信頼性が高く、アクセスしやすいツールを採用するのに影響を与えるでしょう。 したがって、このようなアプローチと有用性は、よりタイムリーでより層別化された患者のケアと介入を促す可能性があります。 これらの前向きな洞察と改善された指標とモデルは、AD および AD 関連認知症 (ADRD) を含む認知症の進行を緩和または停止するのにも役立つ可能性があります。

材料および方法

調査対象母集団

2018 年 2019 月から 5 年 21 月の間に、中国の XNUMX つの病院から募集された患者に関する横断研究が完了しました。 XNUMX 歳以上の個人への MemTrax [XNUMX] の投与、およびそれらのデータの収集と分析は、倫理基準によって審査および承認され、それに従って管理されました。 人間 スタンフォード大学の被験者保護委員会。 MemTrax およびこの全体的な研究のための他のすべてのテストは、1975 年のヘルシンキ宣言に従って実施され、中国雲南省昆明市にある昆明医科大学の第一付属病院の治験審査委員会によって承認されました。 各ユーザーには、 インフォームドコンセント フォームを読んで確認し、自発的に参加に同意します。

参加者は、Yanhua Hospital (YH サブデータセット) の神経内科クリニックの外来患者のプールから募集され、 昆明医科第一附属医院のメモリークリニック 中国の北京にある大学 (XL サブデータセット)。 参加者は、昆明医科大学の第一付属病院の神経科 (XL サブデータセット) および内科 (KM サブデータセット) の入院患者からも募集されました。 参加基準には、1) 21 歳以上の男女、2) 中国語 (北京語) を話す能力、3) 口頭および書面による指示を理解する能力が含まれます。 除外基準は、参加者が課題を完了するのを妨げている視覚障害と運動障害でした。 MemTrax テスト、および特定のテスト指示を理解できない。

MemTrax の中国語版

オンライン MemTrax テスト プラットフォームが翻訳されました 中国語 (URL: https://www.memtrax.com.cn) に変換し、自己管理のために WeChat (Shenzhen Tencent Computer Systems Co. LTD., Shenzhen, Guangdong, China) を介して利用できるようにさらに適合させました。 データは中国にあるクラウド サーバー (Ali Cloud) に保存され、Alibaba (Alibaba Technology Co. Ltd.、杭州、浙江、中国) から SJN Biomed LTD (昆明、雲南、中国) によってライセンス供与されました。 ここで使用される MemTrax とテストの有効性基準に関する具体的な詳細は、以前に説明されています [6]。 検査は患者に無料で提供された。

研究手順

入院患者と外来患者を対象に、年齢、性別、学年、職業、 一人暮し または家族と一緒に、病歴は研究チームのメンバーによって管理されました。 アンケートの完了後、MoCA [12] および MemTrax テストが実施され (最初に MoCA)、テスト間の間隔は 20 分以内でした。 MemTrax 正答率 (MTx-% C)、平均応答時間 (MTx-RT)、およびテストの日付と時刻は、テストされた各参加者の研究チームのメンバーによって紙に記録されました。 記入済みのアンケートと MoCA の結果は、Excel ファイルが分析のために保存される前に、テストを管理し、同僚によって検証された研究者によって Excel スプレッドシートにアップロードされました。

MemTrax テスト

MemTrax オンライン テストには、特定の擬似ランダムな順序で表示された 50 枚の画像 (25 枚の固有画像と 25 枚の繰り返し画像、共通のシーンまたはオブジェクトの 5 枚の画像の 5 セット) が含まれていました。 参加者は (指示に従って) 画面の [開始] ボタンに触れてテストを開始し、画像シリーズの表示を開始し、繰り返される画像が表示されるたびに、できるだけ早く画面上の画像に再び触れます。 各画像は 3 秒間、または画面上の画像がタッチされるまで表示され、次の画像がすぐに表示されます。 ローカル デバイスの内部クロックを使用して、各画像の MTx-RT は、画像の提示から参加者が既に表示された画像としての認識を示すことに応答して画面に触れた時点までの経過時間によって決定されました。テスト中。 MTx-RT はすべての画像に対して記録され、応答がないことを示す完全な 3 秒が記録されました。 MTx-% C は、ユーザーが正しく応答した反復画像と初期画像の割合を示すために計算されました (真の陽性 + 真の陰性を 50 で割った値)。 MemTrax の管理と実装、データ削減、無効または「無応答」データ、および一次データ分析の詳細については、別の場所で説明しています [6]。

MemTrax テストについて詳しく説明し、実践テスト (結果を記録するためにテストで使用されたもの以外の独自の画像を使用) を病院の設定で参加者に提供しました。 YH および KM サブデータセットの参加者は、WeChat のアプリケーションが読み込まれたスマートフォンで MemTrax テストを受けました。 一方、限られた数の XL サブデータセットの患者は iPad を使用し、残りはスマートフォンを使用していました。 すべての参加者は、目立たないように観察している研究調査員と一緒に MemTrax テストを受けました。

モントリオール認知評価

中国の MoCA の北京バージョン (MoCA-BC) [13] は、公式のテスト指示に従って、訓練を受けた研究者によって管理および採点されました。 適切に、MoCA-BC は信頼できることが示されています。 認知症のテスト 中国の高齢者のすべての教育レベルにわたるスクリーニング[14]。 各テストの実施には、それぞれの参加者の認知能力に基づいて約 10 ~ 30 分かかりました。

MoCA分類モデリング

29 つの MemTrax を含む合計 XNUMX の使用可能な機能がありました 人口統計と健康に関連するパフォーマンス指標と 27 の機能をテストします 各参加者の情報。 各患者の MoCA 集計テスト スコアは、 認知スクリーニング 予測モデルをトレーニングするための「ベンチマーク」。 したがって、MoCA を使用してクラス ラベルを作成したため、集計スコア (または MoCA サブセット スコアのいずれか) を独立した特徴として使用できませんでした。 元の XNUMX つの病院/診療所のサブデータセットを個別にモデル化し (MoCA によって定義された認知的健康を分類)、すべての機能を使用して結合する予備実験を行いました。 ただし、XNUMX つのサブデータセットを表す XNUMX つの診療所のそれぞれで、すべて同じデータ要素が収集されたわけではありません。 したがって、結合されたデータセット (すべての機能を使用する場合) の機能の多くは、欠損値の発生率が高くなりました。 次に、共通の機能のみを使用して結合されたデータセットでモデルを構築し、分類パフォーマンスを向上させました。 これは、XNUMX つの患者サブデータセットを組み合わせることで、より多くのインスタンスを使用できることと、欠損値が過度に蔓延している特徴がないことの組み合わせによって説明される可能性があります (組み合わせたデータセットの XNUMX つの特徴、作業タイプのみに欠損値があり、患者に影響を与えます)。 XNUMX つのサイトすべてで記録された共通の特徴のみが含まれているためです。 特に、結合されたデータセットに最終的に含まれなかった各機能について、特定の拒否基準がありませんでした。 ただし、予備の組み合わせたデータセット モデリングでは、最初に XNUMX つの個別の患者サブデータセットのそれぞれからすべての機能を使用しました。 これにより、個々のサブデータセットの最初の予備モデリングよりもモデルのパフォーマンスが測定可能なほど低くなりました。 さらに、すべての機能を使用して構築されたモデルの分類パフォーマンスは有望でしたが、すべての学習者と分類スキームにわたって、共通の機能のみを使用した場合、パフォーマンスは XNUMX 倍のモデルで改善されました。 実際、最終的に上位の学習者となったものの中で、XNUMX つのモデルを除くすべてのモデルが、一般的でない機能を排除することで改善されました。

最終的な集計データセット (YH、XL、および KM を組み合わせたもの) には 259 のインスタンスが含まれ、それぞれが MemTrax テストと MoCA テストの両方を受けた一意の参加者を表しています。 10 の共有された独立した機能がありました。MemTrax パフォーマンス メトリック: MTx-% C および平均 MTx-RT。 人口統計および病歴情報: 年齢、性別、教育年数、仕事の種類 (ブルーカラー/ホワイトカラー)、社会的支援 (受験者が一人暮らしか家族と一緒に住んでいるか)、およびユーザーが健康障害を持っていたかどうかについてのはい/いいえの回答。糖尿病、高脂血症、または外傷性脳損傷の病歴。 12 つの追加のメトリック、MoCA 集計スコアと教育年数に合わせて調整された MoCA 集計スコア [12] を個別に使用して、依存分類ラベルを作成し、結合されたデータセットに適用される 8 つの異なるモデリング スキームを作成しました。 MoCA スコアの各バージョン (調整済みおよび未調整) について、15 つの異なる基準しきい値 (最初に推奨されたしきい値 [23] と、他の人によって使用および促進された代替値 [22、26]) を使用して、データをバイナリ分類用に個別にモデル化しました。 別の閾値分類方式では、MoCA テストでスコアが XNUMX 以上の場合、患者は正常な認知機能を持っていると見なされ、スコアが XNUMX 以下の場合は MCI であると見なされました。 一方、最初に推奨された分類形式では、患者は MoCA で XNUMX 点以上のスコアを獲得しなければ、正常な認知機能を持っていると見なされませんでした。

MoCA分類モデリング用のフィルタリングされたデータ

さらに、一般的に使用される XNUMX つの機能ランキング手法 (カイ XNUMX 乗、ゲイン比、情報ゲイン、対称不確実性) を使用して MoCA 分類を調べました。 暫定的な観点から、XNUMX つのモデリング スキームのそれぞれを使用して、結合されたデータセット全体にランカーを適用しました。 すべてのランカーは、年齢、教育年数、および両方の MemTrax パフォーマンス メトリック (MTx-% C、平均 MTx-RT) など、同じ上位の特徴に同意しました。 次に、各機能選択手法を使用してモデルを再構築し、上位 XNUMX つの機能のみでモデルをトレーニングしました ( 機能選択 下)。

得られた MoCA スコア分類モデリング スキームの最終的な 1 つのバリエーションを表 XNUMX に示します。

表1

MoCA 分類に使用されるモデリング スキームのバリエーションのまとめ (Normal 認知の健康 対 MCI)

モデリングスキーム正常な認知的健康 (ネガティブ クラス)MCI(ポジティブクラス)
調整済み-23 フィルターなし/フィルターあり101(39.0%)158(61.0%)
調整済み-26 フィルターなし/フィルターあり49(18.9%)210(81.1%)
無調整-23 無濾過/無濾過92(35.5%)167(64.5%)
無調整-26 無濾過/無濾過42(16.2%)217(83.8%)

各クラスの合計患者のそれぞれの数と割合は、教育のスコア (調整済みまたは未調整) と分類しきい値 (23 または 26) の調整によって区別され、両方の機能セット (フィルターなしとフィルターあり) に適用されます。

MemTrax ベースの臨床評価モデリング

元の XNUMX つのサブデータセット (YH、XL、KM) のうち、XL サブデータセットの患者のみが、認知障害について独立して臨床的に診断されました (つまり、それぞれの MoCA スコアは、正常対障害の分類を確立する際に使用されませんでした)。 具体的には、XL患者は次のいずれかと診断されました アルツハイマー病検査 (AD)または血管性認知症(VaD)。 これらの一次診断カテゴリのそれぞれに、MCI のさらなる指定がありました。 MCI、認知症、血管性神経認知障害、および AD による神経認知障害の診断は、精神障害の診断および統計マニュアル: DSM-5 [16] に概説されている特定の特徴的な診断基準に基づいていました。 これらの洗練された診断を考慮して、69 つの分類モデリング スキームが XL サブデータセットに別々に適用され、各一次診断カテゴリの重症度 (障害の程度) が区別されました。 これらの診断モデリング スキーム (AD および VaD) のそれぞれで利用されたデータには、人口統計および患者履歴情報、ならびに MemTrax パフォーマンス (MTx-% C、平均 MTx-RT) が含まれていました。 MCIと指定された場合、各診断は軽度とラベル付けされました。 それ以外の場合、それは深刻であると見なされました。 最初に、診断モデルに MoCA スコアを含めることを検討しました (軽度と重度)。 しかし、それは二次予測モデリング スキームの目的に反すると判断しました。 ここで、学習者は、プロバイダーがすぐに利用できる他の患者の特性と、独立した臨床診断である参照「ゴールド スタンダード」に対するより単純な MemTrax テスト (MoCA の代わりに) のパフォーマンス メトリックを使用してトレーニングされます。 AD 診断データセットには 76 のインスタンスがあり、VaD には XNUMX のインスタンスがありました (表 2)。 両方のデータセットには、12 の独立した機能がありました。 MoCA スコア分類に含まれる 10 の特徴に加えて、病歴には高血圧と脳卒中の病歴に関する情報も含まれていました。

表2

診断の重症度分類に使用されるモデリング スキームのバリエーションの概要 (軽度と重度)

モデリングスキームマイルド(ネガティブクラス)重度 (陽性クラス)
MCI-AD 対 AD12(17.4%)57(82.6%)
MCI-VaD 対 VaD38(50.0%)38(50.0%)

各クラスの総患者のそれぞれの数と割合は、一次診断カテゴリ (AD または VaD) によって区別されます。

統計

各モデル分類戦略のサブデータセット間の参加者の特性とその他の数値的特徴の比較 (MoCA 認知健康と診断の重症度を予測するため) は、Python プログラミング言語 (バージョン 2.7.1) を使用して実行されました [17]。 モデルのパフォーマンスの違いは、最初に 95% 信頼区間の単一因子または 3.5.1 因子 (必要に応じて) の ANOVA と Tukey 正直有意差 (HSD) 検定を使用して決定され、パフォーマンスの平均が比較されました。 このモデル性能の違いの調査は、Python と R (バージョン 18) の組み合わせを使用して実行されました [XNUMX]。 このアプローチは、ヒューリスティックな支援としてのみ採用しました (おそらく最適とは言えませんが)。 初期段階 潜在的な臨床応用を予測する際の初期モデルの性能比較。 次に、事後分布を使用したベイジアンの符号付きランク検定を利用して、モデルのパフォーマンスの違いの確率を決定しました [19]。 これらの分析では、間隔 -0.01、0.01 を使用しました。これは、0.01 つのグループのパフォーマンスの差が 1.0.2 未満の場合、それらは同じ (実質的に同等の領域内) であると見なされ、そうでない場合は異なる (3.6.4 つよりも優れている) と見なされることを意味します。もう一方)。 分類子のベイジアン比較を実行し、これらの確率を計算するために、Python XNUMX 用の baycomp ライブラリ (バージョン XNUMX) を使用しました。

予測モデリング

各患者の MoCA テストの結果または臨床診断の重症度を予測 (分類) するために、モデリングスキームの合計 20 のバリエーションを使用して予測モデルを構築しました。 すべての学習者が適用され、モデルはオープン ソース ソフトウェア プラットフォーム Weka [10] を使用して構築されました。 予備分析では、一般的に使用される 5 の学習アルゴリズムを採用しました: 4.5 最近傍、21 つのバージョンの C22 決定木、ロジスティック回帰、多層パーセプトロン、ナイーブ ベイズ、XNUMX つのバージョンのランダム フォレスト、放射基底関数ネットワーク、およびサポート ベクター。機械。 これらのアルゴリズムの主要な属性と対比は、他の場所で説明されています [XNUMX] (それぞれの付録を参照)。 これらが選択された理由は、それらがさまざまなタイプの学習者を表していることと、同様のデータに対する以前の分析でそれらを使用して成功したことを示しているためです。 ハイパーパラメータ設定は、さまざまな異なるデータに対して堅牢であることを示す以前の調査から選択されました [XNUMX]。 後で完全な分析で使用された共通の特徴を持つ同じ結合されたデータセットを使用した予備分析の結果に基づいて、すべての分類で一貫して強力なパフォーマンスを提供する XNUMX つの学習者を特定しました: ロジスティック回帰、ナイーブ ベイズ、およびサポート ベクター マシン。

交差検証とモデル パフォーマンス メトリック

すべての予測モデリング (予備分析を含む) について、各モデルは 10 倍の交差検証を使用して構築され、モデルのパフォーマンスは受信者動作特性曲線 (AUC) の下の面積を使用して測定されました。 相互検証は、10 個のモデリング スキーム データセットのそれぞれをランダムに 10 個の等しいセグメント (フォールド) に分割することから始まり、これらのそれぞれのセグメントのうち 10 個を使用してモデルをトレーニングし、残りのセグメントをテスト用に使用しました。 この手順は、反復ごとに異なるセグメントをテスト セットとして使用して、10 回繰り返されました。 次に、結果を組み合わせて、最終モデルの結果/パフォーマンスを計算しました。 学習者とデータセットの組み合わせごとに、このプロセス全体が 6,600 回繰り返され、データは毎回異なる方法で分割されました。 この最後のステップにより、偏りが減り、再現性が確保され、モデル全体のパフォーマンスを決定するのに役立ちました。 合計で (MoCA スコアと診断の重症度分類スキームを組み合わせた場合)、1,800 モデルが構築されました。 これには、6 のフィルター処理されていないモデル (データセットに適用された 3 つのモデリング スキーム×10 学習者×10 実行×1,800 フォールド = 4,800 モデル) と 4 のフィルター処理されたモデル (データセットに適用された 3 つのモデリング スキーム×4 学習者×10 特徴選択手法×10 実行×) が含まれていました。 4,800 折り = XNUMX モデル)。

機能選択

フィルタリングされたモデルの場合、相互検証内で機能選択 (10 つの機能ランキング方法を使用) が実行されました。 10 のフォールドのそれぞれについて、データセットの異なる 90% がテスト データであったため、各トレーニング データセットに対して選択された上位 XNUMX つの特徴 (つまり、他の XNUMX つのフォールド、またはデータセット全体の残りの XNUMX%) のみが使用されました。モデルを構築します。 各モデルでどの XNUMX つの機能が使用されているかを確認することはできませんでした。その情報は、使用したモデリング プラットフォーム (Weka) 内で保存または利用できないためです。 ただし、ランカーが結合されたデータセット全体に適用されたときの上位の機能の最初の選択の一貫性と、その後のモデリング パフォーマンスの類似性を考えると、これらの同じ機能 (年齢、教育年数、MTx-% C、および平均 MTx-RT) ) は、クロス検証プロセス内の機能選択に付随して使用される最も一般的な上位 XNUMX つである可能性があります。

結果

MoCA が示す認知的健康 (通常と MCI) および診断の重症度 (軽度と重度) を予測するための各モデル分類戦略のそれぞれのデータセットの参加者の数値特性 (MoCA スコアと MemTrax パフォーマンス メトリックを含む) を表 3に示します。

表3

各モデル分類戦略の参加者特性、MoCA スコア、および MemTrax パフォーマンス

分類戦略ご年齢教育MoCA調整済みMoCA未調整MTx-%CMTx-RT
MoCAカテゴリー61.9歳 (13.1)9.6歳 (4.6)19.2(6.5)18.4(6.7)74.8%(15.0)1.4秒(0.3)
診断の重症度65.6歳 (12.1)8.6歳 (4.4)16.7(6.2)15.8(6.3)68.3%(13.8)1.5秒(0.3)

モデリング分類戦略によって区別された値 (平均、SD) は、MoCA が示す認知的健康 (MCI 対正常) を予測するために使用される結合されたデータセットと、診断の重症度 (軽度対重度) を予測するためにのみ使用される XL サブデータセットの代表です。

MoCA スコア (調整済み/未調整) としきい値 (26/23) の各組み合わせについて、統計的な差がありました (p = 0.000) 年齢、教育、および MemTrax パフォーマンス (MTx-% C および MTx-RT) の各ペアワイズ比較 (通常の認知健康と MCI) で。 各組み合わせのそれぞれの MCI クラスの各患者サブデータセットは、平均で約 9 ~ 15 歳年上であり、教育年数が約 XNUMX 年少なく、両方の指標で MemTrax のパフォーマンスがあまり良くありませんでした。

上位 4 つの学習器、ロジスティック回帰、ナイーブ ベイズ、およびサポート ベクター マシンを使用した MoCA スコア分類の予測モデリング パフォーマンス結果を表 4 に示します。すべてのモデリング スキームのデータセットに適用されます。 フィルタリングされていないデータセットとモデリングについて、表 100 の各データ値は、学習者/モデリング スキームの組み合わせごとに構築された 10 個のモデル (10 回の実行 x 4 回のフォールド) から導出された AUC のそれぞれの平均に基づくモデルのパフォーマンスを示します。実行中の学習者は太字で示されています。 一方、フィルタリングされたデータセット モデリングの場合、表 400 に報告されている結果は、各機能ランキング メソッド (4 つの機能ランキング メソッド×10 ラン×10 フォールド) を使用した各学習者の XNUMX モデルからの全体的な平均モデル パフォーマンスを反映しています。

表4

それぞれのすべてのモデリング スキームについて、上位 0.0 人の学習者それぞれの二分法 MoCA スコア分類パフォーマンス (AUC; 1.0–XNUMX) の結果

使用される機能セットMoCAスコアカットオフしきい値ロジスティック回帰ナイーブベイズサポートベクターマシン
フィルタリングなし (10 機能)調整230.88620.89130.8695
260.89710.92210.9161
未調整230.91030.90850.8995
260.88340.91530.8994
フィルタリング済み (4 つの機能)調整230.89290.89540.8948
260.91880.92470.9201
未調整230.91350.91340.9122
260.91590.92360.9177

さまざまな機能セット、MoCA スコア、および MoCA スコア カットオフしきい値を利用して、各モデリング スキームの最高のパフォーマンスを以下に示します。 大胆な (必ずしも統計的に異なるわけではありません。 大胆な それぞれのモデル)。

結合されたフィルター処理されていないデータセット (つまり、23 個の共通の特徴を使用) で MoCA スコア バージョンとしきい値 (それぞれ調整済み/未調整および 26/10) のすべての組み合わせで学習者を比較すると、ナイーブ ベイズは一般的に、全体的に最も成績の良い学習者でした。 0.9093 の分類性能。 上位 XNUMX 人の学習者を考慮すると、ベイジアン相関の符号付き順位検定は、確率 (Pr) ロジスティック回帰を上回るナイーブ ベイズは 99.9% でした。 さらに、ナイーブ ベイズとサポート ベクター マシンの間で、学習者のパフォーマンスが実質的に同等である確率は 21.0% (したがって、ナイーブ ベイズがサポート ベクター マシンを上回る確率は 79.0%) であり、サポート ベクター マシンのパフォーマンスが測定可能なほど優れている確率は 0.0% です。 Naive Bayes のパフォーマンスの利点を強化します。 すべての学習者/しきい値全体で MoCA スコア バージョンをさらに比較すると、未調整の MoCA スコアを使用した場合と調整済みの場合を使用した場合のわずかなパフォーマンスの利点が示唆されました (それぞれ 0.9027 対 0.8971; Pr (未調整 > 調整済み) = 0.988)。 同様に、すべての学習者と MoCA スコア バージョンのカットオフしきい値を比較すると、分類しきい値として 26 を使用した場合と 23 を使用した場合の分類パフォーマンスのわずかな優位性が示されました (それぞれ 0.9056 対 0.8942; Pr (26 > 23) = 0.999)。 最後に、フィルタリングされた結果のみを利用したモデル (上位 0.9143 つの機能のみ) の分類パフォーマンスを調べると、ナイーブ ベイズ (100) は、すべての MoCA スコア バージョン/しきい値で数値的に最もパフォーマンスの高い学習者でした。 ただし、すべての特徴ランキング手法を組み合わせた場合、成績上位の学習者はすべて同様の成績を収めました。 ベイジアンの符号付き順位検定は、フィルタリングされた学習器の各ペア間で実質的に同等である確率が 10% であることを示しました。 フィルター処理されていないデータ (XNUMX 個の共通機能すべてを使用) と同様に、未調整バージョンの MoCA スコア (Pr (未調整 > 調整済み) = 1.000)、および 26 の分類しきい値 (Pr (26 > 23) = 1.000)。 特に、上位 0.9119 つの機能のみを使用したすべての MoCA スコア バージョン/しきい値にわたる上位 0.8999 人の各学習者の平均パフォーマンスは、フィルタリングされていないデータでのすべての学習者の平均パフォーマンスを上回りました。 当然のことながら、フィルタリングされたモデル (上位 10 つの機能を使用) の分類パフォーマンスは、全体として、フィルタリングされていないモデル (100) よりも優れていました (XNUMX)。特徴。 各機能選択方法について、フィルタリングされていないモデルよりも XNUMX% の確率でパフォーマンスが向上しました。

AD診断の重症度分類のために考慮された患者では、グループ間(MCI-AD対AD)の年齢差(p = 0.004)、教育 (p = 0.028)、MoCA スコア調整済み/未調整 (p = 0.000)、および MTx-% C (p = 0.008) は統計的に有意でした。 一方、MTx-RT ではそうではありませんでした (p = 0.097)。 VaD 診断の重症度分類を考慮した患者については、MoCA スコアのグループ間 (MCI-VaD と VaD) の差を調整済み/未調整 (p = 0.007) および MTx-% C (p = 0.026) および MTx-RT (p = 0.001) は統計的に有意でした。 一方、年齢(p = 0.511) と教育 (p = 0.157) グループ間に有意差はありませんでした。

以前に選択した 5 つの学習者、ロジスティック回帰、ナイーブ ベイズ、およびサポート ベクター マシンを使用した診断重大度分類の予測モデリング パフォーマンス結果を表 61.4 に示します。一方、追加の検査済み学習者は、41.7 つの臨床診断カテゴリのいずれかで個別にわずかに強いパフォーマンスを示しました。 、以前のモデリングで最も有利であると特定した XNUMX 人の学習者は、両方の新しいモデリング スキームで最も一貫したパフォーマンスを提供しました。 一次診断カテゴリ (AD と VaD) のそれぞれで学習者を比較すると、MCI-VaD と VaD の学習者の間で一貫した分類パフォーマンスの違いはありませんでしたが、サポート ベクター マシンは一般的により顕著なパフォーマンスを示しました。 同様に、MCI-AD 分類と AD 分類の学習者間に有意差はありませんでしたが、ナイーブ ベイズ (NB) はロジスティック回帰 (LR) よりもパフォーマンスがわずかに優れており、サポート ベクター マシンよりもわずかに多く、確率は XNUMX% でした。そしてそれぞれXNUMX%。 両方のデータセットにわたって、サポート ベクター マシン (SVM) の全体的なパフォーマンスの利点がありました。 Pr (SVM > LR) = 0.819 および Pr (SVM > NB) = 0.934。 XL サブデータセットの診断の重症度を予測する際のすべての学習者にわた​​る全体的な分類パフォーマンスは、AD よりも VaD 診断カテゴリの方が優れていました (Pr (VAD > AD) = 0.998)。

表5

二分法臨床診断重症度分類パフォーマンス (AUC; 0.0–1.0) の結果は、それぞれのモデリング スキームの上位 XNUMX 人の学習者ごとに得られます。

モデリングスキームロジスティック回帰ナイーブベイズサポートベクターマシン
MCI-AD 対 AD0.74650.78100.7443
MCI-VaD 対 VaD0.80330.80440.8338

各モデリング スキームの最高のパフォーマンスを次に示します。 大胆な (必ずしも統計的に異なるわけではありません。 大胆な).

考察

認知的健康の変化を早期に検出することは重要です 個人の健康管理と公衆衛生の両方で実用的です。 実際、世界中の患者の臨床現場で非常に優先度が高いものでもあります。 共通の目標は、患者、介護者、医療提供者に注意を喚起し、認知機能の低下を経験し始めている患者に対して、適切で費用対効果の高い治療と長期的なケアを早期に開始することです。 XNUMX つの病院/診療所のデータ サブセットを統合して、XNUMX つの明確に好ましい学習者 (XNUMX つの注目すべき傑出 - ナイーブ ベイズ) を特定し、これらを利用して予測モデルを構築しました。 認知機能の健康状態を確実に分類できる MemTrax パフォーマンス メトリクス 二分法 (通常の認知健康または MCI) は、MoCA 集計スコアによって示されます。 特に、これらの MemTrax パフォーマンス メトリックを主に含む上位 XNUMX つの機能のみをモデルが利用した場合、XNUMX 人の学習者すべての全体的な分類パフォーマンスが向上しました。 さらに、認知症診断の XNUMX つのカテゴリーである AD と VaD の重症度を区別するために、診断サポート分類モデリング スキームで同じ学習者と MemTrax パフォーマンス メトリックを利用する実証済みの可能性を明らかにしました。

メモリテスト アルツハイマー病の早期発見の中心となる [23, 24]。 したがって、MemTrax が受け入れられ、魅力的で、実装しやすいオンライン プラットフォームであることは好機です。 エピソード記憶のスクリーニング検査 一般集団で[6]。 この継続的なパフォーマンス タスクからの認識精度と応答時​​間は、学習、記憶、および認知に関連する神経形成プロセスの早期および進化する劣化とその結果としての欠陥を特定する際に特に明らかになります。 つまり、主に MemTrax パフォーマンス メトリクスに基づいているここでのモデルは、影響を受けやすく、より実質的な機能喪失のかなり前の移行期の無症候性段階で生物学的神経病理学的障害を最小限のコストで容易に明らかにする可能性が高い [25]。 アシュフォード等。 MemTrax に自分で参加したオンライン ユーザーの認識記憶精度と応答時​​間のパターンと動作​​を詳しく調べました [6]。 これらの分布が最適なモデリングと有効で効果的な患者ケア アプリケーションの開発に重要であることを尊重し、臨床的に適用可能な認識と応答時間のプロファイルを定義することは、臨床および研究の有用性のための貴重な基本的な参照を確立する上で不可欠です。 AD スクリーニングにおける MemTrax の実用的な価値は、初期段階の認知機能障害と鑑別診断サポートのためのものであり、併存疾患と、テストのパフォーマンスに影響を与える認知機能、感覚機能、および運動機能を考慮することができる臨床設定のコンテキストで、より詳細に検討する必要があります。 そして、専門的な視点を伝え、実際の臨床的有用性を奨励するために、確立された認知健康評価テストとの比較を実証することが最初に不可欠です. . この点で、特に MemTrax の有用性と患者の受け入れの容易さを比較検討する場合、MemTrax の臨床効果における MoCA との有利な比較は重要です。

MemTrax と MoCA を比較した以前の調査では、モデリング調査を正当化する理論的根拠と予備的な証拠が強調されています [8]。 ただし、この以前の比較では、調査した 26 つの主要な MemTrax パフォーマンス メトリックを、MoCA によって決定され、それぞれの範囲とカットオフ値を定義した認知ステータスに関連付けただけです。 他の潜在的に関連する患者固有のパラメーターをより個別に考慮できる予測モデリングベースのアプローチを調査することにより、MemTrax の臨床的有用性評価を深めました。 他のものとは対照的に、MoCAスコアへの教育補正(調整)を使用したモデルパフォーマンス、または認知健康識別MoCA集計スコアしきい値を最初に推奨された23から12に変更したモデルパフォーマンスに利点は見つかりませんでした[15、XNUMX]。 実際、分類パフォーマンスの利点は、未調整の MoCA スコアとより高いしきい値を使用した方が有利でした。

臨床実習のポイント

機械学習は、データが広範かつ多次元である場合、つまり、多数の観測値とそれに付随する価値の高い (寄与する) 属性の幅広い配列がある場合に、予測モデリングで最もよく利用され、最も効果的です。 それでも、これらの現在のデータでは、選択された機能が 10 つだけのフィルター処理されたモデルは、XNUMX の一般的な機能すべてを利用したモデルよりも優れたパフォーマンスを示しました。 これは、病院の集計データセットには、この方法で患者を最適に分類するための最も臨床的に適切な (価値の高い) 特徴がなかったことを示唆しています。 それにもかかわらず、主要な MemTrax パフォーマンス メトリクスである MTx-% C および MTx-RT に重点を置いた機能ランキングは、このテストに関する初期段階の認知障害スクリーニング モデルの構築を強力にサポートします。少なくとも現時点では、認知的健康状態の二項分類の最初の画面として記憶性能を評価します。 医療提供者と医療システムへの負担がこれまでになく高まっていることを考えると、患者のスクリーニング プロセスと臨床アプリケーションは、診断において最も有用で有利であり、効果が証明されている患者の特徴と検査指標の収集、追跡、モデル化に重点を置いて適切に開発する必要があります。そして患者管理サポート。

0.90 つの主要な MemTrax メトリクスが MCI 分類の中心であるため、最もパフォーマンスの高い学習者 (ナイーブ ベイズ) はほとんどのモデルで非常に高い予測性能 (AUC は 4 以上) を示し、真陽性と偽陽性の比率は 1 に近いか、XNUMX をやや超えています。 : XNUMX. この学習器を使用したトランスレーショナル臨床アプリケーションは、認知障害のある人のほとんどを捕捉 (正しく分類) する一方で、正常な認知健康を持つ人を誤って認知障害 (偽陽性) として分類することに関連するコストを最小限に抑えます。認知障害がある人ではその分類が欠落しています (偽陰性)。 誤分類のこれらのシナリオのいずれかが、患者と介護者に過度の心理社会的負担を課す可能性があります。

予備分析と完全分析では、各モデリング スキームで XNUMX 人の学習者すべてを使用しましたが、最も一貫した強力なパフォーマンスを示す XNUMX つの分類子に結果を集中させました。 これはまた、これらのデータに基づいて、認知状態の分類を決定する際の実際の臨床応用において高いレベルで信頼できるパフォーマンスを期待できる学習者を強調することでもありました. さらに、この研究は、認知スクリーニングにおける機械学習の有用性とこれらのタイムリーな臨床的課題に関する入門調査として意図されていたため、最小限のパラメーター調整で、学習手法をシンプルかつ一般化したままにすることを決定しました。 このアプローチが、より狭く定義された患者固有の予測機能の可能性を制限した可能性があることを理解しています。 同様に、上位の機能のみを使用してモデルをトレーニングする (フィルター処理されたアプローチ) と、これらのデータに関してさらに情報が得られますが (収集されたデータの欠点に固有であり、貴重な臨床時間とリソースを最適化する価値を強調しています)、絞り込むのは時期尚早であることを認識しています。モデルの範囲、したがって、すべての (およびその他の機能) は、幅広い人口に適用できる優先機能のより明確なプロファイルが得られるまで、将来の調査で検討する必要があります。 したがって、特にさらなる臨床評価で考慮する必要がある認知能力に影響を与える併存疾患に対応するために、効果的な臨床応用に統合する前に、これらおよび他のモデルのより包括的で広く代表的なデータと最適化が必要であることも十分に認識しています。

MemTrax の有用性は、個別の臨床診断に基づく疾患の重症度のモデル化によってさらに説明されました。 VaD の重症度を予測する上での全体的な分類パフォーマンスは (AD と比較して) 向上しませんでした。 血管の健康に特化したモデルの患者プロファイルの特徴を考えると、驚くべきことです 脳卒中リスク、すなわち、高血圧、高脂血症、糖尿病、および(もちろん)脳卒中の既往。 これらのより包括的なデータを使用して学習者を訓練するために、正常な認知健康を持つ一致した患者に対して同じ臨床評価を実施することがより望ましく、適切であったでしょう. MemTrax は主に認知障害の初期段階の検出とその後の個人の変化の追跡に使用されることを意図しているため、これは特に保証されます。 また、VaD データセット内のデータのより望ましい分布が、比較的優れたモデリング パフォーマンスに部分的に貢献したことももっともらしいです。 VaD データセットは XNUMX つのクラス間でバランスが取れていましたが、MCI 患者がはるかに少ない AD データセットはそうではありませんでした。 特に小さなデータセットでは、いくつかのインスタンスを追加するだけでも、測定可能な違いが生じる可能性があります。 両方の視点は、疾患重症度モデリングのパフォーマンスの違いの根底にある合理的な議論です。 ただし、改善されたパフォーマンスをデータセットの数値特性または検討中の臨床症状に固有の固有の特徴に比例的に帰するのは時期尚早です。 それにもかかわらず、この小説は、臨床診断サポートの役割におけるMemTrax予測分類モデルの有用性を実証し、貴重な視点を提供し、MCIの連続体全体にわたる患者の追加検査の追求を確認します。

中国における MemTrax およびこれらのモデルの実装と実証された有用性は、言語と文化が確立された有用性を持つ他の地域 (例えば、フランス、オランダ、および米国) [7、8、27] とは大幅に異なることから、その可能性をさらに強調しています。 MemTrax ベースのプラットフォームが世界的に広く受け入れられ、臨床的価値があることを願っています。 これは、データの調和に向けて努力し、標準化され、世界中で使用できるように容易に適応される認知スクリーニングのための実用的な国際基準とモデリング リソースを開発する際の実証的な例です。

認知機能低下のモデリングと応用における次のステップ

アルツハイマー病の認知機能障害は、離散的な段階や段階ではなく、実際に連続して発生します[28、29]。 しかし、この初期段階では、「正常」と「正常でない」を根本的に区別できる MemTrax を組み込んだモデルを構築する能力をまず確立することが目標でした。 より包括的な経験的データ(例えば、脳画像、遺伝的特徴、バイオマーカー、併存疾患、および複合体の機能マーカー 認知を必要とする活動 より洗練された(適切に重み付けされたアンサンブルを含む)機械学習モデルをトレーニングおよび開発するために、さまざまな世界の地域、人口、および年齢層にわたって[30]、より高度な分類、つまり、患者のグループを分類する能力をサポートします。 MCI は、認知機能低下の連続体に沿って、より小さく、より決定的なサブセットに分類されます。 さらに、地域的に多様な患者集団全体の個人に対する付随する臨床診断は、 効果的に訓練する これらのより包括的で予測可能な堅牢なモデル。 これにより、同様の背景、影響、およびより狭く定義された特徴的な認知プロファイルを持つ人々のより具体的な層別化されたケース管理が容易になり、臨床的意思決定支援と患者ケアが最適化されます。

これまでの関連する臨床研究の多くは、少なくとも軽度の認知症患者を対象としています。 そして、実際には、患者の介入は進行した段階でのみ試みられることが多すぎます。 ただし、認知症の臨床基準が満たされるかなり前に認知機能の低下が始まるため、効果的に適用された MemTrax ベースの早期スクリーニングは、疾患とその進行に関する個人の適切な教育を促進し、より早期のよりタイムリーな介入を促すことができます。 したがって、早期発見は、運動、食事、情緒的サポート、社会化の改善から薬理学的介入に至るまでの適切な関与をサポートし、単独または全体として、認知症の進行を軽減または潜在的に停止する可能性のある行動と認識の患者関連の変化を強化する可能性がある [31, 32] . さらに、効果的な 早期スクリーニング、個人とその家族は、臨床試験を検討するか、カウンセリングやその他の社会サービスのサポートを受けて、期待と意図を明確にし、日常業務を管理するよう促される場合があります. これらの方法でのさらなる検証と広範な実用性は、多くの人にとってMCI、AD、およびADRDの進行を緩和または停止するのに役立つ可能性があります.

実際、私たちの研究における患者の年齢範囲の下限は、AD に伝統的に懸念されている集団を表していません。 それにもかかわらず、MoCA スコア/しきい値および診断の重症度に基づく分類モデリング スキームで利用される各グループの平均年齢 (表 3) は、少なくとも 80 歳である明確な過半数 (50% 以上) を強調しています。 したがって、この分布は一般化に非常に適しており、典型的に影響を受ける人々を特徴付ける母集団におけるこれらのモデルの有用性をサポートしています。 早期発症 ADおよびVaDによる神経認知疾患の急増。 また、最近のエビデンスと展望は、これらの認知された要因 (例えば、高血圧、肥満、糖尿病、および喫煙) が早期の高値に寄与する可能性があることを強調しています。 成人および中年期の血管リスクスコアと、その結果、若年でも明らかな影響を伴う潜行性に発生する微妙な血管性脳損傷 大人[33–35]。 したがって、早期発見のための最適な初期スクリーニングの機会 認知症に効果的に対処するために、認知障害のステージングと効果的な予防および介入戦略の開始 早期成人期および場合によっては小児期を含む、年齢スペクトル全体の寄与因子および先行指標を調べることから明らかになります (妊娠初期からのアポリポタンパク質 E などの遺伝的要因の関連性に注意してください)。

実際には、高度なイメージング、遺伝子プロファイリング、および有望なバイオマーカーの測定のための有効な臨床診断と費用のかかる手順は、多くのプロバイダーにとって常に容易に利用できるわけではなく、実行可能でさえありません。 したがって、多くの場合、最初の全体的な認知健康状態の分類は、患者が提供する他の単純な測定基準を使用してモデルから導出する必要があります (例: 自己申告 メモリの問題、現在の投薬、および日常的な活動の制限) および一般的な人口統計学的特徴 [7]。 カリフォルニア大学などのレジストリ 脳の健康 レジストリ (https://www.brainhealthregistry.org/) [27] およびその他、自己報告された症状、質的測定 (例、睡眠と毎日の認知)、投薬、健康状態、病歴、およびより詳細な人口統計は、クリニックでのこれらのより原始的なモデルの実用的なアプリケーションの開発と検証に役立ちます。 さらに、記憶機能の評価に有用性が実証されている MemTrax などのテストは、実際には、生物学的マーカーよりも大幅に優れた AD 病理の推定を提供する可能性があります。 アルツハイマー病の病状の核となる特徴は、神経可塑性の破壊とシナプスの圧倒的に複雑な喪失であり、それは一時的なものとして現れることを考えると 記憶障害、エピソード記憶を評価する尺度は、実際には 生きている患者の生物学的マーカーよりもADの病理学的負荷のより良い推定を提供します[36]。

最先端の技術と複数のドメインにわたる洗練された臨床的洞察からの複雑で包括的なデータによって補完されるか、既存の患者プロファイルの特徴であるより基本的ですぐに利用可能な情報に限定されるかどうかにかかわらず、すべての予測モデルにより、人工知能の認識された利点そして機械学習は、結果として得られるモデルが、継続的なアプリケーションの利用によって提供される関連する新しいデータと視点から合成し、帰納的に「学習」できることです。 実際の技術移転に続いて、ここにあるモデル (および開発予定のモ​​デル) が適用され、より多くのケースと関連データ (その後の認知機能低下を示す可能性のある併存疾患を持つ患者を含む) で強化されるにつれて、予測パフォーマンスと認知健康分類はより堅牢になります。その結果、より効果的な臨床意思決定支援ユーティリティが得られます。 この進化は、MemTrax をカスタム (利用可能な機能を対象とした) プラットフォームに組み込むことで、医療提供者が診療所でリアルタイムで利用できるようにすることで、より完全かつ実際的に実現されます。

診断サポートと患者ケアのための MemTrax モデルの検証と有用性には、重要な長期データが非常に求められています。 正常から初期の MCI までの適切な範囲で臨床状態に付随する変化 (ある場合) を観察および記録することにより、適切な進行中の評価および分類のモデルをトレーニングし、患者の年齢や治療に応じて修正することができます。 つまり、反復的な有用性は、軽度の認知的変化、介入の有効性、および情報に基づいた階層化ケアの維持の長期的な追跡に役立ちます。 このアプローチは、臨床診療や患者および症例管理とより密接に連携しています。

制限事項

私たちは、管理されたクリニック/病院環境でクリーンな臨床データを収集するという課題と価値を高く評価しています. それにもかかわらず、データセットに共通の特徴を持つより多くの患者が含まれていれば、モデリングが強化されたでしょう。 さらに、私たちの診断モデリングに特有のことですが、学習者を訓練するために、正常な認知健康を持つ一致した患者に対して同じ臨床評価を実施することがより望ましく、適切であったでしょう。 また、フィルタリングされたデータセット (上位 XNUMX つの特徴のみ) を使用したより高い分類パフォーマンスによって強調されるように、より一般的で 認知健康指標/指標は改善された可能性が高い すべての患者に共通する多数の特徴を備えたモデリング パフォーマンス。

特定の参加者は、一時的または慢性的な認知障害を引き起こした可能性のある他の病気を同時に経験していた可能性があります. 患者が AD または VaD のいずれかを有すると診断的に分類された XL サブデータセットを除いて、併存疾患データは YH 患者プールで収集/報告されておらず、KM サブデータセットで圧倒的に報告された併存疾患は糖尿病でした。 ただし、認知障害のレベルを促進または悪化させ、その結果として MemTrax のパフォーマンスが低下する可能性のある併存疾患を持つ患者をモデル化スキームに含めることは、このより一般化された早期認知スクリーニングの現実世界の対象となる患者集団をより代表するものになることは議論の余地があります。そしてモデリングアプローチ。 今後、認知能力に影響を与える可能性のある併存疾患の正確な診断は、モデルとその結果としての患者ケア アプリケーションを最適化するために広く有益です。

最後に、YH および KM サブデータセットの患者はスマートフォンを使用して MemTrax テストを受けましたが、限られた数の XL サブデータセットの患者は iPad を使用し、残りはスマートフォンを使用しました。 これにより、MoCA 分類モデリングの MemTrax パフォーマンスにデバイス関連の小さな違いが生じた可能性があります。 ただし、デバイス間などの MTx-RT の違い (あるとしても) は、特に記録されたテスト パフォーマンスの直前に各参加者に「練習」テストが与えられる場合は、無視できる可能性があります。 それにもかかわらず、これら XNUMX つのハンドヘルド デバイスの有用性は、ユーザーがコンピューターのキーボードのスペースバーに触れることによって写真を繰り返すことに応答した他の MemTrax の結果との直接比較および/または統合を損なう可能性があります。

MemTrax 予測モデリング ユーティリティのポイント

  • • 選択された MemTrax パフォーマンス メトリクスを含む当社の最高性能の予測モデルは、広く認知されている MoCA テストで示されるように、認知健康状態 (通常の認知健康または MCI) を確実に分類できます。
  • • これらの結果は、選択した MemTrax パフォーマンス メトリクスを初期段階の認知障害の分類予測モデル スクリーニング アプリケーションに統合することをサポートしています。
  • • 私たちの分類モデリングは、認知症診断の重症度を区別するアプリケーションで MemTrax のパフォーマンスを利用できる可能性も明らかにしました。

これらの新しい発見は、認知障害を経験している個人の効果的な臨床症例管理と患者ケアにおける診断サポートのための強化された堅牢な MemTrax ベースの分類モデルの構築における機械学習の有用性を支持する決定的な証拠を確立します。

謝辞

ここで利用されたオンライン継続的認識タスクとツール (MemTrax) を開発および検証した J. Wesson Ashford、Curtis B. Ashford、および同僚の功績を認識し、重要な基礎研究に貢献した多くの認知症患者に感謝します。 . また、SJN Biomed LTDのXianbo Zhouと彼の同僚、病院/診療所の彼の同僚と協力者、特に博士に感謝します。 M. Luo と M. Zhong は、参加者の募集、テストのスケジューリング、データの収集、記録、およびフロントエンド管理を支援し、ボランティア参加者は貴重な時間を寄付し、テストを受けて提供することを約束しましたこの研究で評価する価値のあるデータ。 これ この研究は、MD サイエンティフィック リサーチによって部分的に支援されました。 昆明医科大学のプログラム (許可番号 2017BS028 から XL) および雲南省科学技術部の研究プログラム (許可番号 2019FE001 (-222) から XL)。

J. Wesson Ashford は、この論文で説明されている特定の連続認識パラダイムを一般向けに使用するための特許を申請しました。 メモリのテスト.

MemTrax, LLC は Curtis Ashford が所有する会社であり、この会社は メモリテスト このホワイトペーパーで説明されているシステム。

著者の開示はオンラインで入手できます (https://www.j-alz.com/manuscript-disclosures/19-1340r2)。

記憶テスト 認知症テスト 記憶喪失テスト 短期記憶喪失テスト ラムテスト 心のダイエット さまざまな本 認知テストオンライン
Curtis Ashford – 認知研究コーディネーター

参考文献

【1] Alzheimer's Association (2016) 2016 アルツハイマー病の事実 と数字。 アルツハイマー認知症 12, 459–509.
[2] Gresenz CR , Mitchell JM , Marrone J , Federoff HJ (2019) 初期段階の効果 アルツハイマー病 家計の財政的成果について。 健康経済 29、18–29。
【3] Foster NL , Bondi MW , Das R , Foss M , Hershey LA , Koh S , Logan R , Poole C , Shega JW , Sood A , Thothala N , Wicklund M , Yu M , Bennett A , Wang D (2019)神経学:軽度認知障害の質測定セット。 神経学 93、705–713。
[4] Tong T , Thokala P , McMillan B , Ghosh R , Brazier J (2017) 使用の費用対効果 プライマリケアにおける認知症および軽度認知障害を検出するための認知スクリーニング検査. Int J Geriatr Psychiatry 32、1392–1400。
[5] アシュフォード JW、ギア E、ベイリー PJ (2011) メモリーの測定 連続認識テストを使用して大規模なグループ設定で。 J アルツハイマー Dis 27、885–895。
【6] Ashford JW 、Tarpin-Bernard F 、Ashford CB 、Ashford MT (2019) エピソード記憶の測定のためのコンピュータ化された連続認識タスク。 J アルツハイマー Dis 69、385–399。
【7] Bergeron MF , Landset S , Tarpin-Bernard F , Ashford CB , Khoshgoftaar TM , Ashford JW (2019) 認知的健康状態の分類を予測するための機械学習モデリングにおけるエピソード記憶のパフォーマンス。 J アルツハイマー Dis 70、277–286。
[8] van der Hoek MD , Nieuwenhuizen A , Keijer J , Ashford JW (2019) MemTrax テスト 軽度認知障害のモントリオール認知評価推定と比較して。 J アルツハイマー Dis 67、1045–1054。
【9] Falcone M、Yadav N、Poellabauer C、Flynn P (2013) 軽度の外傷性脳損傷の分類に孤立した母音を使用。 2013 年、IEEE International Conference on Acoustics, Speech and Signal Processing、BC 州バンクーバー、pp. 7577–7581。
【10] Dabek F , Caban JJ (2015) ビッグデータを活用して、脳震盪後に心理的状態を発症する可能性をモデル化。 Procedia Comput Sci 53、265–273。
【11] Climent MT、Pardo J、Munoz-Almaraz FJ、Guerrero MD、Moreno L (2018) 地域薬剤師による認知障害の早期発見のための決定木。 Front Pharmacol 9、1232。
【12] Nasreddine ZS , Phillips NA , Bedirian V , Charbonneau S , Whitehead V , Collin I , Cummings JL , Chertkow H (2005) The Montreal Cognitive Assessment, MoCA: 軽度認知障害の簡単なスクリーニング ツール。 J Am Geriatr Soc 53、695–699。
【13] Yu J , Li J , Huang X (2012) 軽度認知障害の簡単なスクリーニングツールとしてのモントリオール認知評価の北京版: コミュニティベースの研究。 BMC精神医学12、156。
【14] Chen KL , Xu Y , Chu AQ , Ding D , Liang XN , Nasreddine ZS , Dong Q , Hong Z , Zhao QH , Guo QH (2016) 軽度認知障害をスクリーニングするための基本的なモントリオール認知評価の中国語版の検証。 J Am Geriatr Soc 64、e285–e290。
【15] カーソン N 、リーチ L 、マーフィー KJ (2018) モントリオール認知評価 (MoCA) カットオフ スコアの再検討。 Int J Geriatr Psychiatry 33、379–388。
【16] 米国精神医学会 (2013) タスク フォース、精神障害の診断および統計マニュアル: DSM-5™、American Psychiatric Publishing, Inc.、ワシントン DC。
【17] パイソン。 Python Software Foundation、http://www.python.org、15 年 2019 月 XNUMX 日にアクセス。
【18] R Core Group、R: 統計計算のための言語と環境 R Foundation for Statistical Computing、ウィーン、オーストリア。 https://www.R-project.org/、2018 年、15 年 2019 月 XNUMX 日にアクセス。
【19] Benavoli A 、Corani G 、Demšar J 、Zaffalon M (2017) Time for a change: ベイジアン分析によって複数の分類器を比較するためのチュートリアル。 J Mach Learn Res 18, 1–36.
【20] Frank E、Hall MA、Witten IH (2016) WEKA ワークベンチ。 の データマイニング:実用的な機械学習ツールとテクニック、フランク E、ホール MA、ウィッテン IH、パル CJ、編。 モーガン・カウフマン https://www.cs.waikato.ac.nz/ml/weka/Witten_et_al_2016_appendix.pdf
【21] Bergeron MF , Landset S , Maugans TA , Williams VB , Collins CL , Wasserman EB , Khoshgoftaar TM (2019) 高校スポーツの脳震盪症状のモデル化における機械学習. Med Sci Sports Exerc 51、1362–1371。
【22] Van Hulse J、Khoshgoftaar TM、Napolitano A (2007) 不均衡なデータからの学習に関する実験的展望。 の 第 24 回機械学習国際会議議事録、Corvalis、オレゴン州、米国、pp. 935-942。
【23] Ashford JW、Kolm P、Colliver JA、Bekian C、Hsu LN (1989) アルツハイマー患者の評価と最小限の精神状態: 項目特性曲線分析.P. J Gerontol 44、139–146。
[24] アシュフォード JW、ジャービック L (1985) アルツハイマー病: ニューロンの可塑性は軸索神経原線維変性の素因となるか? N Engl J Med 313、388–389。
[25] ジャック CR Jr、サーノー TM、ウェイガンド SD、ウィステ HJ、ノップマン DS、ベムリ P、ロウ VJ、ミールケ MM、ロバーツ RO、マクルダ MM、グラフ ラドフォード J、ジョーンズ DT、シュワルツ CG、ギュンター JL、センジェム ML 、Rocca WA、Petersen RC (2019) 国立老化研究所を使用した生物学的対臨床的に定義されたアルツハイマー スペクトル エンティティの有病率 アソシエーションリサーチ フレームワーク。 JAMA Neurol 76、1174–1183。
[26] Zhou X、Ashford JW (2019) アルツハイマー病. 加齢医学 2、88–93。
[27] Weiner MW , Nosheny R , Camacho M , Truran-Sacrey D , Mackin RS , Flenniken D , Ulbricht A , Insel P , Finley S , Fockler J , Veitch D (2018) 脳の健康 レジストリ: 神経科学研究の参加者の募集、評価、および縦断的モニタリングのためのインターネットベースのプラットフォーム。 アルツハイマー認知症 14、1063–1076。
[28] Ashford JW、Schmitt FA (2001) Modeling the time-course of アルツハイマー型認知症. Curr Psychiatry Rep 3、20–28。
【29] Li X , Wang X , Su L , Hu X , Han Y (2019) Sino Longitudinal Study on Cognitive Decline (SILCODE): 主観的認知を持つ個人の軽度認知障害への転換のリスク予測モデルを開発するための中国の縦断的観察研究のプロトコル却下。 BMJ オープン 9、e028188。
[30] Tarnanas I、Tsolaki A、Wiederhold M、Wiederhold B、Tsolaki M (2015) アルツハイマー病 認知症 予測: 日常生活マーカーの複雑な道具的活動はギャップを埋めることができますか? アルツハイマー認知症 (Amst) 1, 521–532.
[31] McGurran H、Glenn JM、Madero EN、Bott NT (2019) アルツハイマー病の予防と治療: 運動の生物学的メカニズム。 J アルツハイマー Dis 69、311–338。
[32] Mendiola-Precoma J , Berumen LC , Padilla K , Garcia-Alcocer G (2016) 治療 アルツハイマー病の予防と治療. Biomed Res Int 2016、2589276。
【33] Lane CA 、Barnes J 、Nicholas JM 、Sudre CH 、Cash DM 、Malone IB 、Parker TD 、Keshavan A 、Buchanan SM 、Keus SE 、James SN 、Lu K 、Murray-Smith H 、Wong A 、Gordon E 、Coath W 、 Modat M 、Thomas D 、Richards M 、Fox NC 、Schott JM (2020) 成人期全体の血管リスクと晩年の脳病理学との関連: 英国の出生コホートからの証拠。 JAMA Neurol 77、175–183。
【34] Seshadri S (2020) 年齢とアミロイドボックスを超えた認知症の予防。 JAMA Neurol 77、160–161。
【35] メイラード P , セシャドリ S , ビーザー A , ヒマリ JJ , Au R , フレッチャー E , カーマイケル O , ウルフ PA , デカーリ C (2012) Framingham Heart Study: A cross における若年成人の白質完全性に対する収縮期血圧の影響-セクション研究。 Lancet Neurol 11、1039–1047。
[36] Fink HA、Linskens EJ、Silverman PC、McCarten JR、Hemmy LS、Ouellette JM、Greer NL、Wilt TJ、Butler M (2020) 神経病理学的に定義されたバイオマーカー検査の精度 認知症の高齢者におけるアルツハイマー病. アンインターン医学 172, 669–677.

所属: [a] SIVOTEC Analytics、米国フロリダ州ボカラトン | [b] コンピュータおよび電気工学およびコンピュータ サイエンス学部、フロリダ アトランティック大学、ボカ ラトン、フロリダ州、米国 | [c] SJN Biomed LTD、中国雲南省昆明 | [d] センター アルツハイマー病の研究、ワシントン臨床研究研究所、ワシントン DC、米国 | [e] 中国雲南省昆明市にある昆明医科大学付属病院リハビリテーション科 | [f] 神経科、Dehong People's Hospital、Dehong、雲南省、中国 | [g] 中国雲南省昆明市五華区にある昆明医科大学の最初の付属病院である神経科 | [h] バージニア州パロアルトの戦争関連の病気と怪我の研究センター ヘルスケア システム、パロアルト、カリフォルニア州、米国 | [i] 米国カリフォルニア州パロアルトのスタンフォード大学医学部精神医学・行動科学科

連絡先: [*] 連絡先: Michael F. Bergeron, PhD, FACSM, SIVOTEC Analytics, Boca Raton Innovation Campus, 4800 T-Rex Avenue, Suite 315, Boca Raton, FL 33431, USA. 電子メール: mbergeron@sivotecanalytics.com.; Xiaolei Liu, MD, Department of Neurology, First Affiliated Hospital of Kunming Medical University, 295 Xichang Road, Wuhua District, Kunming, Yunnan Province 650032, China. 電子メール: ring@vip.163.com.

キーワード: 老化, アルツハイマー病、認知症、集団検診