2020/6/4、深層学習による心調律異常、伝導異常の自動心電図診断についての研究「Automatic multilabel electrocardiogram diagnosis of heart rhythm or conduction abnormalities with deep learning: a cohort study」の結果をまとめました。

2020/06/11

2020/6/4、深層学習による心調律異常、伝導異常の自動心電図診断についての研究「Automatic multilabel electrocardiogram diagnosis of heart rhythm or conduction abnormalities with deep learning: a cohort study」の結果をまとめました。心電図の自動診断で、幅広い不整脈をカバーし、複数の心電図異常を診断、人間の診断精度よりも優れているとされるものはまだ開発されていません。深層学習の技術アプローチにて、リアルタイム心電図解析にて、心調律異常、伝導異常等の複数ラベルの自動診断を開発することを目指して、18歳以上、10秒間、12誘導の心電図データセット、心調律異常、伝導異常のほとんどのタイプを含む21の調律群、複数ラベルの不整脈診断を解析しました。心電図データは中国、武漢の華中科学技術大学（Huazhong University of Science and Technology）の同済病院（Tongji Hospital）から収集しました。データセットを用いて不整脈診断を行うための畳み込みニューラルネットワークアプローチを開発しました。訓練データセットが含まれていない新しい群の心電図データセットで検証を行いました。検証データセットは循環器内科医の委員会のコンセンサスのラベル付きです。モデルのパフォーマンスを評価するために、F1スコア、受信者操作特性（receiver operating characteristic: ROC）曲線の曲線下面積（area under the curve: AUC）、感度、特異度を測定しました。結果を検証するために、試験データセットは幅広い心電図解釈の経験値を持つ循環器内科で勤務している53名の臨床家による診断と比較しました。外部妥当性データセットとして、他の病院の心電図962例を用いて、診断モデルの一般化可能性（generalisability）を評価しました。訓練データセット、検証データセットは、2012/1/1から2019/4/30までの70692例、180112件の心電図データを収集しました。試験データセットは、2012/9/11から2019/8/30までの別の828例、828件の心電図データからなります。複数ラベルモデル、深層学習アプローチの心電図異常の診断は、828例中658例（80%）の正確性で正答、臨床家の平均パフォーマンス、経験値0-6年間で552例（67%）、経験値7-12年で571例（69%）、経験値12年以上で621例（75%）を超えていました。モデルの全体の平均F1スコアは0.887で、経験値0-6年0.789、経験値7-12年0.815、経験値12年以上0.831を超えていました。モデルのROC曲線のAUCスコアは0.983（95% CI 0·980–0·986）、感度0.867（0·849–0·885）、特異度0.995（0·994–0·996）でした。外部データベースによる検討ではモデルの修正なしに、平均F1スコアは複数ラベル0845、単一ラベル0.852でした。モデルは、複数ラベル、単一ラベルの不整脈の鑑別において循環器内科で勤務している臨床家よりも正確でした。臨床応用としてコンピュータによる意思決定サポートシステムの有望かも知れないと論文ではまとめています。
https://www.thelancet.com/journals/landig/article/PIIS2589-7500(20)30107-2/fulltext
心電図の自動診断の精度の報告です。18万件の教師データ、精度はAUC 0.995、感度86.7%、特異度99.5%でした。現在の心電図の自動診断は偽陰性を恐れるあまり感度重視で、特異度が低いことが課題なのですが、特異度99.5%とは素晴らしいです。この手の診断精度はテクノロジーの進歩によって限りなく100%へ近付いていくものなので、「診断のみ」の医療従事者の仕事はなくなると考えたほうが良いでしょう。実際のところ、心電図さえ記録出来れば心電図診断自体で困ることはあまりありません。記録、診断は機械にまかせて、診断が付いた後にマネジメントをどうしていくかが医療従事者の仕事となっていくでしょう。