研究報告

理学療法分野におけるテキスト解析のためのアノテーション基準構築と妥当性検証

Abstract

【はじめに】 診療録や医学論文,症例報告など医療分野において解析対象となるテキストデータは多岐にわたる.一般的に,自然言語処理を行う際にはコーパスを用いるが,理学療法分野のテキストにおけるコーパスは,筆者の渉猟しうる限り構築されていないことが確認された.本研究では,理学療法士が行う症例報告のテキストを解析するために構築したアノテーション基準とその妥当性を検証することを目的とする. 【方法】 事前に先行研究を参考にし,理学療法士特有の表現としてICF (International Classification of Functioning, Disability and Health)項目における問題点の表現や理学療法評価・検査の項 目と結果,歩行分析などの項目を網羅するため,事前に収集し た大腿骨頸部骨折術後の模擬症例に対する臨床推論文章15例に, アノテーションの付与作業を行い,不足している項目について は新たにアノテーション基準を構築した.また,筆者が作成し たアノテーション基準の妥当性を検証するため,1~8年目の理 学療法士5名 (以下:アノテーター)に,作成したアノテーショ ン基準を提示した上で,実際にアノテーションの付与作業を行 い,付与されたアノテーションの一致度を検証した.アノテー ション作業は,事前に収集した大腿骨頸部骨折症例に対する臨 床推論の文章記載課題を遂行させた際に,最も得点の高かった ケースに対して行った.アノテーションの精度検証は,先行研 究に倣い,筆者が付与したアノテーションデータに対して,ア ノテーターが付与したものの適合率,再現率,Macro F-1score を算出することで評価した. 【結果】 筆者が作成したアノテーション基準を参照し,1症例分の臨床 推論文章に付与されたアノテーション項目は16種類であった. この16種のアノテーションに対して,実験参加者5名が付与し たアノテーションがどの程度一致するかを適合率,再現率, Macro F-1scoreを用いて検証した.検証の結果,適合率は0.78, 再現率は0.85,Macro F-1スコアは0.79であった.

Information

Book title

第35回兵庫県理学療法学術大会

Pages

40

Date of issue

2024/09/15

Date of presentation

2024/09/15

Location

兵庫県姫路市(アクリエ姫路)

Citation

畠山 駿弥, 中村 圭介, 松下 光範. 理学療法分野におけるテキスト解析のためのアノテーション基準構築と妥当性検証, 第35回兵庫県理学療法学術大会, No.P-022, pp.40, 2024.