招待講演

テキストマイニングでできること一理学療法分野で活用するためのコツと注意点

Abstract

本講演では、計算機科学分野で発展してきたテキストマイニング技術を取り上げ、理学療法分野での活用可能性と注意点について整理する。 テキストマイニングは、人が書いた文章(テキスト)から規則性や関係性を抽出する技術・手法の総称であり、自然言語処理や統計解析を基盤としている。近年、医療やリハビリテーションの現場でも電子カルテや実習記録、アンケート、報告書といった膨大なテキストデータが日常的に蓄積されるようになってきている。テキストマイニングを活用することで、例えば、退院時アンケートの自由記述文から改善すべき点を抽出したり、蓄積されたヒヤリハットレポートからインシデントの要因を類型化したりすることが可能になるため、医療従事者の業務負担の軽減や教育の効率化などへの貢献が期待される。 現在、テキストマイニングツールの普及やChatGPT等の生成AIの登場により、頻出する語彙を計数して序列化したり文章内で共起しがちな語彙の相関図を可視化したりする処理が簡便に行えるようになり、テキスト処理に関わる専門知識やプログラミング経験がなくても一定の分析が手軽に行うことが可能になった。しかし、テキストマイニングは統計的処理に基づく手法に過ぎないため、適切に運用しなければ誤った解釈を導き出してしまうという懸念がある。そのため、テキストマイニングの実施に先立ち,「どのようなデータを対象にして、何を明らかにしたいのか」を明確に定める必要がある。カルテ記載や実習報告、自由記述アンケートなど、対象となるデータの性質によって適した手法は異なる。またデータ量も重要な要素であり、十分な量のテキストが得られない場合には結果が不安定になることがある。そのため、テキストマイニングを実施する際は、目的を達成するのに適切な性質を持つデータが十分取得できているかを確認したうえで、専門用語の統一や口語的表現への対応、表記ゆれの解消など、目的に応じた前処理を行う必要がある。 テキストマイニングの限界についても、分析者自身が明確に認識しておくべきである。分析結果は前処理や手法選択に大きく依存し、その解釈は分析者の裁量に左右されやすい。特に理学療法分野においては、専門用語や臨床的文脈を正しく反映させるための辞書整備や注釈付与がまだ十分ではなく、その必要性も十分に認知されていない。単純な頻度や共起に基づく分析だけでは、肯定・否定の文脈や因果関係を見誤る恐れがある。そのため、テキストマイニングはあくまで「補助的な手段」として位置づけ、臨床知や専門的判断と併せて活用することが求められる。 こうした注意点を理解することで、テキストマイニングは強力なツールとして活用できるようになる。本講演を通じて、講演参加者が自身の研究活動や臨床実務においてテキストマイニングを効果的に導入するための視座が得られることを期待する。

Information

Book title

第36回兵庫県理学療法学術大会

Date of issue

2025/10/19

Date of presentation

2025/10/19

Location

兵庫県神戸市(甲南女子大学)

Citation

松下 光範. テキストマイニングでできること一理学療法分野で活用するためのコツと注意点, 第36回兵庫県理学療法学術大会, 2025.