学位論文

SNS情報構造に着目した人--計算機協調による災害情報トリアージに関する研究

Abstract

1995年の阪神・淡路大震災以降,インターネットは災害時における不可欠なライフラインとなり,特に近年では,代表的なソーシャルメディアであるX(旧Twitter)が,個人の安否確認や被災状況の共有,救助要請などの手段として広く認知され,活用されている.SNSは「今起きていること」を即座に発信できる特性を持ち,社会のリアルタイムな状況をセンシングするための「ソーシャルセンサ」としての機能が期待されている.しかし,SNSの情報空間には,災害発生直後から情報の爆発的な増加(バースト現象)が生じ,被災地からの情報が,災害とは無関係な日常投稿や,被災者に共感する投稿,さらには偽・誤情報といった膨大なノイズ情報の中に埋没するという課題がある.既存の研究では,自然言語処理や機械学習を用いて有益な情報を「自動抽出」するアプローチが試みられてきたが,学習データの不足や未知の災害パターンへの対応の難しさ,そして災害被害情報の偽陰性を排除できないことから,人命に関わる重要情報の「取りこぼし」を完全に防ぐことは困難である.また,実際の災害対応現場では人的・時間的リソースが著しく不足しており,膨大な情報を人手ですべて検証することも現実的ではない.そこで本研究は,「情報トリアージ」の概念を適用し,ノイズ情報を段階的に除外(Subtraction)することで,人が確認すべき情報の効率的に確保する「人と計算機の協調による災害情報トリアージ」の方法論を構築することを目的とする. 本研究ではまず,信憑性の高いSNS災害情報を効率的に収集を行うための指針として,SNS情報の流通構造をモデル化した.災害時のSNS情報は,現場からの「一次情報(第1層)」,報道や転載による「二次情報(第2層)」,そして日常投稿や反応などの「ノイズ情報(第3層)」が層状に重なり,さらに「現場/現場外」および「悪用者」という軸が交差するマトリクス構造となっている.災害対応において真に必要とされるのは,被災者や現地目撃者による被害情報等を発信している第1層の一次情報であることを示した.情報の信頼性を判断するには,テキスト内容だけでなく,添付メディア(画像・動画),発信者の属性,拡散の経緯(再掲痕など)といった複数の手がかりを総合的に参照する必要がある.しかし,緊急時にこれらを全件確認することは現実的ではないため,計算機が大量データの構造化と可視化を担い,人間が最終的な判断と除外を行うという役割分担が必要となる.本研究では,重要情報の「抽出」よりも「除外」を先行させるアプローチを採用する.具体的には,(1)投稿の収集,(2)システムによる分析(クラスタリング),(3)情報整理(ノイズの除外),(4)情報精査(重要情報の確保),(5)共有,という段階的峻別プロセスを提案した.このプロセスにおいて,計算機は特徴ごとに投稿を「群(クラスタ)」としてまとめ,人間はその群単位で災害とは無関係な情報を除外していくことで,情報空間を縮小し,必要な情報の可視性を高めることを目指す. 提案モデルの妥当性を検証するため,「令和2年7月豪雨」発生時のX(旧Twitter)データを対象に,流通した情報の調査を行った.「救助」および「避難」をキーワードに収集された約47万件の投稿に対し,添付された画像を人手により分類し,それぞれのテキスト特徴(TF-IDF)を分析した.調査の結果,収集された投稿のうち,実際に被災者が撮影した被害状況を含む投稿は全体のわずか0.564%に過ぎないことが明らかとなった.また,テキスト分析の結果,被災者による「被害」投稿には特出した単語特徴が見られず,テキスト情報のみに頼った自動抽出は困難であることが示された.一方で,「ゲーム」や「アニメ」,「日常風景」といったノイズ情報には,特定の語彙が高頻度で出現するという特徴が確認された.この結果は,特徴が希薄な重要情報を抽出しようとする従来のアプローチよりも,特徴が明確なノイズ情報を特定して除外するアプローチの方が,災害時の情報収集において合理的かつ確実性が高いことを定量的に裏付けるものである. 次に,画像とテキストを統合的に扱うマルチモーダルモデルであるCLIP(Contrastive Language-Image Pre-training)を用いて,ノイズ情報の機械的な分離可能性を検証した.令和2年7月豪雨のデータセットに対し,CLIPを用いて画像を言語的特徴量へ変換し,PCA(主成分分析)による次元削減を経て,k-means法によるクラスタリングを行った.分析の結果,「ゲーム」のようなエンターテインメント関連の画像や,「植物」「動物」といった災害とは無関係なノイズ画像は,特定のクラスタに強く偏在する傾向が示され,機械的に分離可能であることが実証された.一方で,「被害」画像に関しては,「風景」画像との類似性が高く,画像特徴のみでは完全な分離が困難であり,一部のクラスタにおいて混在が見られた.しかし,ゲームや日常投稿などの明確なノイズ群をクラスタとして可視化・分離できたことは極めて重要である.これにより,ノイズ群を人が確認し,群としてまとめて除外することで,残された情報群における「被害」情報の密度と可視性を相対的に高めることが可能となる. 得られた知見を統合し,「災害情報トリアージインタフェース」を設計・実装した.本システムは,CLIPとクラスタリングによって整理された投稿群を3次元空間(PCA 3Dマップ)に可視化し,ユーザがクラスタ単位でノイズを能動的に除外できる機能を備えている.本システムと,従来のSNSのようにリスト形式で情報を閲覧・検索するベースラインシステムとの比較実験を行った.被験者に対し,実際の災害シナリオに基づき「被害が確認できる投稿」を収集するタスクを課した.タスク開始直後(0〜10分)においては,提案システムの習熟に時間を要するため,ベースラインシステムと比較して収集効率が劣る傾向が見られた.しかし,タスク後半(20〜25分,25〜30分)においては,提案システムを利用した群が,有意に高い効率で被害情報を収集できることが確認された(20〜25分:U=108.500, p=0.0342,25〜30分:U=108.000, p=0.0369).これは,ユーザがシステムを利用する過程で,明確なノイズクラスタを特定し,それらを除外機能によって排除することで情報空間が縮小され,結果として残存する重要情報の可視性が高まったことが考えられる.可視化された情報の空間的配置(類似性)を手がかりに,ノイズ情報や被害情報を連鎖的に発見できるという,提案システムの有効性が示された. 本研究では,人的・時間的リソースが制限されている大規模災害時において,SNS上の膨大かつ玉石混交な情報から重要情報を確保するための枠組みとして,「人と計算機の協調による情報トリアージ」を提案し,その有効性を実証した. 本研究の貢献は,第一に,災害時SNS情報の多層的マトリクス構造をモデル化し,信頼性判断における複合的な手がかりの必要性を示した点.第二に,実データに基づく定量調査により,重要情報の稀少性とノイズ情報の構造的特徴を明らかにした点.第三に,マルチモーダル手法(CLIP)を用いたクラスタリングにより,ノイズ情報の機械的分離が可能であることを示した点.第四に,情報の「除外(Subtraction)」を先行させるインタフェースを実装し,人間がノイズを効率的に捨てる支援を行うことで,結果的に重要情報の収集効率が向上することを実験的に証明した点である. 本研究が提案したモデルは,計算機と人間を適切に役割分担・協調させるものである.このアプローチは,将来的にSNSのプラットフォームや情報の形態が変化した場合においても,ノイズ情報が混在する情報空間から価値ある情報を確保するための方法論として機能し,迅速な災害対応に貢献することが期待できる.

Information

Book title

2023年度関西大学大学院総合情報学研究科博士論文

Date of issue

2026/03/21

Citation

森野 穣. SNS情報構造に着目した人--計算機協調による災害情報トリアージに関する研究, 2023年度関西大学大学院総合情報学研究科博士論文, 2026.