予稿集

単語の頻度と意味に基づいたコミックに関するテキスト情報源の特性分析

Abstract

本稿では,コミックに関する説明文やレビュー文といった同一コンテンツを扱うテキストでも情報源によって記述内容が異なることに着目し,出現単語から各情報源の特性を分析した. コミックは画像と言語によって構成されるマルチモーダルなコンテンツであるため,内容に基づくコンテンツを直接的に処理するアプローチは難しい. 間接的にコンテンツの内容を処理するための方法としてコミックに関するテキスト情報の分析があるが,テキストの情報源の違いによる特性についての知見は見当たらない. 作品の詳細を伝えるために用意された説明文と作品を読んだ読者の感想が書かれたレビュー文の2種類の情報源の対象とし,テキストに含まれる頻出単語を意味的に分類することで,同一コンテンツに対する異なる情報源での特性の違いを分析した. その結果,説明文には登場キャラクタの家族構成や身体情報,性別といった内容を示す単語が,レビュー文にはイラストや作風といった作品のメタ的な情報を示す単語がそれぞれ特徴的に現れることを確認した. コミックに関連するテキスト情報において,作品の説明文はレビュー文に比べて内容に基づくアプローチの情報源として有用である可能性が示唆された.

Artifacts

Information

Book title

第14回データ工学と情報マネジメントに関するフォーラム

Date of issue

2022/02/18

Date of presentation

2022/02/28

Location

オンライン

Citation

樋口 亮太, 山西 良典, 松下 光範. 単語の頻度と意味に基づいたコミックに関するテキスト情報源の特性分析, 第14回データ工学と情報マネジメントに関するフォーラム, No.E21-2, 2022.