学位論文

コミックのあらすじ文の共通要素に着目したコンセプト文の生成とその活用に関する研究

Abstract

本研究は,計算機を用いたコンセプト文の自動生成を目的とする. 本研究では,例えば``敵対する組織に属する男女二人が恋に落ちる話'' のように,ストーリーの内容を端的に表現した文章をコンセプト文と定義する. 本研究では,コンセプト文は複数の物語作品の共通のストーリーを説明した文章であると考えられることから,漫画作品同士の共通点からコンセプト文の生成を試みる. その端緒として,本稿は類似する複数の物語作品のあらすじ文から抽出した共通する単語を使用することでコンセプト文は生成可能か,生成したコンセプト文は物語作品を説明可能か,を明らかにする. コンセプト文の生成にあたって,本研究では2つの予備実験を実施した. 1つ目は,同一物語作品のストーリー内容を短く説明した文章に読者ごとに差異が現れるのかを観察することにより,同一物語作品を指すそれらの文章に統一性はあるか,どのような特徴を有しているのかについて分析をするために,コンセプト文の利用可能性について検証する予備実験を実施した. 2つ目は,あらすじ文と人手により収集したコンセプト文のそれぞれに記述される特徴を比較することで,あらすじ文からコンセプト文の作成に必要な要素を調査するために,コンセプト文とあらすじ文の特徴を比較する予備実験を実施した. これらの予備実験から得た知見を踏まえて,本研究では類似する複数の漫画作品のストーリー内容の共通点からコンセプト文の生成を試みる. そこで,漫画作品のストーリー内容の共通点の抽出のために,コンセプト文の素材データとして漫画作品のストーリー内容がテキストベースで記述されるあらすじ文を使用する. コンセプト文の生成は主に(1)形態素解析によるあらすじ文からの特定の品詞の単語の抽出,(2)文章ベクトルの算出,(3)クラスタリング,(4)コンセプト文の作成に使用する単語の選定,(5)大規模言語モデル(LLM)によるコンセプト文の作成の5つのステップを経る. (1)は各漫画作品に対する文章ベクトル算出のための前処理であり,あらすじ文から各漫画作品に登場するキャラクタの特徴を表す名詞と形容詞,キャラクタのストーリー上の主軸となる行動を表す動詞を抽出する. (2)では,類似する漫画作品ごとに分類するために,抽出した単語から各漫画作品の文章ベクトルを算出する. (3)では,各漫画作品の文章ベクトルをもとにクラスタリングを行う. (4)では,クラスターごとにそのクラスターを特徴づける単語をコンセプト文の作成に使用する単語として選定する. (5)では,クラスターを特徴づける単語を変数として,LLMを用いてコンセプト文を生成する. この一連のステップからは,クラスタリングにより共通点を持つ漫画作品同士に分類でき,類似する複数の漫画作品間に共通する話題を抽出することが可能であることが示唆され,コンセプト文の作成に有効であることが示唆された. 実験では,生成されたコンセプト文の物語作品のストーリー内容の説明妥当性の評価実験を行った. アンケート評価実験の結果から,本研究で生成されたコンセプト文はそれぞれの当該クラスターに属する漫画作品の多くを大まかに説明できていることが示唆された. しかし,コンセプト文の生成に使用する単語の数が少なくなってしまったことから,複数の物語作品のあらすじ文に共通して出現する特徴的な単語の抽出には改善の余地があることがわかった.

Information

Book title

2024年度関西大学大学院総合情報学研究科修士論文

Date of issue

2025/02/17

Date of presentation

2025/02/17

Citation

藤川 雄翔. コミックのあらすじ文の共通要素に着目したコンセプト文の生成とその活用に関する研究, 2024年度関西大学大学院総合情報学研究科修士論文, 2025.