Abstract
本稿では,コンテンツと人の関係に着目した抽象化に基づいて,複数のデータセットに含まれるデータ項目群を横断的に理解するための情報整理のフレームワークを提案する.商品検索や料理など様々な目的に応じたアプリケーション研究への利用を念頭に様々なコンテンツに関するデータセット(コンテンツデータセット)が公開されており,これらのデータセットを利用した研究が数多く報告されている.現状では,コンテンツデータセットは,扱うコンテンツの違い(例えば,レシピやホテルレビューなど)に従ったデータセット単位で整理されている.そのため,異なるデータセット間では,共通あるいは類似した性質をもつデータ項目が存在していたとしても,それらの関係性を読み解くことは容易ではないため,
複数のコンテンツデータセット内のデータ項目を横断的に整理可能にする必要がある.提案手法では,コンテンツデータセットに含まれるデータ項目の性質を,コンテンツ自身とコンテンツを提供するクリエイター,コンテンツを利用するユーザの3者の関係によって抽象化する.抽象化によって同一の性質をもつと判断された異なるデータセットに含まれるデータ項目を扱った研究論文について,データ利用に関わる単語の出現傾向を考察することで,提案手法の妥当性を議論した.
Artifacts
Information
Book title
第14回データ工学と情報マネジメントに関するフォーラム
Date of issue
2022/02/18
Date of presentation
2022/03/01
Location
オンライン
Citation
玄道 俊, 松下 光範, 山西 良典. コンテンツと人の関係に着目したコンテンツデータセットの抽象化によるデータ利用傾向の俯瞰, 第14回データ工学と情報マネジメントに関するフォーラム, No.E34-4, 2022.