予稿集

既存データセットの活用事例に基づく新規データセットの活用方法推薦に関する検討

Abstract

本研究の目的はユーザのデータ利活用を支援することである. 現在提供しているサービスの有用性検証や新規サービスの考案など,様々な利用目的の下でユーザの購買データやレビューデータなど様々な大規模データセットが日々構築されている. こうしたデータセットを分析して有益な情報を抽出するために様々な技術が開発されているが,ユーザが目的に沿った情報を取得するには,適切な技術の選択が不可欠である. しかし,技術に不慣れなユーザが未知のデータに対して適用すべき技術を適切に選択することは容易ではない. そこで本稿では,データの特性,適用する分析技術,得られる結果の三者の関係に注目し,既存の活用事例を分類整理することで,ユーザが未知のデータを扱う際の支援を試みる. 提案手法では,類似した特性を持つデータには同じ分析技術が適用可能であるという仮説のもと,データセット内のカラムの形式と性質の類似性から適用可能な技術を推薦する.

Information

Book title

第17回データ工学と情報マネジメントに関するフォーラム

Date of issue

2025/02/19

Date of presentation

2025/03/01

Location

口頭発表:オンライン,インタラクティブ発表:福岡県福岡市(九州国際会議場)

Citation

林 沙也加, 畑 玲音, 松下 光範. 既存データセットの活用事例に基づく新規データセットの活用方法推薦に関する検討, 第17回データ工学と情報マネジメントに関するフォーラム, No.9F-03, 2025.