SNS におけるユーザのトレンドに対する態度を考慮した ファッ … · DEIM...

8
DEIM Forum 2016 F2-5 SNS におけるユーザのトレンドに対する態度を考慮した ファッション情報推薦手法 内田 友梨香 牛尼 剛聡 †九州大学芸術工学部 815-8540 福岡県福岡市南区塩原 4-9-1 ‡九州大学大学院芸術工学研究院 815-8540 福岡県福岡市南区塩原 4-9-1 E-mail: [email protected], [email protected] あらまし 現在,ファッション情報は SNS やブログなどの様々なインターネットメディアから得ることができ る.その一方で,莫大な情報の中から自分にとって有益な情報を見つけることが困難となったため,情報推薦が重 要となっている.ファッションにおける推薦は「トレンド」が大きく関係しており,ユーザによって「新商品はす ぐに購入する」「巷で流行しているから購入する」等,トレンドに対する態度が異なる.しかし,従来の推薦手法の 多くでは,ユーザとアイテムとの関係のみを考慮して,その時間的な側面を考慮していないため,ファッションに 関する情報を適切に推薦できない場合がある.本研究では,ファッション投稿が活発な写真投稿型 SNS である Instagram を利用して,ユーザの「トレンドに対する態度」を考慮した推薦手法を提案することで,より精度の高い ファッション情報推薦の実現を目指す. キーワード SNS,情報推薦,ファッション,トレンド 1. はじめに 従来,ファッションに関する情報は雑誌やテレビな どのマスメディアから得ることが一般的であった.し かし,近年,Instagram[1]に代表される SNS,Ameba[2] に代表されるブログ,WEAR[3]に代表される Web サービ スなどのインターネットメディアからファッション情 報を得る人々が増加している.しかし,ユーザは莫大 な情報の中からユーザは自分にとって有益な情報を見 つけることが困難となったため,情報推薦が重要とな っている.情報推薦に関する研究では,ユーザに対し てより精度の高い推薦を行うことが大きな目標の 1 つ であり,これまでにも様々な提案が行われてきた. 従来の代表的な推薦手法として,協調フィルタリン グが挙げられる[4].協調フィルタリングには,様々な 手法が存在するが,基本的には,既に明らかになって いるユーザとアイテムの関係性に基づいて,ユーザと 未知のアイテムとの関係性を推定するアプローチに基 づいている.例えば,「ユーザ」と「アイテム」の間に 「購入」という関係性に注目した場合,推薦対象とす るユーザと購入履歴に類似性が高いユーザを発見し, 多くの購入履歴の類似性が高いユーザが購入している アイテムを推薦するというものである. 一般的に,従来の推薦手法の多くでは,ユーザとア イテムとの関係が有する時間的な側面は考慮していな い.例えば,ユーザの購入履歴に基づいて推薦を行う 場合には,ユーザの購入した日時は考慮されない.し かし,ファッションにおける推薦を行う場合には,ユ ーザとアイテムとの時間的な側面が重要な意味を持つ 場合がある.何故なら,ファッションにおける情報や ユーザの嗜好には「トレンド」が強く関係するからで ある.すなわち,「新商品はすぐに購入する」,「巷で流 行しているから購入する」などユーザによってトレン ドに対する態度が異なり,それらはアイテムを推薦す る際に重要な特性と考えられる.従来の推薦手法では ファッション情報に大きな影響を与える「トレンド」 に対するユーザの態度を考慮していないため,トレン ドが影響を与える情報を適切に推薦できない場合があ る. 上記の問題を解決するために,本研究では,ファッ ションに関する投稿が活発な写真投稿型 SNS である Instagram を利用して,ファッションアイテムのトレ ンド性と,ユーザがファッションアイテムに反応した タイミング(投稿時刻)の 2 つに注目することで,ユ ーザの「トレンドに対する態度」を考慮したファッシ ョン情報推薦手法を提案し,より精度の高いファッシ ョン情報推薦の実現を目的とする. 2. 関連研究 本 研 究 の 関 連 研 究 と し て ,時 間 を 考 慮 し た 協 調 フ ィ ルタリングや,ユーザの嗜好の遷移に注目した協調フ ィルタリングに関する研究の概要と,本研究の位置づ けについて説明する. 古川ら[5]は,ユーザの嗜好の遷移過程に注目した 推薦システムを提案している.このシステムでは,「ユ ーザがある時間にアイテムを採用する(=閲覧する, 購入する,ブックマークする)」という基本的なデー タのみを扱い,ユーザ間のマルコフ連鎖に基づいた既 存の推薦手法を基に,アイテム間のマルコフ性を考慮

Transcript of SNS におけるユーザのトレンドに対する態度を考慮した ファッ … · DEIM...

Page 1: SNS におけるユーザのトレンドに対する態度を考慮した ファッ … · DEIM Forum 2016 F2-5 SNSにおけるユーザのトレンドに対する態度を考慮した

DEIM Forum 2016 F2-5

SNSにおけるユーザのトレンドに対する態度を考慮した ファッション情報推薦手法

内田 友梨香† 牛尼 剛聡‡

†九州大学芸術工学部 〒815-8540 福岡県福岡市南区塩原 4-9-1 ‡九州大学大学院芸術工学研究院 〒815-8540 福岡県福岡市南区塩原 4-9-1 E-mail: †[email protected], ‡[email protected]

あらまし 現在,ファッション情報は SNS やブログなどの様々なインターネットメディアから得ることができる.その一方で,莫大な情報の中から自分にとって有益な情報を見つけることが困難となったため,情報推薦が重

要となっている.ファッションにおける推薦は「トレンド」が大きく関係しており,ユーザによって「新商品はす

ぐに購入する」「巷で流行しているから購入する」等,トレンドに対する態度が異なる.しかし,従来の推薦手法の

多くでは,ユーザとアイテムとの関係のみを考慮して,その時間的な側面を考慮していないため,ファッションに

関する情報を適切に推薦できない場合がある.本研究では,ファッション投稿が活発な写真投稿型 SNS であるInstagramを利用して,ユーザの「トレンドに対する態度」を考慮した推薦手法を提案することで,より精度の高いファッション情報推薦の実現を目指す. キーワード SNS,情報推薦,ファッション,トレンド

1. はじめに 従来,ファッションに関する情報は雑誌やテレビな

どのマスメディアから得ることが一般的であった.し

かし,近年,Instagram[1]に代表される SNS,Ameba[2]

に代表されるブログ,WEAR[3]に代表される Web サービ

スなどのインターネットメディアからファッション情

報を得る人々が増加している.しかし,ユーザは莫大

な情報の中からユーザは自分にとって有益な情報を見

つけることが困難となったため,情報推薦が重要とな

っている.情報推薦に関する研究では,ユーザに対し

てより精度の高い推薦を行うことが大きな目標の 1 つ

であり,これまでにも様々な提案が行われてきた.

従来の代表的な推薦手法として,協調フィルタリン

グが挙げられる[4].協調フィルタリングには,様々な

手法が存在するが,基本的には,既に明らかになって

いるユーザとアイテムの関係性に基づいて,ユーザと

未知のアイテムとの関係性を推定するアプローチに基

づいている.例えば,「ユーザ」と「アイテム」の間に

「購入」という関係性に注目した場合,推薦対象とす

るユーザと購入履歴に類似性が高いユーザを発見し,

多くの購入履歴の類似性が高いユーザが購入している

アイテムを推薦するというものである.

一般的に,従来の推薦手法の多くでは,ユーザとア

イテムとの関係が有する時間的な側面は考慮していな

い.例えば,ユーザの購入履歴に基づいて推薦を行う

場合には,ユーザの購入した日時は考慮されない.し

かし,ファッションにおける推薦を行う場合には,ユ

ーザとアイテムとの時間的な側面が重要な意味を持つ

場合がある.何故なら,ファッションにおける情報や

ユーザの嗜好には「トレンド」が強く関係するからで

ある.すなわち,「新商品はすぐに購入する」,「巷で流

行しているから購入する」などユーザによってトレン

ドに対する態度が異なり,それらはアイテムを推薦す

る際に重要な特性と考えられる.従来の推薦手法では

ファッション情報に大きな影響を与える「トレンド」

に対するユーザの態度を考慮していないため,トレン

ドが影響を与える情報を適切に推薦できない場合があ

る.

上記の問題を解決するために,本研究では,ファッ

ションに関する投稿が活発な写真投稿型 SNS である

Instagram を利用して,ファッションアイテムのトレ

ンド性と,ユーザがファッションアイテムに反応した

タイミング(投稿時刻)の 2 つに注目することで,ユ

ーザの「トレンドに対する態度」を考慮したファッシ

ョン情報推薦手法を提案し,より精度の高いファッシ

ョン情報推薦の実現を目的とする.

2. 関連研究 本研究の関連研究として,時間を考慮した協調フィ

ルタリングや,ユーザの嗜好の遷移に注目した協調フ

ィルタリングに関する研究の概要と,本研究の位置づ

けについて説明する.

古川ら[5]は,ユーザの嗜好の遷移過程に注目した

推薦システムを提案している.このシステムでは,「ユ

ーザがある時間にアイテムを採用する(=閲覧する,

購入する,ブックマークする)」という基本的なデー

タのみを扱い,ユーザ間のマルコフ連鎖に基づいた既

存の推薦手法を基に,アイテム間のマルコフ性を考慮

Page 2: SNS におけるユーザのトレンドに対する態度を考慮した ファッ … · DEIM Forum 2016 F2-5 SNSにおけるユーザのトレンドに対する態度を考慮した

することで,多くのデータに対応する推薦アルゴリズ

ムを実現した.

大力ら[6]は,ソーシャルブックマーク内のデータ

を用いて,「URL の大部分を,他のユーザより先に登

録するユーザ群」と定義されたイノベータに注目し,

常に変化するユーザの嗜好に即時対応できる効率的な

推薦手法を提案した.イノベータを利用した手法は協

調フィルタリングを利用した推薦に比べ,利用するデ

ータが少なくて済む,計算量が少なくて済む,ユーザ・

URL の増加に対する耐久性が高いという 3 つの利点が

あるとしている.

川前ら[7]は,過去の購入行動が対象ユーザと類似

するだけではなく,先行している度合いの高いユーザ

の履歴を重視して選別し利用することで,ユーザごと

の嗜好の時系列性と,ユーザ間の行動の先行性に注目

したユーザの最新の嗜好を反映できる協調フィルタリ

ングを提案している.

上記の関連研究はファッションにおけるトレンド

を考慮していないため,適切なファッション情報推薦

が難しいと考えられる.本研究では,ファッションに

おけるトレンドとユーザがファッションアイテムに反

応したタイミングを考慮したファッション情報推薦を

実現することを目的とする.

3. アプローチ 3.1. ユーザのトレンドに対する態度による分

類と特性 エベレット[8]は,ユーザの商品購入への態度に違

いが存在することを,イノベータ理論として提案した.

イノベータ理論において,ユーザは,以下の5種類に

分類される.

1. イノベータ(革新者)

2. アーリーアダプター(初期採用者)

3. アーリーマジョリティ(前期追随者)

4. レイトマジョリティ(後期追随者)

5. ラガード(遅滞者)

イノベータは新しい商品を進んで採用するグルー

プであり,市場全体の 2.5%を占めるとされている.イ

ノベータは商品の目新しさのみを考慮して採用するた

め,イノベータが採用した段階では,その商品の価値

が世間に受け入れられているかどうかは不明である.

アーリーアダプターは社会と価値観を共有してお

り,流行には敏感で,自ら情報収集を行い判断するグ

ループであり,市場全体の 13.5%を占めるとされてい

る.アーリーアダプターは,商品の価値を理解した上

で採用し,他のグループに対して強い影響力を持つ.

アーリーマジョリティは新しい様式の採用には比

較的慎重なグループであり,市場全体の 34.0%を占め

るとされている.アーリーマジョリティは,アーリー

アダプターからの影響を強く受け,慎重ではあるが,

全体の平均からすると早めに新商品を採用する.

レイトマジョリティは新しい様式の採用には懐疑

的で,周囲の大多数が試している場面を見てから同じ

選択をするグループであり,市場全体の 34.0%である

とされている.

ラガードは世の中の動きに関心が薄く流行が一般

化するまで採用しない,もしくは,最後まで採用しな

いグループであり,市場全体の 16.0%であるとされて

いる.

エベレットは,イノベータとアーリーアダプターを

合わせた層に普及した段階(普及率 16%)を急激に市

場が拡大する分岐点とし,他のユーザへの影響力が大

きいアーリーアダプターが商品普及の鍵を握ると主張

した.

3.2 . トレンドを利用した推薦のアプローチ エベレット[8]は,ユーザの新商品を採用する時期

の違いによって,新商品に対する考え方やライフスタ

イルに差があり,異なる行動の特徴が表れることを示

している.この事から,それぞれのグループに属する

ユーザによって,インターネット上での行動特性も異

なる可能性があると考えられる.

例えば,ユーザ A とユーザ B が,あるアイテム X に

対して反応(検索,投稿,購入などの何らかのポジテ

ィブな行為)をした場合を考える.従来の協調フィル

タリングであれば,「ユーザ A とユーザ B は類似して

いる」と判断され,それに伴った推薦が行われると考

えられる.しかし,ユーザ A が「新商品に特に興味を

持つユーザ」であり,新商品に特に興味を持っている

ので,アイテム X は発売後すぐに購入していたとする.

一方,ユーザ B が「周囲の大多数が利用しているのを

確認してから同じ選択をするユーザ」であり,アイテ

ム X は巷で流行しており,自分の周囲の人も採用して

いるので購入していたとする.このような場合には,

ユーザ A とユーザ B は類似しているとは言い難い(図

1) .

Page 3: SNS におけるユーザのトレンドに対する態度を考慮した ファッ … · DEIM Forum 2016 F2-5 SNSにおけるユーザのトレンドに対する態度を考慮した

我々は上記のように,トレンドに対するユーザの特

性を,「トレンドに対する態度」と呼ぶ.そして,本

研究では,ユーザがアイテムに反応したタイミングに

注目し,「同じアイテムに対して,類似したタイミン

グで反応したユーザ同士はトレンドに対する態度が類

似している」という仮説を立てる.つまり,本研究で

は,「同じアイテムを採用している」だけではなく,

「類似したタイミングで反応した」ことを考慮するこ

とで,ユーザのトレンドに対する態度を考慮した推薦

を行い,より精度の高い推薦の実現を目的とする.

3.3. SNS におけるファッションに関するユー

ザの振る舞い 本研究で開発する,ユーザのトレンドに対する態度

を考慮した協調フィルタリングによる推薦手法におい

て,ユーザの行動特性を抽出する場として,ファッシ

ョンに関する投稿が活発である写真投稿型 SNS の 1 つ

である Instagram を利用する.Instagram の利用者は

世界で 4 億人,日本では 810 万人にのぼり,毎日 8,000

万枚以上の写真が投稿されている.Instagram の使い

方は多岐にわたっており,雰囲気のある芸術的な写真

を投稿するユーザもいれば,ハッシュタグを利用して

日記のような使い方をするユーザもいる.気軽に世界

のあらゆる瞬間をユーザごとに異なる様々な世界観に

よって捉え,表現し,共有するクリエイティブな SNS

の 1 つである.

本研究で,Instagram を対象とするのには2つの大

きな理由がある.1 つ目の理由は,Instagram では,フ

ァッションの投稿が活発であることである.Instagram

では,気軽に写真を投稿できることから,著名なファ

ッションモデルから一般ユーザまで多くのユーザがフ

ァッションに関する投稿をしており,「#fashion」と

いうハッシュタグの付いた投稿は 2 億 5,000 万件を超

えている.2 つ目の理由は,Instagram が自分のファッ

ションの記録として利用されていることである.

Instagram では,その日のファッションコーディネー

トを日記のように投稿する際に付けるハッシュタグと

して「#ootd(Outfit Of The Day)」,「#今日のコ

ーデ」というものがある.それらのタグが付与された

投稿は,「#ootd」については 6,000 万件,「#今日の

コーデ」については 38 万件にも及ぶ.これらの投稿に

は,「#トレンチコート」などの着用しているファッシ

ョンアイテムのハッシュタグや,「#ユニクロ」などの

着用しているファッションブランドのハッシュタグ,

「#足元倶楽部」などのグループを表すハッシュタグな

ど,様々なハッシュタグが付いている.

3.4. ファッションアイテムのトレンド性とユ

ーザの関係性についての分析 本節では,本研究において考慮すべき 2 つのポイン

トのうちの 1 つであるファッションアイテムのトレン

ド性とユーザの関係性について Instagram を利用して

分析した.

ファッションアイテムのトレンド性は,対象とする

ファッションアイテムがある時点において,どれほど

流行しているかを表す.

2015 年においてトレンド性が高いと考えられる「ガ

ウチョパンツ」を例として,Instagram を利用して,

イノベータもしくはアーリーアダプターと考えられる

ユーザと,アーリーマジョリティもしくはレイトマジ

ョリティだと考えられるユーザを 1 人ずつ見つけた.

それぞれをユーザ A,ユーザ B とする.ユーザ A,ユーザ

B は,Instagram においてそれぞれ,2014 年 6 月,2014

年 5 月からファッションに関する投稿を行っている.

利用したハッシュタグ数(重複あり)は,それぞれ 395

件,372 件であった.

図 2 に Instagram における「#ガウチョパンツ」の

投稿数の遷移とユーザ A,ユーザ B の「#ガウチョパン

ツ」の投稿時期を表したグラフを示す.横軸は投稿月,

縦軸は投稿数を投稿月の全投稿数で正規化したもの,

丸がそれぞれのユーザの投稿時期を表している.図 2

の波の盛り上がりをトレンド波とした場合,ユーザ A

は,トレンド波の始まり周辺である 2014年 10月から,

トレンド波のピークとなる 2015 年 5 月まで「#ガウチ

ョパンツ」をタグとして投稿していることから,「ガ

ウチョパンツ」に対しては,イノベータもしくはアー

リーアダプターであると言える.方,ユーザ B は「ガ

ウチョパンツ」に関してはアーリーマジョリティもし

くはレイトマジョリティであると考えられる.

図 1 ユーザによる商品に対する反応の違い

Page 4: SNS におけるユーザのトレンドに対する態度を考慮した ファッ … · DEIM Forum 2016 F2-5 SNSにおけるユーザのトレンドに対する態度を考慮した

別のファッションアイテム「つば広ハット」につい

ても同様に検討する.図 3 に Instagram における「#

つば広ハット」の投稿数の遷移とユーザ A,ユーザ B

の「#つば広ハット」の投稿時期を表したグラフを示す.

図 3 から,「#つば広ハット」には,大きく二つのトレ

ンド波があることが分かる.二つ目のトレンド波につ

いてのみ考慮すると,「#ガウチョパンツ」同様に「#

つば広ハット」においても,ユーザ A は比較的イノベ

ータもしくはアーリーアダプターの傾向があり,ユー

ザ B はアーリーマジョリティもしくはレイトマジョリ

ティの傾向があると言えるだろう.

以上のことから,SNS も,ファッションアイテムの

トレンド性や,ユーザのトレンドに対する態度はユー

ザによって傾向が存在する可能性がある

4. 提案手法 本研究では,従来の協調フィルタリングに,ユーザ

がアイテムに反応したタイミングと,ファッションの

トレンド性を加えて考慮した手法を 3 段階に分けて提案する.

4.1. ユーザの利用ハッシュタグを用いた協調フィルタリング

本説では,ユーザの利用ハッシュタグを用いた協調

フィルタリングについて述べる.これにより,SNS に

おけるファッション情報推薦を実現する.ここでは,

Instagram に投稿された記事を「メディア」と表現し,

ハッシュタグ𝑔が付与されたメディアを投稿することを「𝑔のハッシュタグを利用する」と表現する.つまり,「ユーザがファッションアイテム𝑔に反応する」とは,「ユーザが Instagram において,ハッシュタグ 𝑡を利用する」ということである.

本手法では,ファッションアイテムに対するユーザ

の興味を,ユーザが利用したハッシュタグに基づいて

推定する.以下の 2 つの手順を行う.

① ユーザが利用したハッシュタグに基づいて,シス

テム利用者と他のユーザ間の類似度を求める

② ①の類似度に基づいて,ハッシュタグの推薦評価

値を求める

まずは,ユーザが利用したハッシュタグに基づいて,

システム利用者と他のユーザ間の類似度を求める.本

手法では,類似度を求める方法として,コサイン距離

を利用する.

いま,ユーザ𝑎, 𝑏が利用したハッシュタグ(重複なし)を𝑀!!,𝑀!!としたとき,ユーザ𝑎, 𝑏の類似度 𝑠𝑖𝑚!(𝑎, 𝑏)を以下の式(1)で定義する.

𝑠𝑖𝑚!(𝑎, 𝑏) =𝑀!! ∩𝑀!

!

𝑀!!! 𝑀!

!!⋯ 1

また,ユーザ𝑢のハッシュタグ𝑔に対する評価値の予

測値pred! 𝑢,𝑔 を以下の式(2)によって推定する.

pred!(𝑢,𝑔) = pref 𝑖,𝑔 ∙ sim! 𝑢, 𝑖!

⋯ 2

ここで,pref(𝑖,𝑔)は,ユーザ 𝑖のハッシュタグ𝑔に対す

る評価値を表す.本研究では,ユーザ 𝑖のハッシュタグ𝑔に対する評価値 pref(𝑖,𝑔)としてユーザ 𝑖がハッシュタグ𝑔の利用頻度を利用する. 以上の手順で,ユーザが未使用のファッションアイ

テムのハッシュタグに対する評価を推定し,評価値が

図 2 「 #ガウチョパンツ」の投稿数の遷移とユーザ A,ユーザ B の投稿時期

図 3 「 #つば広ハット」の投稿数の遷移とユーザ A,ユーザ B の投稿時期

Page 5: SNS におけるユーザのトレンドに対する態度を考慮した ファッ … · DEIM Forum 2016 F2-5 SNSにおけるユーザのトレンドに対する態度を考慮した

高いと推定されたファッションアイテムのハッシュタ

グを推薦する.

4.2. 同じハッシュタグを利用したユーザの時間的距離を考慮した協調フィルタリング

本説では,同じハッシュタグを利用したユーザの時

間的距離を考慮した協調フィルタリングについて述べ

る.これにより,SNS におけるユーザがファッション

アイテムに反応したタイミングを考慮したファッショ

ン情報推薦を実現する.以下の 3 つの手順を行う.

① 同じハッシュタグを利用したユーザ同士の時間

的距離を求める

② ①の値を考慮した上でユーザ間の類似度を求め

③ ②の類似度に基づいて,未使用のハッシュタグの

評価値を推定する

まず,同じハッシュタグを利用したユーザ同士の時

間的距離を求める.同じハッシュタグを利用したユー

ザ同士の時間的距離とは,ユーザ𝑎ユーザ𝑏が同じハッシュタグを利用した場合における,それぞれのハッシ

ュタグの投稿時刻の平均の差である.投稿時刻は UNIX

時間を利用する.

あるハッシュタグ𝑔に関するユーザ𝑎, 𝑏の時間的距離 𝑡𝑠𝑖𝑚(𝑎, 𝑏,𝑔)を以下の式(3)で定義する.

𝑡𝑠𝑖𝑚 𝑎, 𝑏,𝑔 = 1 −𝑎𝑣𝑔 𝑎,𝑔 − 𝑎𝑣𝑔 𝑏,𝑔365×24×60×60

⋯ 3

ここで,

𝑎𝑣𝑔 𝑢,𝑔 =𝑡𝑡∈𝑡𝑖𝑚𝑒(𝑢,𝑔)

𝑡𝑖𝑚𝑒 𝑢,𝑔

とする.また,ここで, 𝑡𝑖𝑚𝑒 𝑢,𝑔 はユーザ𝑢がハッシュタグ𝑔を投稿した時刻の集合とする. 次に,4.1 で求めた提案手法 1 におけるユーザ間の

類似度 𝑠𝑖𝑚!(𝑎, 𝑏)と,上記のユーザ𝑎, 𝑏のあるハッシュタグ𝑔に関する時間的距離 𝑡𝑠𝑖𝑚(𝑎, 𝑏,𝑔)を用いて,ユーザ𝑎, 𝑏の類似度 𝑠𝑖𝑚!(𝑎, 𝑏,𝑔)を以下の式 (4)で定義する.

𝑠𝑖𝑚! 𝑎, 𝑏 = 𝑠𝑖𝑚!(𝑎, 𝑏)

×𝑡𝑠𝑖𝑚 𝑎, 𝑏,𝑔!∈!!

!∩!!!

𝑀!! ∩𝑀!

! ⋯ 4

また,ユーザ𝑢のハッシュタグ𝑔に対する評価値𝑝𝑟𝑒𝑑 𝑢,𝑔

を以下の式(5)によって推定する.

pred!(𝑢,𝑔) = pref(𝑖,𝑔) ∙ 𝑠𝑖𝑚!(𝑢, 𝑖)!

⋯ 5

以上の手順で,ファッションアイテムのハッシュタグ

に対する評価を推定し,評価値が高いと推定されたフ

ァッションアイテムのハッシュタグを推薦する.

4.3. ユーザの時間的距離とハッシュタグのト

レンド性を考慮した協調フィルタリング 本説では,ユーザの時間的距離とハッシュタグのト

レンド性を考慮した協調フィルタリングについて述べ

る.これにより,SNS におけるユーザがファッション

アイテムに反応したタイミングとファッションアイテ

ムのトレンド性の 2 つを考慮したファッション情報推

薦を実現する. ① ハッシュタグのトレンド性を求める

② ①の値を考慮した上でユーザ間の類似度を求め

③ ②の類似度に基づいて,未使用のハッシュタグの

評価値を推定する

ハッシュタグ 𝑡のトレンド性は,ハッシュタグ 𝑡の2013 年から 2015 年の 3 年間の月ごとの平均投稿数か

ら,毎月の実際の投稿数を引いた分散値によって求め

る.図 4,5 にそれぞれ,トレンド性の高いアイテム(ガ

ウチョパンツ),トレンド性の低いアイテム(トレンチ

コート)に関する投稿数のグラフを示す.横軸は投稿

月,縦軸は該当月のそれぞれのハッシュタグの投稿数

を全体の投稿数で割ることで正規化したものである.

図が示すように,トレンド性の低いアイテムは,平

均投稿数と実際の投稿数のグラフがほとんど一致して

おり,分散値は小さくなる.その一方で,トレンド性

の高いアイテムは,平均投稿数と実際の投稿数との差

が大きく,分散値は大きくなる.

トレンド性を考慮したユーザ𝑢のハッシュタグ𝑔に対する評

価値𝑝𝑟𝑒𝑑! 𝑢,𝑔 を以下の式(3)によって推定する.

pred! 𝑢,𝑔 = pref 𝑖,𝑔 ∙ 𝑠𝑖𝑚! 𝑢, 𝑖!

∙ 𝜎(𝑔)⋯ 6

ここで,𝜎(𝑔)はタグ𝑔の投稿の各月ごとの標準偏差の平

均であり,タグのトレンド性を表す.トレンド性が高いほど大き

な値になる.

Page 6: SNS におけるユーザのトレンドに対する態度を考慮した ファッ … · DEIM Forum 2016 F2-5 SNSにおけるユーザのトレンドに対する態度を考慮した

図 4 トレンド性の高いアイテムの投稿数

図 5 トレンド性の低いアイテムの投稿数

5. 実験 提案手法の有効性を評価するために被験者実験を

行った.

5.1. 実験に使用するデータ Instagram 社が提供している InstagramAPI[9]を利

用して,Instagram 内の投稿データを取得する.本シ

ステムでは,データとして「#今日のコーデ」というハ

ッシュタグが付いた投稿のみを扱う.「#今日のコーデ」

というハッシュタグに限定した理由としては 2 点ある.

まず,主に日本で利用されているハッシュタグである

ことである.本研究では,日本におけるファッション

に注目しているため,日本で一般的に利用されている

ハッシュタグを利用する.次に,日記のように利用さ

れている点である.本研究では,ユーザがファッショ

ンアイテムに反応したタイミングに注目しており,フ

ァッション全般に関するハッシュタグである「#ファッ

ション」では,「あるファッションアイテムに興味が

あるだけなのか」,もしくは「あるファッションアイ

テムを所持しており,着用したのか」などの判断を行

うのが困難であると考えたためである.以上の 2 点か

ら,本研究で扱うデータは「#今日のコーデ」というハ

ッシュタグが付いた投稿に限定することにした.

対象としたデータは,Instagram 上で 2011 年 8 月か

ら 2015 年 12 月にかけて投稿された「#今日のコーデ」

というハッシュタグが付随した投稿約 25 万件のデー

タである.データは,ユーザ ID,投稿 ID,メディア,

投稿時刻から構成される.

ユーザが利用したファッションアイテムに関するハ

ッシュタグと,その投稿時刻のデータを利用するため,

取得した投稿データに対してデータのクレンジングを

行う必要がある.データのクレンジングの処理は大き

く 3 段階に分ける事ができる.

① メディア本文から,メディアに付随している

ハッシュタグのみの抽出

② ファッションアイテムに無関係なハッシュタ

グ(不要なハッシュタグ)の排除

③ ハッシュタグの利用数(重複あり)が少ない

ユーザの排除

まず,メディア本文から,メディアに付随しているハ

ッシュタグのみを抽出する.本研究では,ユーザが利

用したファッションアイテムに関するハッシュタグと,

その投稿時刻のデータを利用するため,メディア本文

すべての情報を保存する必要はない.

次に,不要なハッシュタグを排除した.不要なハッ

シュタグとは,ファッションに無関係のハッシュタグ,

文章のハッシュタグ,他言語によるハッシュタグ,ユ

ーザに利用された回数が 5 回以下のハッシュタグ,フ

ァッションブランドのハッシュタグなどである.ファ

ッションブランドは,Wikipedia のファッションブラ

ンド一覧[10],ファッションプレスのファッションブ

ランド一覧[11]にあるファッションブランドと一致す

るものを排除した.データは,約 24 万件となり,約

22 万件あったハッシュタグの種類は,約 4,500 件とな

った.

次に,ハッシュタグの利用数(重複なし)が少ない

ユーザを排除する.ユーザの中には,ハッシュタグの

利用数(重複なし)が1のユーザもいれば,300 のユ

ーザもいる.本手法による推薦を行うにあたって,ハ

ッシュタグの利用数(重複なし)が少ないユーザは,

推薦対象ユーザとの類似度を求めることができない可

能性が大きいため,不適切であると考えた.また,ハ

0

0.005

0.01

0.015

0.02

0.025

0.03

2013

01

2013

03

2013

05

2013

07

2013

09

2013

11

2014

01

2014

03

2014

05

2014

07

2014

09

2014

11

2015

01

2015

03

2015

05

2015

07

2015

09

2015

11

トレンド性の高いアイテム (ガウチョパンツ)

月ごとの投稿数

月ごとの平均値

0 0.005

0.01 0.015

0.02 0.025

0.03 0.035

0.04 0.045

2013

01

2013

03

2013

05

2013

07

2013

09

2013

11

2014

01

2014

03

2014

05

2014

07

2014

09

2014

11

2015

01

2015

03

2015

05

2015

07

2015

09

2015

11

トレンド性の低いアイテム (トレンチコート)

月ごとの投稿数

月ごとの平均値

Page 7: SNS におけるユーザのトレンドに対する態度を考慮した ファッ … · DEIM Forum 2016 F2-5 SNSにおけるユーザのトレンドに対する態度を考慮した

ッシュタグの利用数(重複なし)が 10 以下のユーザは

10,298 人中 7,895 人も存在し,計算量が極端に多くな

ってしまうため,今回は排除することとした.

5.2. 実験手法 提案手法の有効性を確かめるために,5 分割交差検

証による推定評価値の評価実験を行った.5 分割交差

検証では,推薦対象ユーザが利用したハッシュタグを

5 つに分割し,そのうちの 1 つを正解データ,残りを

訓練データとする.訓練データを使用して上記手法の

類似度計算・推薦を行い,得られた推薦結果と正解デ

ータの適合率を求める.5 分割データのすべてが正解

データとなるように,上記の作業を 5 回行い,平均適

合率から,推薦精度を確かめる手法である[12].

比較する手法は,提案した3つの手法と,ハッシュ

タグの利用ランキングによる推薦の 4 つである.推薦

対象とするユーザは,2,404 人のユーザの中からラン

ダムに選んだ 15 人である.以下の図 6 に実験の概要図

を示す.

図 6 実験概要図

5.3. 実験結果 以下の図 7 に実験結果を示す.平均適合率はそれぞ

れ,0.189,0.196,0.213,0.109 となった.つまり,

100 個中それぞれ,約 18 個,約 19 個,約 21 個,約 10

個正解となる結果であった.それぞれの手法について

有意差があるかどうかを,t 検定で調べた結果,3つ

の提案手法の間では有意差は見られなかったが,3つ

の提案手法とランキングによる推薦手法の間には有意

差が見られた.

図 7 実験結果 5.4. 考察

上 記 の実 験 の考 察 を以 下 に示 す.3 つの提 案 手 法 の平

均 適 合 率 は,ランキングによる推 薦 手 法 の平 均 適 合 率 より

も高 くなった.また,ハッシュタグのみを利 用 した協 調 フィル

タリングよりも,ユーザ間 の時 間 的 距 離 を考 慮 した協 調 フィ

ルタリングの方 がより高 い適 合 率 を示 し,ユーザ間 の時 間 的

距 離 を考 慮 した協 調 フィルタリングよりも,ユーザ間 の時 間

的 距 離 とハッシュタグのトレンド性 のどちらも考 慮 した協 調 フ

ィルタリングの方 がより高 い適 合 率 を示 したことから,本 研 究

の目的である,SNS におけるより精度の高いファッション情報

の推薦が行えたと考えられる.

提 案 手 法 による,より精 度 の高 いファッション情 報 推 薦 を

実現するための今後の課題として,以下を挙げる.

l 適切なデータの正規化

今回,ファッションアイテムのトレンド性を求める際に利用し

たデータは,Instagram 上で 2011 年 8 月から 2015 年 12

月にかけて投稿された「#今日のコーデ」というハッシ

ュタグが付随した投稿約 25 万件のデータをクレンジ

ングしたものである.クレンジングの結果,2013 年 1

月から 2015 年 12 月までの 3 年間のデータを扱うこと

となったが,2015 年の平均投稿数が 14,267 件,2014

年の平均投稿数が 2,296 件であるのに対して,2013 年

の平均投稿数は 57 件であった.このことから,正規化

を行う際に 2013 年の投稿がトレンド性に強く影響を

与えてしまったのではないかと考えられる.以下の表

1 に本研究においてトレンド性が高いとされたアイテ

ムの上位 5 件を示す.

1 オーバーオール

2 ギンガムチェック

3 トートバッグ

4 タイトスカート

5 ショーパン

表 1 トレンド性が高かったアイテム

0

0.05

0.1

0.15

0.2

0.25

平均適合率 *

* *

* : p < 0.05

Page 8: SNS におけるユーザのトレンドに対する態度を考慮した ファッ … · DEIM Forum 2016 F2-5 SNSにおけるユーザのトレンドに対する態度を考慮した

また,図 8 にトレンド性が一番高いとされた「オー

バーオール」の投稿数の遷移(正規化済)を示す.

図 8 から,2013 年 2 月の正規化された値は 1 となっ

ており,2013 年 2 月に投稿されたハッシュタグは「オ

ーバーオール」の 1 件だけであったということが分

かる.ちなみに,ハッシュタグ𝑔のある月の投稿数をその月の全投稿数で割ることで正規化を行っている.

2013 年の投稿数があまりにも少ないため,2013 年時

点で「オーバーオール」がトレンドアイテムであっ

たかどうか判断することは難しいのではないかと考

えた.ファッションアイテムの正しいトレンド性を

測るためにも,検証を通した適切なデータの正規化

を行う必要がある.

図 8 オーバーオールの投稿数の遷移

6. まとめ 現 在 ,ファッション情 報 は SNS やオンラインショップなど

様々なインターネットメディアから得ることができる.しかし,そ

の方 で莫 大 な情 報 の中 から自 分 にとって有 益 な情 報 を見

つけることが困 難 となったため,情 報 の推 薦 が重 要 となって

いる.ファッションにおける推薦は「トレンド」が大きく関係して

おり,ユーザによって「新商品はすぐに購入する」「巷で流行

しているから購 入 する」など,トレンドに対 する態 度 が異 なる.

しかし,従 来 の推 薦 手 法 の多 くでは,ユーザとアイテムとの

関 係 のみを考 慮 して,その時 間 的 な側 面 を考 慮 していない

ため,ファッションに関 する情 報 を適 切 に推 薦 できない場 合

がある.

そこで,本 研 究 では,ファッション投 稿 が活 発 な写 真 投

稿型 SNS である Instagram を利用して,ユーザがファッショ

ンアイテムに反 応 したタイミングと,そのファッションアイテム

のトレンド性 注 目 することで,ユーザの「トレンドに対 する態

度」を考慮した推薦手法を提案した.

実 験 の結 果 ,ユーザのトレンドに対 する態 度 を考 慮 した

提 案 手 法 は,従 来 手 法 よりも高 い推 薦 結 果 を示 した.今 後

の課 題 として,適 切 なデータの正 規 化 や,ユーザ間 の時 間

的 距 離 を考 慮 した類 似 度 計 算 手 法 の妥 当 性 について,検

証実験を通して改善を行っていく.

7. 参考文献 [1] Instagram, https://www.instagram.com/ [2] Ameba, http://www.ameba.jp/ [3] WEAR, http://wear.jp/ [4] 神 嶌 敏 弘 , ”推 薦 シ ス テ ム の ア ル ゴ リ ズ ム ”,

http://www.kamishima.net/archive/recsysdoc.pdf, 2015.

[5] 古川忠延 , 松尾豊 , 内山幸樹 , 石塚満 , “嗜好の遷移過程に注目した Webアルゴリズムの提案 ”,人工知能学会全国大会論文集 (CD-ROM), 2008

[6] 大力慶祐 , 大向一輝 , 武田英明 , “ソーシャルブックマークにおけるイノベータに注目した情報推薦手法の提案 ”,人工知能学会全国大会論文集(CD-ROM), 2008.

[7] 川前徳章 , 坂野鋭 , 山田武士 , 上田修功 “ユーザの嗜好の時系列性と先行性に着目した協調フィルタリング ”,電子情報通信学会論文誌 , J92-D(6), pp. 767-776, 2009.

[8] E.M. Rogers, “The Free Press”, New York, 1995 [9] InstagramAPI, http://www.instagram.com/developer/ [10] Wikipedia「 フ ァ ッ シ ョ ン ブ ラ ン ド 一 覧 」 ,

http://ja.wikipedia.org/wiki/ファッションブランド一覧

[11] FASHION PRESS「ファッションブランド一覧」 , http://www.fashion-press.net/brands/

[12] Fushiki T, “Estimation of prediction error by using K-fold cross-validation”, statistics and computing, (to appear)

0 0.2 0.4 0.6 0.8

1 1.2

2013

01

2013

03

2013

05

2013

07

2013

09

2013

11

2014

01

2014

03

2014

05

2014

07

2014

09

2014

11

2015

01

2015

03

2015

05

2015

07

2015

09

2015

11

オーバーオール

月ごとの投稿数

月ごとの平均値