t Æ Â °*,6 :he Ü ¢ É ñ ® = b j y ü Å ½ yv s Ü ¸ 8 d = b j ... · b j Å ½ v o o q °...

20
1 (一財 )日本建設情報総合センター研究助成事業 「GIS・Web マイニングを併用した道の駅データの整 備と深層学習を利用した道の駅の経営分析」報告書 平成 30 年 11 月

Upload: others

Post on 08-May-2020

6 views

Category:

Documents


0 download

TRANSCRIPT

1

(一財 )日本建設情報総合センター研究助成事業

「GIS・Web マイニングを併用した道の駅データの整

備と深層学習を利用した道の駅の経営分析」報告書

平成 30 年 11 月

2

助成 研究者紹介

のなか ひろふみ

野中 尋史

現職:⾧岡技術科学大学情報・経営システム工学専

攻講師 博士(工学)

共同研究者紹介

くまの みのる

熊野 稔

ひらおか とおる

平岡 透

いとう たかお

伊藤 孝夫

3

目次

1.はじめに p4

2.手法 p5

3.道の駅経営への提言 p15

4.まとめと今後の展望 p18

4

1. はじめに

道の駅は「休憩,情報発信,地域連携の機能を持つ地域と共に創る個性豊かな

賑わいの場」の定義を持つ公共施設であり道路行政において地方創生の要と位

置付けられている.こうした中で売上の好調な道の駅も多く存在するが,施設

や設備の老朽化が進み,修繕維持費で経営が圧迫されている道の駅もある.そ

のため,売上の促進と車利用者や地域住民へのサービスの向上による相乗効果

を図ることが求められている.道の駅に関しては数多くの研究が行われている

が大別すると個別の事例調査に関するもの[1],[2]や複数施設を対象としたヒ

アリング調査を行ったもの[3]であり,最新のデータ解析技術を利用して大規

模なデータ解析を行った研究はこれまでなかった.そこで本研究では,道の駅

が地方創生の拠点として持続可能な経営を実現するために,道の駅の大規模デ

ータ解析を行い経営に資する提言をまとめることを目的とする.このことは,

道の駅全体の経営状況改善や整備指針の策定など道の駅のさらなる発展につ

ながり,ひいては地方創生にも大きく寄与すると考える.

道の駅の現状の分析および課題に対する実現可能性や効果の評価を行うた

めには,道の駅に関するデータを整備して,これらのデータを処理・分析する

必要がある.道の駅そのものに関するデータに加えて,道の駅が地域振興に寄

与していることから,道の駅周辺の地理情報のデータも活用した方が望ましい.

5

また,WEB上での口コミ・広報戦略の分析のためにSNSやWEBページからの情報

抽出も有用であると考える.近年ではさまざまなビッグデータの処理・分析が

開発されており,特に特徴抽出の観点でディープラーニング(深層学習)が注

目されている.本研究では,道の駅の現状の分析および課題の評価を行うため

に,地理情報も含む道の駅基本データ整備, WEBマイニング,深層学習,統計

的因果探索の手法を組み合わせて分析を行った.WEB上での口コミは利用者も

多く情報収集も容易なtwitterを利用した.さらに,結果と現地調査を合わせ

て道の駅経営への提言をまとめた.以下,2章で手法を詳しく説明し,3章で分

析結果の考察とそれを踏まえた道の駅経営への提言を行い,4章で研究の将来

展望も含めたまとめを行う.

2. 手 法

本 研 究 で は , 「 地 理 情 報 を 含 む 道 の 駅 基 本 デ ー タ 整 備 」 , 「 SNSに お け る 道

の 駅 情 報 の エ ン ト ロ ピ ー ス コ ア /サ ポ ー ト ベ ク ト ル マ シ ン (SVM)を 利 用 し た ト

ピ ッ ク 分 類 」に よ り デ ー タ を 整 備 し ,整 備 し た デ ー タ に つ い て「 道 の 駅 基 本 情

報 , SNS情 報 に 基 づ く 深 層 学 習 モ デ ル 階 層 的 自 己 符 号 化 器 に よ る 分 析 」 で 売 り

上 げ の 予 測 モ デ ル の 開 発 を 行 い ,「 道 の 駅 デ ー タ を 用 い た 統 計 的 因 果 探 索 モ デ

ル Lingamに よ る 売 り 上 げ に 関 連 し た 要 因 分 析 」に よ り 売 り 上 げ に 影 響 す る 要 因

6

分 析 を 行 っ た .「 地 理 情 報 を 含 む 道 の 駅 基 本 デ ー タ 整 備 」に つ い て は ,地 理 情

報 を 含 ま な い 部 分 に つ い て は ,九 州 地 区 の 道 の 駅 を 対 象 と し て ,売 り 上 げ ,設

備 情 報 な ど を 九 州 道 の 駅 連 絡 協 議 会 の メ ン バ ー で あ る 熊 野 を 中 心 に 整 備 し た .

道 の 駅 の 経 度・緯 度 や 周 辺 の 土 地 利 用 区 分 を 用 い た 地 理 情 報 に 関 し て は 平 岡 が

整 備 し た .な お ,深 層 学 習 ,統 計 的 因 果 探 索 モ デ ル と も に 計 算 負 荷 が 大 き い た

め ,有 効 な 説 明 変 数 の 特 定 な ど を 行 う た め 線 形 相 関 分 析 も 行 っ て い る .デ ー タ

整 備 と 線 形 相 関 の 結 果 に つ い て は ,査 読 付 き 論 文 [4],[5]と し て 発 表 し て い る .

2.1.SNSに お け る 道 の 駅 情 報 の エ ン ト ロ ピ ー ス コ ア /サ ポ ー ト ベ ク ト ル マ シ ン

(SVM)を 利 用 し た ト ピ ッ ク 分 類

道の駅の経営分析において,WEB 上での口コミ・広報戦略の分析のために SNS や WEB

ページから情報抽出し,分析を行うことは重要である.そこで,本申請研究では,エント

ロピーと SVM を利用した情報抽出手法の開発も行った.具体的には,単語分割,エント

ロピーベースのキーワード抽出,SVM を利用した手法である.以下,詳細について述べ

る.

2.1.1.単語分割とデータ収集

7

日本語はスペース等の区切り文字で単語間を分割しない言語である.このため,単語分

割については形態素解析と呼ばれる形態素 (意味の最小単位を示す.単語は一つ,または,

複数の形態素から構成されるため,形態素解析が単語分割の基礎となる)を特定する手法が

必要となる.本研究では,形態素解析ライブラリ Mecab を利用して行った.複合名詞等の

形態素が複数になる単語については,形態素が名詞である場合で連接して出現する場合に

結合処理を行うなどの対応を行った.本研究での対象データとして twitter を利用した.

twitter は普及率も高く,口コミ分析に適した媒体であり,API を利用すると収集も容易で

ある.本研究では,twitter API を利用して各道の駅に関するツイートを収集した.収集は,

共同研究者で九州道の駅連絡協議会のメンバーでもある熊野が整備した道の駅リストに基

づき,検索を行うことで道の駅ごとのツイートを 111,142 件収集した.

2.1.2 ツイート内容に応じた分類のためのエントロピーをベースとするキーワード抽出

道の駅に関するツイート内容を詳細に分析するためには,意味的な分類を行う必要がある.

そこで,分類定義を行ったうえで,分類毎のキーワード抽出を行い,キーワードに基づき,

機械学習手法 SVM を利用して自動的にツイートの分類を行う手法の開発を行う.分類 (カ

テゴリ)については,以下の表のような定義を行った.

表 1.カテゴリとその内容

8

カテゴリID 内容

カテゴリ1 商品・サービスに関するつぶやき

カテゴリ2 イベント

カテゴリ3 公式アカウントのツイート

カテゴリ4 交通情報

カテゴリ5 訪れた人数(swarm)

カテゴリ6 Positiveな感想

カテゴリ7 バイク・ツーリング

カテゴリ8 その他

各カテゴリに関するツイートの例は以下の表のとおりである.

表 2.各カテゴリとその例

9

上記で定義したカテゴリの自動分類のために必要となるキーワード抽出に以下,詳細に述

べる.分類毎の意味を代表するキーワードは,当該カテゴリではそのカテゴリに属するツイ

ートに偏りなく出現し,それ以外のカテゴリではほとんど出現しない特徴を持つ.このよう

な統計的性質を表現するため,本研究では,Shanon のエントロピー (以下,エントロピー

と略す)を利用した.分類 A であることを Positive,A でないことを Negative とする.ま

た,文書 (本研究ではツイート)j が positive に属し,k が Negative に属するとする.この

とき,ある語 i に関して,PijP (i が j に出現する確率) and PijN (i が k に出現する確率).は以

下の式(1)や式(2)のように表現される.

=∑

(1)

=∑

(2)

上記よりエントロピーは Positive 集合中において(3),Negative 集合中において(4)と表現

される..

10

= −∑ (3)

= −∑ (4)

エントロピーは出現確率が均等の場合 (まんべんなく出現),最大値を取り,一部のみに出

現する場合は 0 に近い値となる.このため,(3)式が(4)式より十分大きい場合,Positive 集

合に偏りなく出現し,Negative 集合にほとんど出現しない語 i が判別できる.このような語

は Positive 集合(本研究ではある分類)のキーワードとなる.概念図を下記図に示す.本研究

においては,以下の(5)式でαを 2 としたときの条件を満たす語をキーワードとして抽出し

た.

(5)

11

図 1,エントロピーの概念.上のグラフはエントロピーが小さく出現が偏っている.下の

グラフはエントロピーが大きくなり偏りなく出現する

2.3 SVM を利用した自動分類

本研究では,上記で抽出したキーワードから作られる入力ベクトル(ベクトルの要素は

キーワードの出現数)に基づき,二値分類に適したSVMを利用した自動分類器を構築した.

カーネルは線形カーネルを用いている.評価は F スコアで評価を行った.各分類の評価結

果は以下のとおりである.結果より概ね,実用に足りることを示している.2.2 と 2.3 につ

いては,査読付き論文[6], 査読付き国際会議論文[7],[8]として発表を行った.

表 3. カテゴリー分類の結果

2.3.道 の 駅 基 本 情 報 , SNS情 報 に 基 づ く 深 層 学 習 モ デ ル 階 層 的 自 己 符 号 化 器 に

よ る 分 析

カテゴリーID カテゴリーの内容 F値

カテゴリー1 商品・サービス 0.85

カテゴリー2 イベント 0.81

カテゴリー4 交通情報 0.88

カテゴリー5 訪れた人数(swarm) 0.78

カテゴリー6 positiveな感想 0.79

カテゴリー7 バイク・ツーリング 0.87

カテゴリー8 その他 0.78

12

前 項 ま で で ,地 理 デ ー タ や Webデ ー タ を 含 め て 道 の 駅 の 分 析 に 利 用 で き る デ ー

タ を 整 備 が 完 了 し た .本 項 で は ,深 層 学 習 を 利 用 し た 売 り 上 げ 予 測 モ デ ル と モ

デ ル の 内 部 式 を 利 用 し た 売 り 上 げ に 寄 与 す る 項 目 の 抽 出 を 行 う . 本 研 究 で は ,

図 2. 自 己 符 号 化 器 の 概 念 図

深 層 学 習 の モ デ ル と し て 積 層 自 己 符 号 化 器 (Stacked Auto-Encoder)を 利 用 し

た .積 層 自 己 符 号 化 器 は ,自 己 符 号 化 器 を 積 層 に し た も の で あ る .ま ず ,基 礎

と な る 自 己 符 号 化 器 に つ い て 説 明 す る .

上 記 図 は ,自 己 符 号 化 器 の 概 要 で あ る .図 に あ る よ う に 入 力 層 ,隠 れ 層 ,出 力

13

層 か ら な る 3層 の ニ ュ ー ラ ル ネ ッ ト ワ ー ク に お い て 入 力 と 出 力 を 同 じ に し た も

の が 自 己 符 号 化 器 で あ る .こ の よ う に す る こ と で 入 力 の 特 徴 が 隠 れ 層 に 集 約 さ

れ る .積 層 自 己 符 号 化 器 は 上 記 で も 既 述 し た よ う に 自 己 符 号 化 器 を 積 層 化 し た

も の で ,階 層 的 に 特 徴 が 集 約 さ れ る .本 来 の 目 的 関 数 を 用 い た 学 習 の 前 段 階 で

の 事 前 学 習 と し て 幅 広 く 利 用 さ れ て い る .本 研 究 で は ,道 の 駅 の 各 種 情 報 や 前

項 で 抽 出 し た Web情 報 を 道 の 駅 ご と に ベ ク ト ル と し て 表 現 し ,ま ず 積 層 自 己 符

号 化 器 に よ る 特 徴 抽 出 を 行 っ た と , 売 り 上 げ を 目 的 関 数 と す る 学 習 を 行 っ た .

隠 れ 層 は 7層 と し た . な お , こ の 際 , 深 層 学 習 に お け る テ ク ニ ッ ク と し て ResN

etと Batch Normarizationを 用 い た . ResNetは あ る 層 に お い て 出 力 と 入 力 の 差

に 相 当 す る 残 差 を 目 的 関 数 に 設 定 し た も の で ,直 接 的 に 出 力 を 学 習 す る よ り も

勾 配 消 失 な ど の 問 題 が 生 じ な い た め ,特 に 多 層 に な る ほ ど 性 能 が 向 上 す る こ と

が 報 告 さ れ て い る . ま た , Batch Normarizationは バ ッ チ デ ー タ に つ い て 正 規

化 を 行 う こ と で 性 能 を 向 上 さ せ る も の で あ る . 今 回 は , 中 間 層 に 対 し て ResNe

t化 を 行 い , ま た , 同 様 に Batch Normarizationも 施 し た . 上 記 で 収 集 し た Twe

etの 各 カ テ ゴ リ , GISデ ー タ も 含 め た 道 の 駅 デ ー タ に 関 し て 入 力 と し て モ デ ル

の 学 習 ・ 評 価 を 行 っ た .評 価 は 道 の 駅 の 売 り 上 げ 順 位( 相 対 的 順 位 )に 関 す る

ス ピ ア マ ン の 順 位 相 関 を 利 用 し て 評 価 し た .評 価 の 結 果 , 相 関 係 数 は 0.57と な

り 概 ね 相 対 的 な 売 り 上 げ 予 測 を 行 え る こ と を 示 し た .

14

2.4. 道 の 駅 デ ー タ を 用 い た 統 計 的 因 果 探 索 モ デ ル Lingamに よ る 売 り 上 げ に 関

連 し た 要 因 分 析

売り上げ予測も重要なタスクであるが,売り上げの要因を探ることも極めて重要となる.

深層学習を中心とする機械学習モデルは入力 ・出力の関係性に着目し,予測 ・識別するモデ

ルであり,要因分析に関しては別途の統計モデルが必要となる. 本研究では,変数間の因

果を分析するモデルである Lingam を利用して道の駅情報から売り上げに寄与する要因の

自動探索を行った.

Lingam は以下の(6)で表現されるように xi に寄与する xj に線形相関の関係を仮定し,xi

に因果を与える xj はその係数が 0 ではないとしたモデルをベースにしている.

= ∑ +( ) ( ) (6)

行列表現は以下のとおりである.

= + (7)

行列 B を求めることができれば因果関係をもつ変数の組み合わせが分かる.Lingam で

は以下のようにして B を求める.まず式を以下のように変形する.

= ( − ) (8)

そのうえで以下のように入力ベクトル x を独立成分分析し,そのマトリックス A を行列分

解して B を求める.AICA は独立成分分解行列,s はベクトルである.

15

= (9)

道の駅のデータ(Web データおよび)について LiNGAM での分析を行った.結果は以下

の表の通りである.

表4.カテゴリごとの LiNGAM による結果

結果より,交通情報やバイク・ツーリングが負の因果を与え,それ以外は正の因果を与え

ることが分かった.負の因果は現員 A が増加するほど結果 B が減少することを示す.この

ため,バイク・ツーリング客が増えても売り上げが増えることにはならずむしろ減ること

が分かった.売り上げが伸び悩む道の駅にとってバイク・ツーリング客を取り込んでいく

ことが求められている.また,交通情報は交通止めなどの規制情報が主であり,規制が多

い過疎地は売り上げが減る方向にあることを示している.なお,本項についての成果は,

査読付き国際会議[8]で発表済みである

3.道の駅経営への提言

16

これまでのデータ解析の結果と現地調査・ヒアリングの結果から以下を道の駅経営に資

する提言とする.

(1) ソフトクリームや定食に特色をもたせること

これまでの結果から,LiNGAM による分析やエントロピーによる特徴語,さらには,積層

自己符号化器の重みなどから,商品・サービスが売り上げに影響を与えることは間違いな

く,中でもソフトクリームや定食等に特色をもたせることが重要であることが分かった.

売り上げの多い,道の駅うきは,道の駅めろんどーむはそれぞれ巨峰ソフトクリームやメ

ロンソフトクリーム等の名物ソフトクリームを販売している.また,道の駅川場田園プラ

ザをはじめ,特色ある定食サービスを展開している道の駅は売り上げも多い.このような

食事は味に対する満足だけでなくインスタ映えもする.これは,口コミ効果が高まること

も意味する.さらに,買い物への波及効果も期待できる.一方で,道の駅基礎データを確

認すると,そもそも喫茶・軽食コーナーが設置されていない道の駅も複数存在する.この

ため,売り上げを向上させるためには喫茶・軽食コーナーを活用し,特色ある食事サービ

スを展開していくことが重要である.

(2) バイク・ツーリング客の取り込み

17

Tweet カテゴリ分類と LiNGAM の分析によりバイク・ツーリング客の取り込みが売り上

げが伸び悩む道の駅にとって重要であることが分かった.過疎地の売り上げの低い道の駅

ほど景観がよいため休憩・集合場所として選択されていることも道の駅基礎データや

tweet から伺えたものの,ほとんど消費しないことを示唆している.バイク・ツーリング

客にとって魅力あるサービスがないことが原因と考えれる.バイク・ツーリング客はファ

ミリー層などと異なり,二輪車の運転のため買い物することが難しいため,新たなサービ

スの展開が必要と考える.これらの結果を補完するため google フォーム上で行ったバイク

ライダー向けアンケート調査も行った.九州地区のバイクライダー団体に所属するメンバ

ーに電子メール,SNS を通じて依頼し,回答結果を収集したもので,有効回答数は 1062

件である.結果は以下の URL にまとめている.

https://docs.google.com/forms/d/1VgcuHePNZrmKalLBGYlMft_arFRsMHNqe4buIYZ60/edit?usp

=sharing

「道の駅に立ち寄った際に買い物をしますか?」という設問では飲食物を対象に行うとの

回答が 62.6%あった.「道の駅の魅力は?」という設問では駐車場が完備されている点が

62.6%と多かったものの次点で綺麗な風景や愛車等を写真撮影できるという回答も 26.1%

あった.これらの結果も踏まえると,飲食や写真撮影などの訪問記念に関するニーズがあ

ることが分かる.このことから我々の研究グループでは,ワンコイン記念ステッカー(ド

リンク付き)のサービスが有効ではないかと考えている.これは,飲食サービスに加え

18

て,ステッカーが写真撮影も可能で記念にもなるためである.「道の駅でライダー専用の

限定ステッカーが飲み物とセットでワンコインで販売されていたら購入したしたいと思い

ますか?」という Google docs を用いたアンケートの設問でも 75.7%が購入したいと回答

している.今後は道の駅連絡協議会と連携した検討を行っていきたいと考える.

4.まとめと今後の展望

本研究では,地理情報・Web 情報も含めた道の駅データの整備とそれに基づく,深層学

習による予測モデルと統計的因果探索モデルによる売上要因分析を行った.その結果,ソ

フトクリームや定食などの特色ある食事サービスの展開やバイク・ツーリング客の取り込

みが課題であることが分かった.本研究では課題も残っている.まず,開発したモデルに

対して計算環境等の問題から全項目を取り込んだ分析になっていない点がある.統計的因

果探索モデルは計算負荷が大きいモデルのため,アルゴリズム面の改良などを検討してい

く.また,道の駅のハード面や売り上げに関する時系列データの整備も重要である.今回

は静的な分析にとどまっているため動的な分析を行うことも求められている.ただし,こ

のような技術的な課題は存在するものの現地調査等による補完により分析の正当性は担保

されていると考えているため,今回まとめた提言を実際の道の駅の経営に役立てていきた

いと思っている.

19

参考文献

[1] 飯塚他,季節別にみた道の駅直売所利用者の購買行動 : 「道の駅かもがわ円城」を事例として農業経

済研究. 別冊, 日本農業経済学会論文集 1999, pp.181-184, 1999.

[2] 笠井他,道の駅の立地変化と農産物出荷者の特徴 : 宇都宮市ろまんちっく村の事例,埼玉大学教育学

部地理学研究報告, Vol.34, pp.1-17, 2014.

[3] 高橋他,道の駅のアンテナショップによる地域活性化支援のための一提案,第 78 回情報処理学会全国大会

講演論文集,pp.961-962,2016.

[4] 平岡透,野中尋史,熊野稔,伊藤孝夫,九州地方における道の駅の集客数と土地利用の相関分析, 写真測

量とリモートセンシング,Vol.57,No.1,pp.29-33, 2018.

[5] Minoru Kumano, Tsutomu Ito, Takao Ito, Toru Hiraoka, Hirofumi Nonaka,, Masahara Hirota, Discovering

Successful Determinants of Efficiency of MICHINOEKI in Chugoku Area Proc of ICAROB2018International

Conference on Artificial Life and Robotics), pp352 – 354, 2018.

[6] Elisa Claire Aleman Carreon, Hirofumi Nonaka, Toru Hiraoka, Emotional Contribution Analysis of Online

Reviews, Proc. of The 2018 International Conference on Artificial Life and Robotics, 2018.査読有り

20

[7] Elisa Claire Aleman Carreon, Hirofumi Nonaka, Toru Hiraoka, Relation Analysis between Hotel Review Rating

Scores and Sentiment Analysis of Reviews by Chinese Tourists Visiting Japan, Journal of the Institute of

Industrial Applications Engineers, 2018 (採録決定).

[8] Elisa Claire Aleman Carreon, Hirofumi Nonaka, Tetsuro Ito, Toru Hiraoka, Masaharu Hirota, Minoru Kumano,

Causal relationship between eWOM topics and profit of rural tourism at Japanese Roadside Stations

"MICHINOEKI", Proc. of 2018 ACM International Conference on Management of Digital EcoSystems(MEDES),

2018.査読有り