「レコメンドエンジン」について、石川鉄男氏に聞く

「レコメンドエンジン」とは

　大量の商品の中から個人の嗜好に合ったものを勧める、すなわち「レコメンド」には、様々な方法があります。インターネットを通じたレコメンドに限らず、普段私たちは、様々な場面においてレコメンドを見ています。例えば、ＣＤショップに行くと、あるＣＤの隣に、同じジャンルなど別のＣＤが陳列されているのを見かけます。これによって、ＣＤショップを訪れた人は、あるＣＤ以外に、別のＣＤを手に取ることがあるわけです。このようなレコメンドは、昔からあるものですね。
　このようなレコメンドを、コンピュータを利用し、統計や解析を用いて行うのが、「レコメンドエンジン」と言えるでしょう。この「レコメンドエンジン」には、いくつかの方法があります。
　まず、ユーザーによる購入や視聴など行動履歴を手掛かりとして、ユーザーベースにより商品などを勧める方法です。これを「ユーザーベース協調フィルタリング」と呼んでいます。例えば、あるＣＤを購入したユーザーは、このＣＤも購入しているとのデータを集めます。インターネットでＣＤを購入すると、お勧め商品が一覧表示されたりしますが、そのＣＤを購入した人は、このＣＤも購入している、との統計に基づいて勧めているわけですね。ただ、このような場合だと、自分が好きで購入したわけではなく、たまたま購入したＣＤに関連したＣＤが勧められてしまうこともあります。

コンテンツに着目した「レコメンドエンジン」

　そこで、さらに技術が進んだ段階として、ユーザーに着目するのではなく、コンテンツ（アイテム）に着目した「コンテンツベースフィルタリング」があります。あるコンテンツ、例えば、ある楽曲についてジャンルやアーティストなどのメタデータ（※１）を付けて、他の楽曲などを勧めるわけです。ただ、これは、ＣＤショップにおけるＣＤの陳列と変わりません。そこで、アメリカのPANDORAに始まった「ミュージック・ゲノム（音楽の遺伝子）」という考え方が登場してくるわけです。ミュージシャンや音楽に知見のある人が、一曲ずつ聴いていき、歌詞も読んで、約2,000項目にわたるメタデータを、一曲ごとに付けていくのです。例えば、ある楽曲は、ピアノで始まっているとか、サビがこうなっているとか、コード進行であったりとか、まったりした雰囲気であるとか、人間の感性に関わる項目も、メタデータとして一曲ごとに付けていきます。歌詞についても、単に使用されている単語を見るのではなくて、全体を読んで、どのような歌詞であるか、メタデータを付けていきます。現在、このようなメタデータを用いたレコメンドが最先端のものになっています。
　このようなレコメンドエンジンの開発は、クラウドサーバーが登場し、安価で利用できるようになり、データを一元的に取り扱うことができるようになったこと、そして、コンピュータ自体が高性能化し、価格が安くなったことから実現できたものと言えます。レコメンドエンジン自体は、特別な技術ではなくて、このような技術の発展による恩恵を受けて、膨大な作業時間を短縮することによって、実現されたものと言えるでしょう。

レコメンドエンジンを開発しようとしたきっかけ

　私自身音楽プロデューサーとして、音楽制作に携わっていましたので、クリエイターを支え、音楽業界を盛り上げたいという気持ちがありました。単に売れ筋の楽曲だけではなくて、埋もれている素晴らしいアーティストや楽曲についても光を当てたいという気持ちがありました。
　そこで、アーティストのプロフィールなどのデータをもとに、アーティストとアーティストとの「つながり」が見えるようなデータを作成しました。広大な人物相関図のようなものができることによって、ジャンルにとらわれないアーティストとアーティストとのつながりも見えてきました。
　これを楽曲というコンテンツに着目してみようというのが、コンテンツベースのレコメンドエンジンを開発しようとしたきっかけです。言い換えれば、コンテンツとコンテンツとの「つながり」を見えるようにしようというものですね。

レコメンドエンジンのメリット

　人間は、「好き」、「嫌い」を感覚的に選んでいます。ところが、何故、好きなのか、嫌いなのかは、自分自身では分かっていません。例えば、アイドルの曲は聴かない、ロック好きの人がいたとします。この人に、あるアイドルの曲を聴かせたところ、これを気に入ったとしましょう。そのアイドルの楽曲と、元々好きなロックの楽曲とのメタデータを比べてみると、クリーンギターのカッティングが入っていることが判明する。そうすると、本人に、クリーンギターのカッティングが好きであることを気付かせ、潜在的なマッチングができるようになります。まったく本人が聴いたことがない、新しい楽曲を知るきっかけにもなります。音楽配信の分野では、本人が、「好き」か「嫌い」をクリックすることで、意思を表示していますが、将来的には、脳波から直接、その日その日の嗜好を反映させることもできるかもしれませんね。

レコメンドエンジンの開発の将来

　現在、人間が、一曲一曲を聴いて、楽曲にメタデータを付けています。しかしながら、メタデータの付け方も、一つの楽曲を複数の人間で行っているとはいえ、十人十色ですし、時間も掛かります。そこで、コンピュータにメタデータの付け方を覚えさせて、機械的に楽曲にメタデータを付すこともできるようになります。これによって、メタデータを楽曲に付ける作業時間が、大幅に短縮することができます。これまでの人間による楽曲へのメタデータの付け方をデータとして集め、これによって楽曲のメタデータを自動的に付けることもできます。ここ数年、画像解析で話題となっている「ディープ・ラーニング（機械学習、深層学習）」（※２）という手法を活用したものです。人間がメタデータを付ける場合には一定程度の意思が入ってしまいますが、コンピュータであれば、楽曲の特徴を掴み、メタデータを付けることができます。人間の手による修正も加えながら、メタデータの付け方を、コンピュータに学ばせていくのです。人工知能の一歩手前とも言えるかもしれませんね。

レコメンドエンジンの限界

　コンテンツベースのレコメンドエンジンには、顧客の行動分析は反映されていません。しかしながら、コンテンツベースとユーザーベースのレコメンドを組み合わせることによって、この顧客は、こんな楽曲を好きになるはずだといった嗜好を予測することも可能となります。また、ある楽曲を、一人で聞いている場合も、恋人と聴いている場合も、家族で聴いている場合も想定されます。そうすると、聴いている状況が違うと、聴いている楽曲、聴きたい楽曲が違うこともあるわけです。コンテンツベースとユーザーベースのレコメンドエンジンを組み合わせることによって、より生活に密着したコンテンツのレコメンドも可能となりますので、次の段階として考えることができるかもしれませんね。
　このように技術的に発展しつつあるレコメンドエンジンですが、あまりにも機械的に仕切ってはいけないと思います。例えば、あるアーティストの将来への期待値は、データ上では反映されません。現状しか見ていないのが、レコメンドエンジンの弱いところと言えるでしょう。あるアーティストの表現力は、このように変化していくだろうというところを推測して、レコメンドすることも必要になってくると思います。
　また、ＣＤショップの数が少なくなり、店員と顧客とが顔を合わせて販売することが少なくなってきました。音楽に知見のある店員なら、顧客と直接話をすることによって、その人の嗜好や、どの程度聴いているのかを把握して、どのようなＣＤが良いか、どのようなアーティストが良いかを勧めることができます。このようなレコメンドは、データだけではできないことです。これは、音楽を作る側にも言えることで、人間なら、あるアーティストの将来や育成も加味して、音楽制作することができます。私自身、レコメンドエンジン開発の原点は、クリエイターを支えたいというところにありますので、アーティストの育成という観点も考慮したレコメンドも、今後、考えていければと思います。

レコメンドエンジンの可能性

　レコメンドエンジンを音楽配信サービスだけではなく、日常生活に360度展開していきたいですね。例えば、カーナビゲーションシステムと組み合わせたレコメンドエンジンも考えられるかと思います。道に関するメタデータ、例えば、景色が綺麗な道であるとか、海が見える道であるとか、美味しいレストランがある道であるとか言ったメタデータですね。これを集めておいて、カーナビで、デートのためにロマンチックなルートを探すということも考えられるかもしれません。そして、そのルートや時間帯に合わせて、ぴったりの曲が流れるなんてことも考えられるかもしれません。
　事細かく生活に入り込んでしまうと、「レコメンドエンジン」も「うざい」と思われてしまいますが、ユーザーの気持ちも考えて、適度にレコメンドできるようになれば、より生活に密着して、生活の質を向上させるレコメンドができるかもしれませんね。

Profile

石川　鉄男（いしかわ・てつお）

1965年東京生まれ。電気通信大学情報通信工学科卒。1980年頃からシンセサイザープログラマーとして音楽制作に携わり、1990年頃から音楽プロデューサーとして多くのアーティストとコラボ。2005年頃からT.C.Factoryを立ち上げ人物／エンターテイメントデータベースの構築を行う。2010年頃から株式会社ソケッツと合併し「人の気持ちをつなぐデータベース」をキーワードにDBマーケティング、レコメンドエンジン、気持ち検索サービスの研究開発に力を注いでいる。

GUIDE／KEYWORD

メタデータ（※１）

メタとは、「間に」、「超えた」、「高次の」などを意味し、「メタデータ」とは、データについてのデータという意味になる。例えば、ある書籍（データ）について、著者名、タイトル、発行年月日などがメタデータとなる。（▲本文に戻る）

ディープ・ラーニング（※２）

人間が経験を積んで学習するのと同じように、人間の脳科学の分野における研究成果を用いて、より人間の脳の働きに近づけて、コンピュータに学習させていく手法。2012年、グーグルが、コンピュータによって猫の画像を、「猫」と認識できるようになったことを発表し、話題となった。（▲本文に戻る）

芸団協CPRA 公益社団法人日本芸能実演家団体協議会実演家著作隣接権センター

CPRA Talk