三谷 壮平

三谷 壮平
データ・テクノロジーセンター 部長

テレビや新聞などの場合、広告枠を買う、という取引が一般的です。例えばある新聞の一面広告は、誰が見ても同じ広告になります。
一方でデジタル広告の場合は、広告が表示されるごとにおのおののユーザーに最適な広告を出すために毎回オークションが開催され、オークションの勝者となった広告主の広告が表示される、という仕組みが広く採用されています。そのため、同じサイトの同じ広告枠を見ても、閲覧するユーザーによって違う広告が出てくる、ということが起きます。

広告の表示のたびにオークションが発生するので、数百万回、数千万回という入札金額の決定を、24時間365日にわたって対応しなければなりません。当然、人間が人力で入札金額を決めるのは非現実的なので、機械学習によって、過去の申し込みユーザーの情報をもとに、どういったユーザーが申し込みやすいのかを予測し、その予測された確率の高低に応じてユーザーごとに最適な入札金額を決めるという、自動入札の仕組みを導入しています。

具体的な例としては、ユーザー一人一人が持っている属性情報の組み合わせ、例えばスマホを見ていて、神田にいて、時刻が平日の夕方で、といった情報からそのユーザーが申し込みなどの行動をする確率をリアルタイムで算出して、最適な入札金額を決定する、というアルゴリズムが自動的に動くようになっています。

以前はルールベースで運用者が入札金額を決めていましたが、この自動入札アルゴリズムの登場と進化によって、人力での運用では広告の効率でかなわなくなり、運用の自動化が進んでいます。そんな中で、運用者が付加価値を発揮できる余地はあるのでしょうか。

電通と電通デジタルはこうした課題意識を踏まえ、自動入札全盛の中でも付加価値を発揮すべく、工夫の余地を検討しました。入札金額を決定する自動入札の仕組み自体は各プラットフォーム事業者が独自に作っているもので、直接的に外部から介入することはできません。一方で、各プラットフォーム事業者が作るモデルの教師データの部分、つまり申し込みをしたかどうか、などの結果の情報は外部から送ることができるので、ここで送る教師データの部分を変えることでプラットフォーム事業者の自動入札の仕組みを利用しつつも、さらに広告主の事業成果を高めることができるのでは、という発想に至りました。

自動入札アルゴリズムに送る教師データに存在するギャップ

自動入札のアルゴリズムそれ自体には介入できなくても、自動入札が学習するゴールである教師データには介入できるというアイデアを踏まえて、実際の広告運用で起きている課題を見てみましょう。

一般的にデジタル広告のゴールは、ウェブサイト上で完結する行動が多くなっています。例えばEC事業者であれば会員登録だったり、クレジットカード事業者だったらカード発行だったり、不動産事業者であれば来店予約だったり、などです。しかし広告主の事業全体の観点から見ると、こうしたサイト上の行動というのはあくまでカスタマージャーニーの途中であって、本来の事業成果という意味では、例えばECサイトならその後の継続的な購入(Life Time Value)、クレジットカードならカード発行後の利用金額、不動産なら最終的な成約、などとなるでしょう。

つまり、本来はさらに深い地点に事業成果のゴールがあるにもかかわらず、デジタル広告のゴールは浅い地点に置かれている、ということです。この理由として挙げられるのは、サイト上の行動と、その後の事業成果に「ギャップ」があるためです。
例えばECサイトの場合、会員登録後の継続的な購入というのは継続的であるがゆえに当日に分かるものではなく、半年後などある程度時間が経過してから確定するものです。一方でプラットフォームの自動入札アルゴリズムは、クリック後数日以内の行動に対しての学習を想定して開発されていることが多いので、半年後などの情報を送っても正しく学習されません。

ギャップには時間的なものだけではなく、量的なものも存在します。自動入札アルゴリズムは、過去の実績を学習することで将来を予測します。この時、過去のデータが少なすぎると学習が十分になされず、モデルの精度が落ちることがあります。
例えば初回無料お試しキャンペーンを実施している健康食品事業者があったとして、その後の本品購入までつながる率が1%だとすると、お試しは1万件取れても本品購入は100件しか発生しません。このように事業成果の件数が少ない場合に、事業成果を自動入札アルゴリズムの教師データに直接設定すると、学習に足りるだけの十分な件数が確保できず、自動入札がうまく働かない、ということが起きうるのです。

ギャップを解消するために

このように、本来は事業成果を直接教師データに指定して自動入札アルゴリズムの最適化対象にする、というのがあるべき姿です。しかし、時間的・量的なギャップが存在するために直接最適化ができず、仕方なくウェブサイト上で計測できる地点を設定しているケースが多いことが分かりました。

こうした課題に対して、電通と電通デジタルでは予測モデリングという分析技法によって、このギャップを解消することを目指しました。
例えばECサイトの場合、会員登録の時点で観測できる情報によって過去のデータセットをもとにその後の購入を予測するモデルを作って、ここで作ったモデルを将来のデータにも適用することで、初回登録時のその後の購入確率、すなわちユーザーの価値を登録の時点で予測できるようになりました。

これを一般化すると、予測モデルを作ることでウェブサイト上での行動をもとに本来の事業成果であるその後の行動の確率を算出できる、ということです。この予測されたユーザーの価値を広告プラットフォームの教師データとして送ることで、直接的な事業成果の最大化が実現できました。こうしたギャップはECサイトに限らず、サブスクだったら会員登録に対する継続率、アプリだったら初回起動に対する課金率など、さまざまな業種で発生している課題であり、予測モデルを用いることで解決できる幅も大きいと言えます。

どのように予測モデルを作成しているか

予測モデルを作る際は、まずどのようなデータを活用することできるか、どのような事業成果を予測することでマーケティング効果が最大化するかを検討します。必要があれば、新しいデータを取得するアドバイスや支援、新しく中間指標を設定することも提案します。

データがそろったら、次の作業はクラウドプラットフォーム上でデータを統合することです。活用する主なデータはウェブのアクセスログ、アプリデータ、会員データ(属性情報や購買データ)など多岐にわたります。データを収集できたら、機械学習のモデルを作成し、予測モデルを作成します。モデル作成においては精度を一定程度に高められるよう、何回か試行するようなスケジュールを組み、モデルに組み込む特徴量を工夫しています。

モデルが作成できたら、ユーザーごとに予測スコア(売り上げの場合は予測LTV=predicted LTV)を算出します。このスコアを各広告プラットフォームとAPIを通じ連携し、自動入札の教師データとしています。

そして上記の一連のプロセスをデータのパイプラインとして構築しています。ユーザーの特定のアクションによって予測スコアは変動するため、日々スコアを更新し、広告プラットフォームに最新のスコアを連携する作業を自動化することが重要です。

電通と電通デジタルならではの技術的な工夫

この予測モデルには大きく3つの特徴があります。

複数の広告プラットフォームに対応したデータパイプライン
データを統合して予測スコアを付与し、広告プラットフォームに連携できる柔軟なパイプラインを開発済みです。外部からスコアを教師データとして自動入札に反映できる広告プラットフォームは複数あり、いずれも異なるAPIを利用する必要がありますが、電通と電通デジタルのプラットフォームでは一元的に対応が可能です。
広告運用チームとのシームレスな連携
機械学習を用いて自動入札にスコアを反映できるシステムが構築できても、実際にどのような広告運用をすればよいかが分からないと、マーケティング効果や事業成果を改善することはできません。電通と電通デジタルには過去多くの案件を通じて得た広告運用のノウハウがあり、システムと運用をシームレスに連携させることができます。
産学連携を通じた予測モデルのブラッシュアップやデータドリフト等のR&Dの取り組み
産学連携を通じてLTV予測の精度改善や時系列分析技術を加味し、季節トレンドを生活者単位で捉えたモデル作成ができるようになっています。また、コロナ禍でこれまでとデータの分布が変化することで、機械学習モデルが劣化する懸念がよく指摘されています。電通と電通デジタルではデータの分布の変化(データドリフト)を検知する仕組みもシステムに組み込み、堅牢(けんろう)なシステムにしています。

電通と電通デジタルはこれからも、マーケティング投資を本質的な事業成果の改善につなげるさまざまなサービスやソリューションを提供していきます。

執筆

三谷 壮平

三谷 壮平

データ・テクノロジーセンター 部長

ダイレクト系広告主の担当、マーケティングプロセスのデジタル化支援を経て、「定量的な成果(Performance)」に立脚したデジタルマーケティングの高度化や武器作りを推進中。