
概要
データ接続は Auxia プラットフォームの重要な構成要素です。通常、データ統合に伴う複雑な作業は Auxia が対応します。お客様のチームは関連するテーブルを共有するだけで、Auxia の社内デプロイメントチームがデータを Auxia のシステムに取り込むために必要な変換処理をすべて行います。
Auxia は、お客様のファーストパーティデータを活用して機械学習モデルをトレーニングし、各顧客に最適なネクストベストアクション、コンテンツ、サーフェス、オファーを予測・ランク付け・提示します。
データ要件:
このプロセスを開始するために、Auxia は以下のデータへのアクセスが必要です。
- ユーザーイベントデータ: クリック、画面閲覧、ウェブサイトやアプリでの閲覧行動などのインタラクション情報が含まれます。
- ユーザー属性: 国、言語、登録日など、個々のユーザーに関するプロフィールデータです。
- トランザクションデータ: 取引金額、商品名、価格など、取引に関連する情報が含まれます。
ソースデータ要件
使用するデータコネクタに関わらず、信頼性が高く効率的なデータ接続を確保するために、ソースデータは以下の要件を満たす必要があります。
1. イミュータブルなソースデータ
Auxia はデータを増分的に読み取り、前回の実行以降に追加された新しい行のみを処理します。ソーステーブルは**追記専用(append-only)**である必要があります。最良の結果を得るために、Auxia に接続するテーブルでは行レベルの変更(UPDATE、DELETE、MERGE)を避けてください。
データウェアハウスでデータの変更が必要な場合は、Auxia 用に別の追記専用テーブルまたはビューからマテリアライズしたテーブルを用意してください。
2. パーティショニング
テーブルは日付パーティション(日付またはタイムスタンプカラムによる日単位のパーティション)が必要です。効率的な増分読み取りとコスト管理のために、日付パーティショニングは必須です。
3. 追記ベースの読み取り
Auxia の推奨する方法は、新しく追加された行のみを読み取ることです。これはフルテーブルスキャンよりも大幅に効率的です。1日あたり 1 TB 以上のデータが追加されるテーブルは、追記ベースの読み取りを使用する必要があります。
4. ネイティブテーブルのみ
Auxia はネイティブテーブルに直接接続します。ビューは現在サポートされていません。増分読み取り関数(例: BigQuery の APPENDS や CHANGES テーブル値関数)はネイティブテーブルでのみ動作するためです。
5. プライマリユーザー ID
ユーザーレベルのテーブル(イベント、属性、トランザクション)では、ユーザーを一意に識別するカラムがデータに含まれている必要があります。このプライマリユーザー ID は、Auxia がアプリ、ウェブサイト、メール、プッシュ通知、その他あらゆるチャネルにおいて、どのユーザーにトリートメントを提供するかを決定するために使用されます。この識別子を正しく設定することで、正確なパーソナライゼーション、モデルトレーニング、トリートメント配信が保証されます。
すべてのテーブルにプライマリユーザー ID が必要なわけではありません。ユーザーではなくモノを記述するエンティティテーブル(例: 商品カタログ、コンテンツライブラリ、位置情報データ)を接続する場合もあります。これらのテーブルにはユーザー識別子は不要です。
マッピングステップでの正しい設定方法については、スキーママッピング: プライマリユーザー ID をご参照ください。
ユーザーイベントデータ
このセクションでは、Auxia がユーザーイベントデータをどのように扱うか、また Auxia のプラットフォームとスムーズに統合するためにイベントデータをどのように構造化すべきかについて説明します。
ユーザー属性
このセクションでは、Auxia がユーザー属性をどのように処理するか、また Auxia のプラットフォームとの統合のためにこれらの属性をどのように構造化する必要があるかについてのガイドラインを提供します。