اسکیما یا ساختار داده‌های آنالیتیکس 4 در بیگ کوئری

اسکیما یا ساختار داده‌های آنالیتیکس 4 در بیگ کوئری

اگر قصد تجزیه و تحلیل جداول آنالیتیکس 4 از طریق بیگ کوئری را دارید، باید با ساختار داده‌هایی که به بیگ کوئری انتقال داده می شود، آشنایی داشته باشید. در این مقاله به بررسی schema یا ساختار داده‌های آنالیتیکس 4 در بیگ کوئری می‌پردازیم.

منظور از دیتاست (dataset) آنالیتیکس در بیگ کوئری چیست؟

برای هر پراپرتی Google Analytics 4 و هر پروژه Firebase که به BigQuery لینک شده است، یک مجموعه داده یا دیتاست با نام ” analytics_<property_id>” به پروژه BigQuery شما اضافه می شود. Property ID به شناسه پراپرتی Analytics شما اشاره دارد که می توانید آن را در تنظیمات پراپرتی (property settings در بخش ادمین) برای پراپرتی Google Analytics 4 خود و در تنظیمات App Analytics در Firebase پیدا کنید.

منظور از جدول (Table) آنالیتیکس در بیگ کوئری چیست؟

اگر هنگام اتصال آنالیتیکس 4 به بیگ کوئری از حالت Daily استفاده کرده باشید، در هر دیتاست آنالیتیکس در پروژه بیگ کوئری، یک جدول با نام events_YYYYMMDD برای هر روز ایجاد می شود. اما اگر گزینه Streaming برای انتقال اطلاعات فعال باشد، جدولی با نام events_intraday_YYYYMMDD ایجاد می شود. در طی روز این جدول کامل می‌شود و به محض پایان یافتن هر روز، به جداول روزانه انتقال داده می شود.

توجه داشته باشید که تمام دستگاه‌ها، در یک روز اطلاعات ایونت خود را برای آنالیتیکس ارسال نمی کنند. به همین دلیل و برای محاسبه این تأخیر، Analytics جداول روزانه (events_YYYYMMDD) را با ایونت‌های آن تاریخ‌ تا سه روز پس از تاریخ ایونت‌ها به‌روزرسانی می‌کند. البته تاریخ رخداد ایونت‌ها صرف نظر از زمان انتقالشان به بیگ کوئری، درست خواهد بود.

در صورتی که از نسخه رایگان یعنی sanbox بیگ کوئری استفاده می کنید، قادر به ارسال اطلاعات به صورت Streaming نخواهید بود و باید از همان حالت روزانه یا Daily استفاده کنید. در نتیجه در این حالت، جدولی با اسم events_intraday_YYYYMMDD نخواهید داشت.

بررسی ستون‌های جدول آنالیتیکس در بیگ کوئری؛ هر ستون چه اطلاعاتی به ما می‌دهد؟

اطلاعات مربوط به ایونت

هر ستون در جدول events_YYYYMMDD یک پارامتر خاص از یک ایونت را نشان می دهد. توجه داشته باشید که برخی از پارامترها درون RECORDS تودرتو هستند و برخی از RECORDS مانند آیتم‌ها و event_params به صورت آرایه در بیگ کوئری ذخیره می شوند.

اسم ستوننوع دادهتوضیحات
event_dateSTRINGتاریخ ثبت رویداد
event_timestampINTEGERزمان رخداد یک ایونت توسط کاربر بر حسب میکروثانیه
event_previous_timestampINTEGERزمان رخداد ایونت قبلی کاربر بر حسب میکروثانیه
event_nameSTRINGاسم ایونت
event_value_in_usdFLOATمقدار تبدیل شده ارز به دلار
event_bundle_sequence_idINTEGER 
event_server_timestamp_offsetINTEGERمدت زمان بین جمع آوری و آپلود بر حسب میکروثانیه
batch_event_indexINTEGERنشان‌دهنده ترتیب هر رویداد در یک دسته (batch) بر اساس ترتیب وقوع آن‌ها روی دستگاه است. این فیلد به شناسایی ترتیب رویدادها در داخل یک دسته کمک می‌کند.
batch_ordering_idINTEGERبه صورت یکنواخت افزایش می‌یابد و هر بار که از یک صفحه مشخص (network request) ارسال می‌شود، مقدار آن افزایش می‌یابد. این فیلد برای دنبال کردن تعداد درخواست‌های شبکه از یک صفحه خاص مفید است.
batch_page_idINTEGERبه هر صفحه اختصاص داده می‌شود و با هر صفحه جدید در یک (engagement) افزایش می‌یابد. این عدد به ترتیب صفحات کمک می‌کند و می‌تواند برای تحلیل ترتیب مشاهده صفحات در یک engagement خاص استفاده شود.

event_params اطلاعات اضافه‌ای است که همراه با هر ایونت برای آنالیتیکس و در نتیجه بیگ کوئری ارسال می شود. جنس هر اطلاعات یا پارامتر اضافه میتواند متفاوت باشد.

اسم ستوننوع دادهتوضیحات
event_params.keySTRINGنام پارامتر ایونت.
event_params.valueRECORD (آرایه)حاوی مقدار پارامتر ایونت
event_params.value.string_valueSTRINGاگر پارامتر ایونت با رشته‌ای مانند URL یا نام کمپین مقداردهی میشود، در این ستون قرار میگیرد
event_params.value.int_valueINTEGERاگر پارامتر ایونت با یک عدد صحیح مقداردهی میشود، در این ستون قرار میگیرد
event_params.value.double_valueDoubleاگر پارامتر ایونت با یک مقدار Double مقداردهی میشود، در این ستون قرار میگیرد
event_params.value.float_valueFLOATاگر پارامتر ایونت با ممیز نمایش داده شود، در این ستون قرار میگیرد. این فیلد در حال حاضر استفاده نمی شود.

اطلاعات مربوط به User

اسم ستوننوع دادهتوضیحات
is_active_userBOOLEANاینکه کاربر در هر نقطه از روز active (درست) یا غیرفعال (نادرست) بوده است. فقط در جداول روزانه (events_YYYYMMDD) قرار دارد.
user_idSTRINGشناسه منحصر به فرد اختصاص داده شده به یک کاربر توسط شما
user_pseudo_idSTRINGشناسه منحصر به فرد اختصاص داده شده به یک کاربر توسط آنالیتیکس
user_first_touch_timestampINTEGERزمانی (بر حسب میکروثانیه) که در آن کاربر برای اولین بار برنامه را باز یا از سایت بازدید کرده است.
اسم ستوننوع دادهتوضیحات
privacy_info.ads_storageSTRINGاینکه آیا ad targeting برای یک کاربر فعال است یا خیر. مقادیر ممکن: بله، خیر، تنظیم نشده است
privacy_info.analytics_storageSTRINGآیا ذخیره سازی Analytics برای کاربر فعال است یا خیر. مقادیر ممکن: بله، خیر، تنظیم نشده است
privacy_info.uses_transient_tokenSTRINGاینکه آیا یک کاربر وب فضای ذخیره سازی Analytics را رد کرده است و دولوپر اندازه گیری بدون کوکی را بر اساس توکن‌های موقتی در داده‌های سرور فعال کرده است. مقادیر ممکن: بله، خیر، تنظیم نشده است
اسم ستوننوع دادهتوضیحات
user_properties.keySTRINGنام ویژگی کاربر
user_properties.valueRECORD (آرایه) 
user_properties.value.string_valueSTRINGمقدار رشته ویژگی کاربر
user_properties.value.int_valueINTEGERمقدار صحیح ویژگی کاربر
user_properties.value.double_valueDoubleمقدار Double ویژگی کاربر
 FLOATمقدار FLOAT ویژگی کاربر. این فیلد در حال حاضر استفاده نمی شود.
user_properties.value.set_timestamp_microsINTEGERزمانی (بر حسب میکروثانیه) که در آن ویژگی کاربر ست شده است.
اسم ستوننوع دادهتوضیحات
user_ltv.revenueFLOATارزش طول عمر (درآمد) کاربر. این فیلد در جداول intraday وجود ندارد.
user_ltv.currencySTRINGارزش مادام العمر (ارز) کاربر. این فیلد در جداول intraday وجود ندارد.

اطلاعات مربوط به دستگاه (Device)

اسم ستوننوع دادهتوضیحات
device.categorySTRINGدسته بندی دستگاه (موبایل، تبلت، دسکتاپ).
device.mobile_brand_nameSTRINGنام برند دستگاه
device.mobile_model_nameSTRINGنام مدل دستگاه
device.mobile_marketing_nameSTRINGنام بازاریابی دستگاه
device.mobile_os_hardware_modelSTRINGاطلاعات مدل دستگاه که مستقیماً از سیستم عامل بازیابی شده است.
device.operating_systemSTRINGسیستم عامل دستگاه.
device.operating_system_versionSTRINGنسخه سیستم عامل.
device.vendor_idSTRINGIDFV (فقط در صورت عدم جمع آوری IDFA موجود است).
device.advertising_idSTRINGشناسه تبلیغاتی/IDFA.
device.languageSTRINGزبان سیستم عامل
device.time_zone_offset_secondsINTEGERافست از GMT در چند ثانیه.
device.is_limited_ad_trackingBOOLEANتنظیمات محدودیت ردیابی تبلیغات دستگاه. در iOS14+، اگر IDFA غیر صفر باشد، false را برمی‌گرداند.
device.web_info.browserSTRINGمرورگری که کاربر محتوا را در آن مشاهده کرده است.
device.web_info.browser_versionSTRINGنسخه مرورگری که کاربر محتوا را در آن مشاهده کرده است.
device.web_info.hostnameSTRINGنام hostname مرتبط با ایونت ثبت شده است.

اطلاعات مربوط به موقعیت جغرافیایی (geo)

اسم ستوننوع دادهتوضیحات
geo.continentSTRINGقاره‌ای که ایونت‌ها از آن بر اساس آدرس IP گزارش شده است.
geo.sub_continentSTRINGشبه قاره‌ای که ایونت‌ها از آن گزارش شده است، بر اساس آدرس IP.
geo.countrySTRINGکشوری که ایونت‌ها از آن گزارش شده است، بر اساس آدرس IP.
geo.regionSTRINGمنطقه‌ای که ایونت‌ها از آن گزارش شده است، بر اساس آدرس IP.
geo.metroSTRINGمترویی که ایونت‌ها از آن گزارش شده است، بر اساس آدرس IP.
geo.citySTRINGشهری که ایونت‌ها از آن گزارش شده است، بر اساس آدرس IP.

اطلاعات مربوط به اپ

اسم ستوننوع دادهتوضیحات
app_info.idSTRINGنام پکیج یا شناسه بسته نرم افزار.
app_info.firebase_app_idSTRINGFirebase App ID مرتبط با برنامه
app_info.install_sourceSTRINGفروشگاهی که برنامه را از طریق آن نصب کرده است.
app_info.versionSTRINGنسخه نام برنامه (اندروید) یا نسخه کوتاه پکیج.

اطلاعات مربوط به کانال ورودی

اسم ستوننوع دادهتوضیحات
manual_campaign_idSTRINGآی دی کمپین یا همان utm_id
manual_campaign_nameSTRINGنام کمپین یا utm_campaign
manual_sourceSTRINGسورس یو تی ام یا utm_source
manual_mediumSTRINGمدیوم یو تی ام یا utm_medium
manual_termSTRINGترم یا کلمه کلیدی یا utm_term
manual_contentSTRINGاطلاعات اضافی یا utm_content
gclid شناسه تبلیغات گوگل
dclid شناسه Google Marketing Platform (GMP)
srsltid شناسه  Google Merchant Center

اطلاعات مربوط به traffic_source

Traffic_source حاوی اطلاعاتی درباره منبع ترافیکی است که کاربر برای اولین بار از طریق آن با شما تعامل برقرار کرده است. این اطلاعات در جداول intraday وجود ندارد.

اسم ستوننوع دادهتوضیحات
traffic_source.nameSTRINGنام کمپینی که کاربر برای اولین بار از طریق آن با شما تعامل برقرار کرده است. این اطلاعات در جداول intraday وجود ندارد.
traffic_source.mediumSTRINGنام مدیومی که کاربر برای اولین بار از طریق آن با شما تعامل برقرار کرده است. این اطلاعات در جداول intraday وجود ندارد.
traffic_source.sourceSTRINGنام سورسی که کاربر برای اولین بار از طریق آن با شما تعامل برقرار کرده است. این اطلاعات در جداول intraday وجود ندارد.

دیدگاهتان را بنویسید

دریافت مشاوره و آموزش

برای دریافت مشاوره نصب و راه اندازی آنالیتیکس 4 و ایونت ترکینگ از طریق گوگل تگ منیجر، از طریق شماره تماس زیر با من در ارتباط باشید.