اگر قصد تجزیه و تحلیل جداول آنالیتیکس 4 از طریق بیگ کوئری را دارید، باید با ساختار دادههایی که به بیگ کوئری انتقال داده می شود، آشنایی داشته باشید. در این مقاله به بررسی schema یا ساختار دادههای آنالیتیکس 4 در بیگ کوئری میپردازیم.
منظور از دیتاست (dataset) آنالیتیکس در بیگ کوئری چیست؟
برای هر پراپرتی Google Analytics 4 و هر پروژه Firebase که به BigQuery لینک شده است، یک مجموعه داده یا دیتاست با نام ” analytics_<property_id>” به پروژه BigQuery شما اضافه می شود. Property ID به شناسه پراپرتی Analytics شما اشاره دارد که می توانید آن را در تنظیمات پراپرتی (property settings در بخش ادمین) برای پراپرتی Google Analytics 4 خود و در تنظیمات App Analytics در Firebase پیدا کنید.
منظور از جدول (Table) آنالیتیکس در بیگ کوئری چیست؟
اگر هنگام اتصال آنالیتیکس 4 به بیگ کوئری از حالت Daily استفاده کرده باشید، در هر دیتاست آنالیتیکس در پروژه بیگ کوئری، یک جدول با نام events_YYYYMMDD برای هر روز ایجاد می شود. اما اگر گزینه Streaming برای انتقال اطلاعات فعال باشد، جدولی با نام events_intraday_YYYYMMDD ایجاد می شود. در طی روز این جدول کامل میشود و به محض پایان یافتن هر روز، به جداول روزانه انتقال داده می شود.
توجه داشته باشید که تمام دستگاهها، در یک روز اطلاعات ایونت خود را برای آنالیتیکس ارسال نمی کنند. به همین دلیل و برای محاسبه این تأخیر، Analytics جداول روزانه (events_YYYYMMDD) را با ایونتهای آن تاریخ تا سه روز پس از تاریخ ایونتها بهروزرسانی میکند. البته تاریخ رخداد ایونتها صرف نظر از زمان انتقالشان به بیگ کوئری، درست خواهد بود.
در صورتی که از نسخه رایگان یعنی sanbox بیگ کوئری استفاده می کنید، قادر به ارسال اطلاعات به صورت Streaming نخواهید بود و باید از همان حالت روزانه یا Daily استفاده کنید. در نتیجه در این حالت، جدولی با اسم events_intraday_YYYYMMDD نخواهید داشت.
بررسی ستونهای جدول آنالیتیکس در بیگ کوئری؛ هر ستون چه اطلاعاتی به ما میدهد؟
اطلاعات مربوط به ایونت
هر ستون در جدول events_YYYYMMDD یک پارامتر خاص از یک ایونت را نشان می دهد. توجه داشته باشید که برخی از پارامترها درون RECORDS تودرتو هستند و برخی از RECORDS مانند آیتمها و event_params به صورت آرایه در بیگ کوئری ذخیره می شوند.
اسم ستون | نوع داده | توضیحات |
event_date | STRING | تاریخ ثبت رویداد |
event_timestamp | INTEGER | زمان رخداد یک ایونت توسط کاربر بر حسب میکروثانیه |
event_previous_timestamp | INTEGER | زمان رخداد ایونت قبلی کاربر بر حسب میکروثانیه |
event_name | STRING | اسم ایونت |
event_value_in_usd | FLOAT | مقدار تبدیل شده ارز به دلار |
event_bundle_sequence_id | INTEGER | |
event_server_timestamp_offset | INTEGER | مدت زمان بین جمع آوری و آپلود بر حسب میکروثانیه |
batch_event_index | INTEGER | نشاندهنده ترتیب هر رویداد در یک دسته (batch) بر اساس ترتیب وقوع آنها روی دستگاه است. این فیلد به شناسایی ترتیب رویدادها در داخل یک دسته کمک میکند. |
batch_ordering_id | INTEGER | به صورت یکنواخت افزایش مییابد و هر بار که از یک صفحه مشخص (network request) ارسال میشود، مقدار آن افزایش مییابد. این فیلد برای دنبال کردن تعداد درخواستهای شبکه از یک صفحه خاص مفید است. |
batch_page_id | INTEGER | به هر صفحه اختصاص داده میشود و با هر صفحه جدید در یک (engagement) افزایش مییابد. این عدد به ترتیب صفحات کمک میکند و میتواند برای تحلیل ترتیب مشاهده صفحات در یک engagement خاص استفاده شود. |
event_params اطلاعات اضافهای است که همراه با هر ایونت برای آنالیتیکس و در نتیجه بیگ کوئری ارسال می شود. جنس هر اطلاعات یا پارامتر اضافه میتواند متفاوت باشد.
اسم ستون | نوع داده | توضیحات |
event_params.key | STRING | نام پارامتر ایونت. |
event_params.value | RECORD (آرایه) | حاوی مقدار پارامتر ایونت |
event_params.value.string_value | STRING | اگر پارامتر ایونت با رشتهای مانند URL یا نام کمپین مقداردهی میشود، در این ستون قرار میگیرد |
event_params.value.int_value | INTEGER | اگر پارامتر ایونت با یک عدد صحیح مقداردهی میشود، در این ستون قرار میگیرد |
event_params.value.double_value | Double | اگر پارامتر ایونت با یک مقدار Double مقداردهی میشود، در این ستون قرار میگیرد |
event_params.value.float_value | FLOAT | اگر پارامتر ایونت با ممیز نمایش داده شود، در این ستون قرار میگیرد. این فیلد در حال حاضر استفاده نمی شود. |
اطلاعات مربوط به User
اسم ستون | نوع داده | توضیحات |
is_active_user | BOOLEAN | اینکه کاربر در هر نقطه از روز active (درست) یا غیرفعال (نادرست) بوده است. فقط در جداول روزانه (events_YYYYMMDD) قرار دارد. |
user_id | STRING | شناسه منحصر به فرد اختصاص داده شده به یک کاربر توسط شما |
user_pseudo_id | STRING | شناسه منحصر به فرد اختصاص داده شده به یک کاربر توسط آنالیتیکس |
user_first_touch_timestamp | INTEGER | زمانی (بر حسب میکروثانیه) که در آن کاربر برای اولین بار برنامه را باز یا از سایت بازدید کرده است. |
اسم ستون | نوع داده | توضیحات |
privacy_info.ads_storage | STRING | اینکه آیا ad targeting برای یک کاربر فعال است یا خیر. مقادیر ممکن: بله، خیر، تنظیم نشده است |
privacy_info.analytics_storage | STRING | آیا ذخیره سازی Analytics برای کاربر فعال است یا خیر. مقادیر ممکن: بله، خیر، تنظیم نشده است |
privacy_info.uses_transient_token | STRING | اینکه آیا یک کاربر وب فضای ذخیره سازی Analytics را رد کرده است و دولوپر اندازه گیری بدون کوکی را بر اساس توکنهای موقتی در دادههای سرور فعال کرده است. مقادیر ممکن: بله، خیر، تنظیم نشده است |
اسم ستون | نوع داده | توضیحات |
user_properties.key | STRING | نام ویژگی کاربر |
user_properties.value | RECORD (آرایه) | |
user_properties.value.string_value | STRING | مقدار رشته ویژگی کاربر |
user_properties.value.int_value | INTEGER | مقدار صحیح ویژگی کاربر |
user_properties.value.double_value | Double | مقدار Double ویژگی کاربر |
FLOAT | مقدار FLOAT ویژگی کاربر. این فیلد در حال حاضر استفاده نمی شود. | |
user_properties.value.set_timestamp_micros | INTEGER | زمانی (بر حسب میکروثانیه) که در آن ویژگی کاربر ست شده است. |
اسم ستون | نوع داده | توضیحات |
user_ltv.revenue | FLOAT | ارزش طول عمر (درآمد) کاربر. این فیلد در جداول intraday وجود ندارد. |
user_ltv.currency | STRING | ارزش مادام العمر (ارز) کاربر. این فیلد در جداول intraday وجود ندارد. |
اطلاعات مربوط به دستگاه (Device)
اسم ستون | نوع داده | توضیحات |
device.category | STRING | دسته بندی دستگاه (موبایل، تبلت، دسکتاپ). |
device.mobile_brand_name | STRING | نام برند دستگاه |
device.mobile_model_name | STRING | نام مدل دستگاه |
device.mobile_marketing_name | STRING | نام بازاریابی دستگاه |
device.mobile_os_hardware_model | STRING | اطلاعات مدل دستگاه که مستقیماً از سیستم عامل بازیابی شده است. |
device.operating_system | STRING | سیستم عامل دستگاه. |
device.operating_system_version | STRING | نسخه سیستم عامل. |
device.vendor_id | STRING | IDFV (فقط در صورت عدم جمع آوری IDFA موجود است). |
device.advertising_id | STRING | شناسه تبلیغاتی/IDFA. |
device.language | STRING | زبان سیستم عامل |
device.time_zone_offset_seconds | INTEGER | افست از GMT در چند ثانیه. |
device.is_limited_ad_tracking | BOOLEAN | تنظیمات محدودیت ردیابی تبلیغات دستگاه. در iOS14+، اگر IDFA غیر صفر باشد، false را برمیگرداند. |
device.web_info.browser | STRING | مرورگری که کاربر محتوا را در آن مشاهده کرده است. |
device.web_info.browser_version | STRING | نسخه مرورگری که کاربر محتوا را در آن مشاهده کرده است. |
device.web_info.hostname | STRING | نام hostname مرتبط با ایونت ثبت شده است. |
اطلاعات مربوط به موقعیت جغرافیایی (geo)
اسم ستون | نوع داده | توضیحات |
geo.continent | STRING | قارهای که ایونتها از آن بر اساس آدرس IP گزارش شده است. |
geo.sub_continent | STRING | شبه قارهای که ایونتها از آن گزارش شده است، بر اساس آدرس IP. |
geo.country | STRING | کشوری که ایونتها از آن گزارش شده است، بر اساس آدرس IP. |
geo.region | STRING | منطقهای که ایونتها از آن گزارش شده است، بر اساس آدرس IP. |
geo.metro | STRING | مترویی که ایونتها از آن گزارش شده است، بر اساس آدرس IP. |
geo.city | STRING | شهری که ایونتها از آن گزارش شده است، بر اساس آدرس IP. |
اطلاعات مربوط به اپ
اسم ستون | نوع داده | توضیحات |
app_info.id | STRING | نام پکیج یا شناسه بسته نرم افزار. |
app_info.firebase_app_id | STRING | Firebase App ID مرتبط با برنامه |
app_info.install_source | STRING | فروشگاهی که برنامه را از طریق آن نصب کرده است. |
app_info.version | STRING | نسخه نام برنامه (اندروید) یا نسخه کوتاه پکیج. |
اطلاعات مربوط به کانال ورودی
اسم ستون | نوع داده | توضیحات |
manual_campaign_id | STRING | آی دی کمپین یا همان utm_id |
manual_campaign_name | STRING | نام کمپین یا utm_campaign |
manual_source | STRING | سورس یو تی ام یا utm_source |
manual_medium | STRING | مدیوم یو تی ام یا utm_medium |
manual_term | STRING | ترم یا کلمه کلیدی یا utm_term |
manual_content | STRING | اطلاعات اضافی یا utm_content |
gclid | شناسه تبلیغات گوگل | |
dclid | شناسه Google Marketing Platform (GMP) | |
srsltid | شناسه Google Merchant Center |
اطلاعات مربوط به traffic_source
Traffic_source حاوی اطلاعاتی درباره منبع ترافیکی است که کاربر برای اولین بار از طریق آن با شما تعامل برقرار کرده است. این اطلاعات در جداول intraday وجود ندارد.
اسم ستون | نوع داده | توضیحات |
traffic_source.name | STRING | نام کمپینی که کاربر برای اولین بار از طریق آن با شما تعامل برقرار کرده است. این اطلاعات در جداول intraday وجود ندارد. |
traffic_source.medium | STRING | نام مدیومی که کاربر برای اولین بار از طریق آن با شما تعامل برقرار کرده است. این اطلاعات در جداول intraday وجود ندارد. |
traffic_source.source | STRING | نام سورسی که کاربر برای اولین بار از طریق آن با شما تعامل برقرار کرده است. این اطلاعات در جداول intraday وجود ندارد. |