راهنمای استفاده از عبارات منظم (Regex) در گوگل آنالیتیکس ۴ (GA4) برای تحلیل بهتر

راهنمای استفاده از عبارات منظم (Regex) در گوگل آنالیتیکس ۴ (GA4) برای تحلیل بهتر

عبارات منظم (Regular Expressions یا Regex) ابزاری قدرتمند برای تحلیل داده‌ها در گوگل آنالیتیکس ۴ (GA4) و گوگل تگ منیجر (GTM) هستند. این ابزار به شما امکان می‌دهد الگوهای پیچیده‌ای را در داده‌ها شناسایی کرده و گزارش‌های دقیق‌تر و پیشرفته‌تری ایجاد کنید. در این مقاله، به بررسی کاربردهای عملی Regex در آنالیتیکس 4 و GTM می‌پردازیم و نکات کلیدی برای استفاده بهینه از آن‌ها را ارائه می‌دهیم.

عبارات منظم در GA4 چیست؟

عبارات منظم مجموعه‌ای از کاراکترها و متاکاراکترها هستند که برای تطبیق الگوها در رشته‌های متنی استفاده می‌شوند. در GA4، از موتور Regex جاوااسکریپت استفاده می‌شود که به شما امکان می‌دهد داده‌ها را با دقت بیشتری فیلتر کنید. به عنوان مثال، Regex می‌تواند برای شناسایی الگوهای خاص در URLها، دسته‌بندی محتوا یا فیلتر کردن ترافیک ارجاعی (Referral Traffic) به کار رود.

تفاوت تطبیق کامل و تطبیق جزئی

  • تطبیق کامل (Fully Matched Regex): در GA4، به طور پیش‌فرض از تطبیق کامل استفاده می‌شود، یعنی Regex باید کل رشته را مطابقت دهد. برای مثال، عبارت /shop/ فقط با رشته‌ای که دقیقاً /shop/ باشد مطابقت می‌کند.
  • تطبیق جزئی (Partially Matched Regex): برای تطبیق جزئی، باید از متاکاراکترهایی مانند .* استفاده کنید. مثلاً /shop/.* با هر URL که شامل /shop/ باشد مطابقت خواهد داشت.

اجزای عبارات منظم (Regex) در GA4: کاراکترها و متاکاراکترها

عبارات منظم (Regular Expressions یا Regex) در گوگل آنالیتیکس ۴ (GA4) از دو جزء اصلی تشکیل شده‌اند: کاراکترها و متاکاراکترها. درک این اجزا برای استفاده بهینه از Regex در تحلیل داده‌ها و بهینه‌سازی وب‌سایت ضروری است.

کاراکترها در Regex

کاراکترها شامل حروف، اعداد و نمادهایی هستند که به صورت مستقیم برای تطبیق الگوها در رشته‌های متنی استفاده می‌شوند. به عنوان مثال، عبارت /shop/ از کاراکترهای s, h, o, و p تشکیل شده که برای شناسایی دقیق مسیرهای وب‌سایت استفاده می‌شود. این کاراکترها به شما امکان می‌دهند الگوهای خاصی را در URLها یا داده‌های دیگر ردیابی کنید.

متاکاراکترها در Regex

متاکاراکترها کاراکترهایی با معانی خاص هستند که رفتار تطبیق را کنترل می‌کنند. این کاراکترها به شما قدرت انعطاف‌پذیری بیشتری در تعریف الگوها می‌دهند. برخی از متاکاراکترهای رایج عبارتند از:

  • ^: نشان‌دهنده شروع یک رشته (مثلاً ^/blog برای صفحاتی که با /blog شروع می‌شوند).
  • $: نشان‌دهنده پایان یک رشته.
  • .: نماینده هر کاراکتر به جز خط جدید.
  • *: نشان‌دهنده صفر یا بیشتر از الگوی قبلی.
  • +: نشان‌دهنده یک یا بیشتر از الگوی قبلی.
  • ?: نشان‌دهنده صفر یا یک بار از الگوی قبلی.
  • |: ایجاد شرط OR منطقی (مثلاً His|Her با His یا Her مطابقت دارد).
  • []: تطبیق یک کاراکتر از مجموعه مشخص (مثلاً [a-z] برای حروف کوچک).

متا کاراکترهایی که در GA4 پشتیبانی نمی‌شوند (و باید از آن‌ها پرهیز کنید)

اگر در حال ساخت Regex برای Google Analytics 4 هستید، باید بدانید که GA4 از موتور RE2 استفاده می‌کند؛ این یعنی برخی از متا کاراکترهایی که در دیگر موتورهای Regex مثل PCRE یا JavaScript رایج هستند، در GA4 پشتیبانی نمی‌شوند.

در ادامه لیستی از متا کاراکترهای غیرمجاز در GA4 را می‌بینید:

لیست کاراکترهای ناسازگار با GA4:

  1. / (اسلش)
    معمولاً برای مشخص کردن شروع و پایان Regex استفاده می‌شود، اما در GA4 مجاز نیست.
  2. ! (علامت تعجب)
    برای تعریف حالت “NOT” منطقی به‌کار می‌رود، اما در GA4 پشتیبانی نمی‌شود.
  3. \n
    بررسی ورود به خط جدید (New Line).
  4. \r
    بررسی Carriage Return.
  5. \t
    بررسی کاراکتر تب (Tab).
  6. \s
    بررسی فضای خالی (Space).
  7. \S
    بررسی کاراکتری که فضای خالی نیست.
  8. \d
    بررسی عدد (Digit).
  9. \D
    بررسی کاراکری که عدد نیست.
  10. \w
    بررسی کاراکترهای متنی (Word Character) – در اینجا اشاره شده که به اشتباه برای CR استفاده شده است.
  11. \W
    بررسی کاراکترهایی که جزو کلمات نیستند.

اصول مهم برای ساخت Regex در GA4

  1. از نماد “|” (پایپ) با دقت استفاده کنید
    این نماد برای “یا” کردن عبارات است. استفاده نادرست می‌تواند باعث نتایج اشتباه شود.
  2. در مواقع نامطمئن از .* استفاده کنید
    این علامت نشان‌دهنده هر کاراکتر با هر تعداد تکرار است و در شرایطی که الگوی دقیق مشخص نیست، مفید است.
  3. از فاصله (Space) در Regex پرهیز کنید
    فاصله‌ها به‌عنوان یک کاراکتر در نظر گرفته می‌شوند و می‌توانند الگو را به هم بزنند.
  4. Regex در GA4 نسبت به حروف بزرگ و کوچک حساس است (Case-sensitive)
    یعنی Page با page متفاوت خواهد بود.
  5. GA4 از Regex تا ۲۵۶ کاراکتر پشتیبانی می‌کند
    اگر عبارت شما طولانی‌تر از این مقدار باشد، باید آن را ساده‌سازی کنید.
  6. در صورت استفاده از Regex در تگ‌های سفارشی جاوااسکریپت، از کامنت‌گذاری استفاده کنید
    این کار به خوانایی کد کمک زیادی می‌کند.
  7. Regex‌هایی که با هیچ الگوی مشخصی مطابقت ندارند نسازید
    هدف از Regex شناسایی الگوهاست، نه ایجاد سردرگمی.
  8. Regexهایی که می‌سازید باید با محدودیت‌های نحوی RE2 سازگار باشند
    GA4 از موتور RE2 استفاده می‌کند که نسبت به موتورهای دیگر مثل PCRE محدودیت‌های خاص خود را دارد.
  9. از ساخت دستی Regex پرهیز کنید
    به‌جای آن، از ابزارهای سازنده یا منابع معتبر استفاده کنید.
  10. همیشه Regex خود را در محیط GA4 تست کنید
    تا مطمئن شوید که خروجی دقیقی دارد و داده اشتباهی را فیلتر نمی‌کند.
  11. از گزینه‌های فیلتر داخلی GA4 استفاده کنید
    این گزینه‌ها می‌توانند جایگزین مناسبی برای Regexهای پیچیده باشند و کار را ساده‌تر کنند.

کاربردهای عملی رجکس در آنالیتیکس 4

ردیابی سرچ سایت بدون پارامتر در GA4 (با کمک Regex)

یکی از قابلیت‌های کاربردی در Google Analytics 4، ردیابی خودکار سرچ کاربران در سایت است. این قابلیت زمانی فعال می‌شود که گزینه‌ی Enhanced Measurement را در تنظیمات GA4 روشن کرده باشید.

اما در بعضی سایت‌ها، شرایط به گونه‌ای است که این قابلیت به‌صورت پیش‌فرض کار نمی‌کند…

وقتی URL سرچ، پارامتر ندارد!

در بسیاری از وب‌سایت‌ها، عبارت سرچ‌شده در آدرس صفحه (URL) به‌صورت پارامتر (مثل ?s= یا ?q=) ظاهر می‌شود. GA4 به‌طور خودکار این نوع URLها را تشخیص می‌دهد و سرچ کاربر را ردیابی می‌کند.

اما اگر آدرس سرچ شما به شکل زیر باشد:

https://www.test.com/search/a+b

و نه به شکل مرسوم زیر:

https://www.test.com/?s=a+b

در این صورت، GA4 نمی‌تواند به‌طور پیش‌فرض سرچ را شناسایی کند.

راه‌حل: استفاده از Google Tag Manager و Regex

برای این نوع آدرس‌ها، باید از Google Tag Manager (GTM) استفاده کنید و ردیابی سرچ را به‌صورت دستی تنظیم کنید. در این مسیر، Regex به کمک شما می‌آید.

مراحل تنظیم ردیابی سرچ بدون پارامتر:

  1. وارد محیط GTM شوید.
  2. یک Trigger از نوع Page View بسازید.
  3. در بخش شرط Trigger، از Regex استفاده کنید تا URLهایی مثل /search/ شناسایی شوند.
  4. یک متغیر سفارشی (Custom Variable) بسازید تا عبارت سرچ‌شده را از مسیر URL استخراج کند.
  5. با استفاده از این متغیر، یک Event در GA4 ارسال کنید که نشان‌دهنده‌ی یک سرچ باشد.

⚠️ نکته مهم: نوشتن Regex به‌درستی در این مرحله بسیار حیاتی است، چون در غیر این‌صورت داده‌های اشتباهی ثبت می‌شود.

تنظیمات Referral Exclusion در GA4 با استفاده از Regex

یکی از امکانات کاربردی در Google Analytics 4 این است که شما می‌توانید تعیین کنید چه منابعی به عنوان unwanted referrals شناسایی نشوند.

این قابلیت به شما کمک می‌کند ترافیک‌های ارجاعی ناخواسته (مثل دامنه‌ی سایت خودتان یا درگاه پرداختی مانند PayPal) را از گزارش‌ها حذف کنید و از تحریف داده‌ها جلوگیری نمایید.

وقتی در حال تنظیم List unwanted referrals هستید، می‌توانید از Regular Expressions (Regex) استفاده کنید تا کنترل دقیق‌تری روی دامنه‌هایی که باید نادیده گرفته شوند داشته باشید.

به‌عنوان مثال، ممکن است بخواهید فقط ورودی که از زیر دامنه‌های خاصی از شاپرک یا سایر پلتفرم های پرداخت می‌آیند، از گزارش‌ها حذف شوند.

چگونه این تنظیمات را در GA4 اعمال کنیم؟

  1. وارد محیط Admin در GA4 شوید.
  2. به بخش Data Streams بروید و Property مورد نظر را انتخاب کنید.
  3. در قسمت تنظیمات، به سراغ List unwanted referrals بروید.
  4. روی دکمه افزودن شرط (Add condition) کلیک کنید.
  5. از لیست Match Type، گزینه‌ای مثل Referral domain matches RegEx را انتخاب کنید.
  6. الگوی مورد نظر خود را با استفاده از Regex وارد نمایید.

مثال:
برای حذف دامنه‌هایی که شامل کلمه‌ی shaparak باشند:
.*shaparak.*

با این روش، تمامی آدرس‌هایی که حاوی shaparak باشند (در هر جای دامنه) از گزارش‌ها حذف خواهند شد.

استفاده از Regex در فیلترهای گزارش Exploration در GA4

یکی از امکانات بسیار قدرتمند در Google Analytics 4، استفاده از گزارش‌های Exploration است که به شما امکان تحلیل دقیق‌تر و تعاملی‌تر از داده‌ها را می‌دهد.

یکی از قابلیت‌هایی که در این نوع گزارش‌ها وجود دارد، امکان فیلتر کردن داده‌ها با استفاده از Regular Expressions (Regex) است.

کجا می‌توان از Regex در گزارش Exploration استفاده کرد؟

در زمان ساخت گزارش در بخش Exploration، هنگامی که می‌خواهید فیلتری برای دایمنشن ها اعمال کنید (مثلاً Event Name یا Page Title)، در قسمت match type گزینه‌هایی مانند زیر را خواهید دید:

  • matches regex : برای زمانی که داده دقیقاً با الگوی Regex مطابقت داشته باشد.
  • does not match regex : برای زمانی که داده با الگوی Regex مطابقت نداشته باشد.

استفاده از Regex برای تعریف Content Group

برای ساخت Content Group در GA4، باید مشخص کنید کدام صفحات عضو آن گروه هستند. بهترین راه برای شناسایی صفحات مرتبط، استفاده از Regular Expressions (Regex) است.

فرض کنید می‌خواهید تمام صفحاتی که مربوط به موضوع «Attribution Modelling» هستند را شناسایی کنید.
می‌توانید از این الگوی Regex استفاده کنید:
attribution|model|modelling|online|offline|nonline

این عبارت، تمام URLهایی را که شامل هرکدام از کلمات بالا باشند، به‌عنوان عضو Content Group انتخاب می‌کند.

ساخت Audience در GA4 با استفاده از Regex

در Google Analytics 4، امکان ایجاد و مدیریت Audience یا «مخاطب هدف» یکی از ابزارهای کلیدی برای تقسیم‌بندی کاربران است. شما می‌توانید گروه‌هایی از کاربران را بر اساس ویژگی‌ها، رفتارها و تعاملات آن‌ها در بازه‌های زمانی خاص شناسایی و دسته‌بندی کنید.

Audience در GA4 چیست؟

در GA4، Audience مجموعه‌ای از کاربران است که بر اساس ترکیبی از معیارها (مانند رویدادها، ویژگی‌های کاربر، دستگاه، مسیر خرید و…) در یک بازه زمانی مشخص، در یک گروه قرار می‌گیرند.

این قابلیت به شما امکان می‌دهد رفتار کاربران را بهتر درک کنید و در کمپین‌های تبلیغاتی یا تحلیل‌های پیشرفته، از آن استفاده نمایید.

چرا استفاده از Regex در ساخت Audience مهم است؟

وقتی می‌خواهید یک Audience بسازید یا ویرایش کنید، باید یک یا چند شرط (Condition) برای آن تعریف کنید.
در این مرحله، می‌توانید از Regular Expression (Regex) برای دقیق‌تر شدن فیلترها استفاده کنید.

مثال‌ها:

  • انتخاب کاربرانی که صفحه‌ای با URL خاص باز کرده‌اند
  • کاربران با رویدادهایی که شامل واژه‌ای خاص می‌شود
  • کاربران با منبع ورودی (Source) شامل الگوی مشخص

کاربرد واقعی:

فرض کنید می‌خواهید مخاطبانی را که از کانال‌های زیر آمده‌اند در یک Audience قرار دهید:
facebook|instagram|twitter|linkedin

با استفاده از این عبارت، GA4 تمام کاربرانی را که از هرکدام از این منابع وارد سایت شده‌اند، در یک گروه قرار می‌دهد.

دیدگاهتان را بنویسید

دریافت مشاوره و آموزش

برای دریافت مشاوره نصب و راه اندازی آنالیتیکس 4 و ایونت ترکینگ از طریق گوگل تگ منیجر، از طریق شماره تماس زیر با من در ارتباط باشید.