عبارات منظم (Regular Expressions یا Regex) ابزاری قدرتمند برای تحلیل دادهها در گوگل آنالیتیکس ۴ (GA4) و گوگل تگ منیجر (GTM) هستند. این ابزار به شما امکان میدهد الگوهای پیچیدهای را در دادهها شناسایی کرده و گزارشهای دقیقتر و پیشرفتهتری ایجاد کنید. در این مقاله، به بررسی کاربردهای عملی Regex در آنالیتیکس 4 و GTM میپردازیم و نکات کلیدی برای استفاده بهینه از آنها را ارائه میدهیم.
عبارات منظم در GA4 چیست؟
عبارات منظم مجموعهای از کاراکترها و متاکاراکترها هستند که برای تطبیق الگوها در رشتههای متنی استفاده میشوند. در GA4، از موتور Regex جاوااسکریپت استفاده میشود که به شما امکان میدهد دادهها را با دقت بیشتری فیلتر کنید. به عنوان مثال، Regex میتواند برای شناسایی الگوهای خاص در URLها، دستهبندی محتوا یا فیلتر کردن ترافیک ارجاعی (Referral Traffic) به کار رود.
تفاوت تطبیق کامل و تطبیق جزئی
- تطبیق کامل (Fully Matched Regex): در GA4، به طور پیشفرض از تطبیق کامل استفاده میشود، یعنی Regex باید کل رشته را مطابقت دهد. برای مثال، عبارت /shop/ فقط با رشتهای که دقیقاً /shop/ باشد مطابقت میکند.
- تطبیق جزئی (Partially Matched Regex): برای تطبیق جزئی، باید از متاکاراکترهایی مانند .* استفاده کنید. مثلاً /shop/.* با هر URL که شامل /shop/ باشد مطابقت خواهد داشت.
اجزای عبارات منظم (Regex) در GA4: کاراکترها و متاکاراکترها
عبارات منظم (Regular Expressions یا Regex) در گوگل آنالیتیکس ۴ (GA4) از دو جزء اصلی تشکیل شدهاند: کاراکترها و متاکاراکترها. درک این اجزا برای استفاده بهینه از Regex در تحلیل دادهها و بهینهسازی وبسایت ضروری است.
کاراکترها در Regex
کاراکترها شامل حروف، اعداد و نمادهایی هستند که به صورت مستقیم برای تطبیق الگوها در رشتههای متنی استفاده میشوند. به عنوان مثال، عبارت /shop/ از کاراکترهای s, h, o, و p تشکیل شده که برای شناسایی دقیق مسیرهای وبسایت استفاده میشود. این کاراکترها به شما امکان میدهند الگوهای خاصی را در URLها یا دادههای دیگر ردیابی کنید.
متاکاراکترها در Regex
متاکاراکترها کاراکترهایی با معانی خاص هستند که رفتار تطبیق را کنترل میکنند. این کاراکترها به شما قدرت انعطافپذیری بیشتری در تعریف الگوها میدهند. برخی از متاکاراکترهای رایج عبارتند از:
- ^: نشاندهنده شروع یک رشته (مثلاً ^/blog برای صفحاتی که با /blog شروع میشوند).
- $: نشاندهنده پایان یک رشته.
- .: نماینده هر کاراکتر به جز خط جدید.
- *: نشاندهنده صفر یا بیشتر از الگوی قبلی.
- +: نشاندهنده یک یا بیشتر از الگوی قبلی.
- ?: نشاندهنده صفر یا یک بار از الگوی قبلی.
- |: ایجاد شرط OR منطقی (مثلاً His|Her با His یا Her مطابقت دارد).
- []: تطبیق یک کاراکتر از مجموعه مشخص (مثلاً [a-z] برای حروف کوچک).
متا کاراکترهایی که در GA4 پشتیبانی نمیشوند (و باید از آنها پرهیز کنید)
اگر در حال ساخت Regex برای Google Analytics 4 هستید، باید بدانید که GA4 از موتور RE2 استفاده میکند؛ این یعنی برخی از متا کاراکترهایی که در دیگر موتورهای Regex مثل PCRE یا JavaScript رایج هستند، در GA4 پشتیبانی نمیشوند.
در ادامه لیستی از متا کاراکترهای غیرمجاز در GA4 را میبینید:
لیست کاراکترهای ناسازگار با GA4:
/
(اسلش)
معمولاً برای مشخص کردن شروع و پایان Regex استفاده میشود، اما در GA4 مجاز نیست.!
(علامت تعجب)
برای تعریف حالت “NOT” منطقی بهکار میرود، اما در GA4 پشتیبانی نمیشود.\n
بررسی ورود به خط جدید (New Line).\r
بررسی Carriage Return.\t
بررسی کاراکتر تب (Tab).\s
بررسی فضای خالی (Space).\S
بررسی کاراکتری که فضای خالی نیست.\d
بررسی عدد (Digit).\D
بررسی کاراکری که عدد نیست.\w
بررسی کاراکترهای متنی (Word Character) – در اینجا اشاره شده که به اشتباه برای CR استفاده شده است.\W
بررسی کاراکترهایی که جزو کلمات نیستند.
اصول مهم برای ساخت Regex در GA4
- از نماد “|” (پایپ) با دقت استفاده کنید
این نماد برای “یا” کردن عبارات است. استفاده نادرست میتواند باعث نتایج اشتباه شود. - در مواقع نامطمئن از
.*
استفاده کنید
این علامت نشاندهنده هر کاراکتر با هر تعداد تکرار است و در شرایطی که الگوی دقیق مشخص نیست، مفید است. - از فاصله (Space) در Regex پرهیز کنید
فاصلهها بهعنوان یک کاراکتر در نظر گرفته میشوند و میتوانند الگو را به هم بزنند. - Regex در GA4 نسبت به حروف بزرگ و کوچک حساس است (Case-sensitive)
یعنیPage
باpage
متفاوت خواهد بود. - GA4 از Regex تا ۲۵۶ کاراکتر پشتیبانی میکند
اگر عبارت شما طولانیتر از این مقدار باشد، باید آن را سادهسازی کنید. - در صورت استفاده از Regex در تگهای سفارشی جاوااسکریپت، از کامنتگذاری استفاده کنید
این کار به خوانایی کد کمک زیادی میکند. - Regexهایی که با هیچ الگوی مشخصی مطابقت ندارند نسازید
هدف از Regex شناسایی الگوهاست، نه ایجاد سردرگمی. - Regexهایی که میسازید باید با محدودیتهای نحوی RE2 سازگار باشند
GA4 از موتور RE2 استفاده میکند که نسبت به موتورهای دیگر مثل PCRE محدودیتهای خاص خود را دارد. - از ساخت دستی Regex پرهیز کنید
بهجای آن، از ابزارهای سازنده یا منابع معتبر استفاده کنید. - همیشه Regex خود را در محیط GA4 تست کنید
تا مطمئن شوید که خروجی دقیقی دارد و داده اشتباهی را فیلتر نمیکند. - از گزینههای فیلتر داخلی GA4 استفاده کنید
این گزینهها میتوانند جایگزین مناسبی برای Regexهای پیچیده باشند و کار را سادهتر کنند.
کاربردهای عملی رجکس در آنالیتیکس 4
ردیابی سرچ سایت بدون پارامتر در GA4 (با کمک Regex)
یکی از قابلیتهای کاربردی در Google Analytics 4، ردیابی خودکار سرچ کاربران در سایت است. این قابلیت زمانی فعال میشود که گزینهی Enhanced Measurement را در تنظیمات GA4 روشن کرده باشید.
اما در بعضی سایتها، شرایط به گونهای است که این قابلیت بهصورت پیشفرض کار نمیکند…
وقتی URL سرچ، پارامتر ندارد!
در بسیاری از وبسایتها، عبارت سرچشده در آدرس صفحه (URL) بهصورت پارامتر (مثل ?s=
یا ?q=
) ظاهر میشود. GA4 بهطور خودکار این نوع URLها را تشخیص میدهد و سرچ کاربر را ردیابی میکند.
اما اگر آدرس سرچ شما به شکل زیر باشد:
https://www.test.com/search/a+b
و نه به شکل مرسوم زیر:
https://www.test.com/?s=a+b
در این صورت، GA4 نمیتواند بهطور پیشفرض سرچ را شناسایی کند.
راهحل: استفاده از Google Tag Manager و Regex
برای این نوع آدرسها، باید از Google Tag Manager (GTM) استفاده کنید و ردیابی سرچ را بهصورت دستی تنظیم کنید. در این مسیر، Regex به کمک شما میآید.
مراحل تنظیم ردیابی سرچ بدون پارامتر:
- وارد محیط GTM شوید.
- یک Trigger از نوع Page View بسازید.
- در بخش شرط Trigger، از Regex استفاده کنید تا URLهایی مثل
/search/
شناسایی شوند. - یک متغیر سفارشی (Custom Variable) بسازید تا عبارت سرچشده را از مسیر URL استخراج کند.
- با استفاده از این متغیر، یک Event در GA4 ارسال کنید که نشاندهندهی یک سرچ باشد.
⚠️ نکته مهم: نوشتن Regex بهدرستی در این مرحله بسیار حیاتی است، چون در غیر اینصورت دادههای اشتباهی ثبت میشود.
تنظیمات Referral Exclusion در GA4 با استفاده از Regex
یکی از امکانات کاربردی در Google Analytics 4 این است که شما میتوانید تعیین کنید چه منابعی به عنوان unwanted referrals شناسایی نشوند.
این قابلیت به شما کمک میکند ترافیکهای ارجاعی ناخواسته (مثل دامنهی سایت خودتان یا درگاه پرداختی مانند PayPal) را از گزارشها حذف کنید و از تحریف دادهها جلوگیری نمایید.
وقتی در حال تنظیم List unwanted referrals هستید، میتوانید از Regular Expressions (Regex) استفاده کنید تا کنترل دقیقتری روی دامنههایی که باید نادیده گرفته شوند داشته باشید.
بهعنوان مثال، ممکن است بخواهید فقط ورودی که از زیر دامنههای خاصی از شاپرک یا سایر پلتفرم های پرداخت میآیند، از گزارشها حذف شوند.
چگونه این تنظیمات را در GA4 اعمال کنیم؟
- وارد محیط Admin در GA4 شوید.
- به بخش Data Streams بروید و Property مورد نظر را انتخاب کنید.
- در قسمت تنظیمات، به سراغ List unwanted referrals بروید.
- روی دکمه افزودن شرط (Add condition) کلیک کنید.
- از لیست Match Type، گزینهای مثل Referral domain matches RegEx را انتخاب کنید.
- الگوی مورد نظر خود را با استفاده از Regex وارد نمایید.
مثال:
برای حذف دامنههایی که شامل کلمهی shaparak باشند:.*shaparak.*
با این روش، تمامی آدرسهایی که حاوی shaparak باشند (در هر جای دامنه) از گزارشها حذف خواهند شد.
استفاده از Regex در فیلترهای گزارش Exploration در GA4
یکی از امکانات بسیار قدرتمند در Google Analytics 4، استفاده از گزارشهای Exploration است که به شما امکان تحلیل دقیقتر و تعاملیتر از دادهها را میدهد.
یکی از قابلیتهایی که در این نوع گزارشها وجود دارد، امکان فیلتر کردن دادهها با استفاده از Regular Expressions (Regex) است.
کجا میتوان از Regex در گزارش Exploration استفاده کرد؟
در زمان ساخت گزارش در بخش Exploration، هنگامی که میخواهید فیلتری برای دایمنشن ها اعمال کنید (مثلاً Event Name یا Page Title)، در قسمت match type گزینههایی مانند زیر را خواهید دید:
matches regex
: برای زمانی که داده دقیقاً با الگوی Regex مطابقت داشته باشد.does not match regex
: برای زمانی که داده با الگوی Regex مطابقت نداشته باشد.
استفاده از Regex برای تعریف Content Group
برای ساخت Content Group در GA4، باید مشخص کنید کدام صفحات عضو آن گروه هستند. بهترین راه برای شناسایی صفحات مرتبط، استفاده از Regular Expressions (Regex) است.
فرض کنید میخواهید تمام صفحاتی که مربوط به موضوع «Attribution Modelling» هستند را شناسایی کنید.
میتوانید از این الگوی Regex استفاده کنید:attribution|model|modelling|online|offline|nonline
این عبارت، تمام URLهایی را که شامل هرکدام از کلمات بالا باشند، بهعنوان عضو Content Group انتخاب میکند.
ساخت Audience در GA4 با استفاده از Regex
در Google Analytics 4، امکان ایجاد و مدیریت Audience یا «مخاطب هدف» یکی از ابزارهای کلیدی برای تقسیمبندی کاربران است. شما میتوانید گروههایی از کاربران را بر اساس ویژگیها، رفتارها و تعاملات آنها در بازههای زمانی خاص شناسایی و دستهبندی کنید.
Audience در GA4 چیست؟
در GA4، Audience مجموعهای از کاربران است که بر اساس ترکیبی از معیارها (مانند رویدادها، ویژگیهای کاربر، دستگاه، مسیر خرید و…) در یک بازه زمانی مشخص، در یک گروه قرار میگیرند.
این قابلیت به شما امکان میدهد رفتار کاربران را بهتر درک کنید و در کمپینهای تبلیغاتی یا تحلیلهای پیشرفته، از آن استفاده نمایید.
چرا استفاده از Regex در ساخت Audience مهم است؟
وقتی میخواهید یک Audience بسازید یا ویرایش کنید، باید یک یا چند شرط (Condition) برای آن تعریف کنید.
در این مرحله، میتوانید از Regular Expression (Regex) برای دقیقتر شدن فیلترها استفاده کنید.
مثالها:
- انتخاب کاربرانی که صفحهای با URL خاص باز کردهاند
- کاربران با رویدادهایی که شامل واژهای خاص میشود
- کاربران با منبع ورودی (Source) شامل الگوی مشخص
کاربرد واقعی:
فرض کنید میخواهید مخاطبانی را که از کانالهای زیر آمدهاند در یک Audience قرار دهید:facebook|instagram|twitter|linkedin
با استفاده از این عبارت، GA4 تمام کاربرانی را که از هرکدام از این منابع وارد سایت شدهاند، در یک گروه قرار میدهد.