Google Analytics không cần phải bàn cãi gì nữa chính là công cụ đo lường phổ biến nhất hiện nay với khả năng thu lại được toàn bộ các hoạt động của người dùng trên website và cung cấp cho bạn những báo cáo khá chi tiết. Cũng như mọi loại công cụ tracking khác, Google Analytics chỉ có thể cung cấp cho bạn các con số, các dữ liệu và việc bạn rút ra những nhận định gì từ các thông tin này là việc của bạn.
Tuy nhiên, vấn đề ở đây là có rất nhiều người hiện đang hiểu một cách không đầy đủ về ý nghĩa của các dữ liệu được cung cấp đó và việc này có thể dẫn đến việc đưa ra các quyết định sai lầm khi đánh giá. Bài viết này nêu ra tất cả những lý do tại sao các số liệu của công cụ đo lường Google Analytics không chính xác hoặc bị hiểu sai và cách để xử lý, hạn chế những vấn đề này.
Google Analytics hoạt động như thế nào?
Tuy nhiên đầu tiên chúng ta nên hiểu sơ lược qua cách thức hoạt động và thu thập dữ liệu của Google Analytics. Điều này cần thiết để chúng ta có thể hiểu việc tại sao một số dữ liệu, thông số lại phát sinh sự sai lệch như vậy. Dưới đây là sơ đồ về cách thức hoạt động của Google Analytics:
(1) Khi set up Google Analytics bạn sẽ cần cài đặt 1 đoạn code Javascript vào website của bạn. Đoạn code này hiện diện ở trang web nào của website bạn thì nó có thể thu thập các data ở trên trang đó.
(2) Khi người dùng truy cập vào website thông qua các thiết bị như máy tính, điện thoại bằng các trình duyệt thì lúc này một số thông tin như việc người dùng đến từ đâu, sử dụng trình duyệt gì, thiết bị gì để truy cập, v.v… sẽ được thu thập. Một số website cũng sẽ để lại cookies (nôm na là một file lưu trữ các hoạt động, hành vi của người dùng trên website đó) trên thiết bị của người dùng.
(3) Các thông tin thu thập được từ người dùng khi truy cập vào website, khi này là các dữ liệu thô (raw data), sẽ được đóng gói và gửi về server của Google Analytics.
(4) Khi các thông tin đã được nhận tại server thì tiếp theo các chúng sẽ được xử lý, phân tích. Đây là bước mà sẽ biến những dữ liệu thô thành thông tin mà có thể có ích cho người dùng.
(5) Sau khi các thông tin đã được phân tích, chúng sẽ được đưa vào cơ sở dữ liệu và được áp lên những filters, những settings do người dùng thiết lập. Một khi data đã được đưa vào database thì không thể nào thay đổi được nữa. Đó là lý do vì sao mỗi khi bạn có những thay đổi gì đó về filters, settings trên Google Analytics thì những dữ liệu cũ sẽ không thay đổi mà chỉ có dữ liệu mới nhận vào mới vậy.
(6) Lúc này các dữ liệu đã được xử lý sẽ được gửi tới phần report của Google Analytics, chính là những gì bạn sẽ thấy trên google.com/analytics.
Cũng không quá khó hiểu phải không?
Vậy lúc này điều gì có thể khiến các dữ liệu mà bạn thấy trên Google Analytics không chính xác? Có rất nhiều nguyên nhân, chủ quan lẫn khách quan sẽ được nêu ra dưới đây:
Hiểu không đầy đủ ý nghĩa của các nguồn traffic trong báo cáo
Đây là vấn đề thường thấy nhất mà đa phần mọi người đều mắc phải. Các báo cáo về nguồn traffic mặc định được thiết lập để giúp người quản trị web biết được người dùng đến website của bạn bằng cách nào và từ đâu. Có các mảng traffic chính trong report của Google Analytics bao gồm:
Các nguồn traffic này như bạn thấy có thể bao gồm: Display, Paid Search, Organic Search, Direct, Referral, Social, Email và (Other). Và dưới đây là cách mà các nguồn traffic này thường được hiểu:
Organic Search: người dùng đến website từ các bộ máy tìm kiếm (Google, Yahoo, Bing, v.v…) thông qua kết quả tìm kiếm tự nhiên (organic).
Paid Search: người dùng đến website từ các quảng cáo trên kết quả tìm kiếm.
Display: người dùng đến website từ các quảng cáo banner trên các website thuộc display ad network.
Referral: người dùng đến website bằng cách bấm vào các đường link từ các trang web khác.
Social: người dùng đến website thông qua các kênh mạng xã hội như Facebook, Google+, LinkedIn, v.v…
Email: người dùng đến website bằng cách bấm các đường link trong email.
Direct: người dùng đến website bằng cách gõ địa chỉ web vào trình duyệt hoặc mở bookmark.
(Other): người dùng đến website bằng các nguồn traffic khác không nằm trong các kênh phía trên.
Nhưng có lẽ bạn sẽ ngạc nhiên nếu biết rằng nếu chỉ hiểu theo ý nghĩa bên trên thì bạn sẽ đa phần là hiểu không đầy đủ những gì các dữ liệu này đang đưa ra và đôi khi một nửa sự thật thì không còn là sự thật nữa. Trên thực tế có rất nhiều nguồn traffic đang bị sắp xếp sai mục, không đầy đủ và lẫn lộn trong report của Google Analytics.
Yes, khi xem report của Google Analytics và nhìn vào các kênh traffic, thì đây là cách bạn nên hiểu:
Organic Search: người dùng đến website từ các bộ máy tìm kiếm thông qua kết quả tìm kiếm tự nhiên mà Google Analytics có thể nhận diện được và thực chất một phần organic traffic lại là direct traffic và ngược lại.
Paid Search: người dùng đến từ các quảng cáo trên kết quả tìm kiếm nếu được gắn code tracking đầy đủ, một phần traffic có thể nằm bên referral và direct traffic.
Display: người dùng đến từ các quảng cáo banner trên các website thuộc display ad network nếu được gắn code tracking đầy đủ, một phần traffic có thể nằm bên referral và direct traffic.
Referral: người dùng đến website bằng cách bấm vào các đường link từ các trang web khác đôi khi có thể bao gồm traffic từ các social networks, email và các kênh quảng cáo (cả paid search và display).
Social: người dùng đến website thông qua các kênh mạng xã hội mà Google có thể nhận diện được.
Email: người dùng đến website bằng cách bấm các đường link trong email có gắn code tracking.
Direct: các nguồn traffic không xác định được nguồn gốc đều sẽ được đưa vào đây.
(Other): các nguồn traffic có source / medium tuy nhiên Google Analytics không biết phân chia vào đâu sẽ được đưa vào đây.
Đấy, rõ ràng các nguồn traffic về thực chất không phải như bạn thấy và không phải lúc nào cũng đúng như tên gọi của nó. Khi phân tích và đánh giá dựa trên những con số được cung cấp, chúng ta nên hiểu rõ là thực chất sẽ luôn có những “hạt sạn” trong mớ data đó. Các “hạt sạn” này to hay nhỏ thì còn tùy vào nhiều yếu tố và chúng ta hãy cùng xem qua dưới đây.
Organic Search
Organic search traffic được biểu thị trong Google Analytics là Organic Search (phần Overview) hoặc medium là organic (trong source / medium). Nguồn traffic này có một số yếu tố sau đây chi phối mà bạn cần chú ý.
1. Branded vs non-branded
Organic search traffic bao gồm cả các branded traffic, tức là các traffic mà từ khóa mà người dùng sử dụng để tìm kiếm có chứa tên thương hiệu trong đó. Ví dụ brand ở đây là Wall Street English và thay vì tìm kiếm với từ khóa chung chung là “học tiếng Anh” thì người dùng có thể tìm kiếm bằng từ khóa “học tiếng Anh Wall Street English” và bấm vào kết quả tìm kiếm tự nhiên để vào website. Lúc này về mặt kỹ thuật, các traffic này vẫn là search traffic nhưng về mặt bản chất thì người dùng đã biết đến Wall Street English từ trước và họ tìm kiếm với mục đích là để đến website của brand này chứ không phải để tìm kiếm sự lựa chọn nữa. Và branded traffic thường có xu hướng gia tăng khi nhận diện thương hiệu của brand được gia tăng (thông qua các hoạt động quảng cáo, branding, PR) chứ không liên quan nhiều đến kết quả thứ hạng các từ khóa và hoạt động SEO. Một số khách hàng và công ty mà tôi đã có dịp tư vấn qua thì organic traffic của họ tăng trưởng đều đều nhưng sau khi kiểm tra lại thì thực chất phần tăng trưởng đó là branded traffic và phần này có khi chiếm tới 80% tổng số organic traffic. Lúc này thực chất, từ khóa duy nhất mà các công ty này đang rank có lẽ chỉ là tên thương hiệu của họ.
Giải pháp
Vì các lý do nêu trên, các branded traffic nên được xem như là direct traffic thì sẽ chính xác hơn về mặt ý nghĩa để đánh giá và phân tích. Trong Google Analytics nên thiết lập một segment để đo lường branded traffic và non-branded traffic riêng biệt để có đánh giá chính xác hơn về tình hình thực sự của organic traffic mà không bị ảnh hưởng bởi người dùng tìm kiếm về thương hiệu.
Cách thiết lập segment cho Branded Traffic: vào mục Organic Search trong Channels, phía trên cái graph sẽ có dòng Add Segment, bấm vào đó. Sau đó bấm New Segment, đặt tên là Branded Organic Traffic hay đại loại, trong bảng đó bấm vào Traffic Sources, khung medium chọn contains sau đó gõ vào “organic”. Sau đó trong phần Conditions bên dưới trong khung đầu tiên chọn “Keyword”, khung thứ hai chọn “contains” sau đó phần khung còn lại điền vào brand của mình. Nếu brand có nhiều cách gọi hoặc cách gõ thì tốt nhất nên nhập hết bao gồm cả typo, ví dụ “wall street english”, “wse”, “wallstreet english”, “wsenglish”. Sau đó bấm Save là xong.
2. Một phần direct traffic có thể là organic traffic
Google Analytics thường xác định visits thuộc về nguồn traffic nào dựa vào referrer, tuy nhiên vì một lý do nào đó mà referrer này lại bị mất dẫn đến việc các traffic đó sẽ bị xếp loại vào direct traffic. Vậy bao nhiêu organic traffic hiện đang bị tính vào direct traffic? Một nghiên cứu được tiến hành bởi Gene McKenna – Product Manager của Groupon đã cho thấy rằng có thể có tới 60% direct traffic của bạn hiện tại là organic. Con số đó có thể chỉ là trong trường hợp của Groupon, một trang deal / e-commerce, tùy theo tình trạng website của bạn như thế nào, số lượng organic traffic của bạn bị lẫn trong direct traffic có thể nằm trong khoản 20% – 80%.
Giải pháp
Kiểm tra trong phần direct traffic của report và chú ý tới các URLs dài, khó nhớ và khó có khả năng người dùng gõ trực tiếp vào trình duyệt hoặc bookmark, chúng nhiều khả năng không phải là direct traffic mà chính là organic traffic.
3. Không phải tất cả search engines đều bình đẳng
Google mặc định sẽ nhận diện được các organic traffic từ Google (yeah, duh) và các search engines lớn như Bing, Yahoo, Baidu, v.v… Tuy nhiên một số search engines nhỏ hơn, đặc biệt là các search engines nội địa như Coccoc.com, Wada.vn hoặc Laban.vn thì sẽ lại không nằm trong phần organic mà bị lẫn vào trong kênh referral.
Giải pháp
Bạn có thể set up để add các bộ máy tìm kiếm vào danh sách các nguồn organic traffic. Vào phần Admin của Google Analytics > Property > Tracking Info > Organic Search Sources và bấm Add Search Engine sau đó điền các thông số tương ứng. Ví dụ: domain name là domain của search engine và query parameter là phần trước dấu “=” trong kết quả tìm kiếm của search engine đó, trường hợp của Wada.vn là “q”.
4. Đa phần organic keywords đã bị ẩn
Trong Google Analytics trước đây bạn từng có thể xem được những từ khóa nào người dùng đã sử dụng để đến website của bạn, tuy nhiên từ nằm 2011 Google dần dần che mất các từ khóa này với lý do là bảo mật và privacy cho người dùng. Hiện nay nếu có ai đang logged in vào tài khoản Google và search từ khóa nào đó để đến website của bạn thì từ khóa đó sẽ bị đưa vào nhóm “not provided”. Hiện nay số từ khóa nằm trong nhóm “not provided” đã lên đến hơn 90% tổng số từ khóa. Điều này chắc chắn gây khó khăn cho người dùng trong quá trình phân tích về organic traffic của website.
Giải pháp
Hiện nay không có cách nào để xử lý vấn đề này trừ việc bạn bỏ tiền vào quảng cáo Paid Search để có thể biết được người dùng tìm kiếm các từ khóa gì để đến website của bạn. Bạn cũng có thể connect Google Analytics với Google Search Console (trước đây là Webmaster Tool) để có một số thông tin về search queries trong phần SEO. Tuy nhiên lưu ý rằng keywords và search queries về cơ bản vẫn khác nhau và search queries là data lấy từ Search Console nên không có liên quan với các data khác trong Google Analytics.
Paid Search & Display
Paid Search và Display là 2 nguồn traffic quảng cáo chính được mặc định trong Google Analytics với Paid Search là traffic đến từ các kết quả quảng cáo của các search engines như Google, Bing, Yahoo và Display là traffic từ các banner quảng cáo của Google Display Network hay các ad networks khác. Một số vấn đề về số liệu có thể thường gặp với 2 nguồn traffic này:
1. Khác biệt về số giữa Google Analytics và các hệ thống quảng cáo
Nếu có so sánh bạn sẽ thấy chỉ số đo đạc về số clicks hoặc số conversion giữa Google Analytics và các hệ thống quảng cáo khác thường lúc nào cũng khác nhau, ngay cả Adwords cũng không ngoại lệ. Điều này đôi khi gây khó khăn cho người làm quảng cáo vì không biết chỉ số nào là đúng và vì sao lại phát sinh sự khác biệt như vậy. Sự khác biệt về dữ liệu này thường đến từ sự khác nhau trong cơ cấu tracking của Google Analytics và các hệ thống quảng cáo. Dưới đây là một số nguyên nhân chủ đạo:
– Clicks và sessions là 2 chỉ số khác nhau: các hệ thống quảng cáo thường tính clicks, trong khi Google Analytics lại tính theo sessions. Ví dụ một sessions trong vòng 10 phút của 1 người có thể bao gồm 2 clicks. Adwords có thể ghi nhận 2 clicks nhưng Google Analytics thì chỉ ghi nhận 1 session thôi.
– Cơ chế tracking: Google Analytics thường dựa vào last click để attribute một conversion, trong khi đó thì Adwords và các hệ thống quảng cáo thường sử dụng cookies để xác định một conversion. Ví dụ nếu 1 người click vào banner GDN sau đó lại vào website bằng organic search sau đó mới thực hiện hành vi mua hàng thì lúc này Google Analytics sẽ tính conversion đó cho organic search trong khi đó Adwords lại sẽ tính conversion đó cho GDN.
– Filter clicks: mỗi hệ thống có một cách để filter và chống trùng lặp các clicks khác nhau dựa vào mật độ clicks, IPs, cookies hoặc các yếu tố khác nhau nên cũng có thể dẫn đến sự khác biệt.
– Độ dài ngắn khác nhau trong thời hạn của cookie cũng có thể ảnh hưởng đến sự khác biệt thông số giữa 2 hệ thống.
Giải pháp
Không có cách nào để loại bỏ sự khác biệt về số liệu trong cả 2 hệ thống. Giải pháp thường thấy là lựa chọn một hạn mức khác biệt tối đa hợp lý giữa Google Analytics và các kênh quảng cáo để thống nhất trước khi chạy để tránh vấn đề về thanh toán sau khi kết thúc chiến dịch (nếu làm việc với bên thứ 3).
Xem thêm: Làm sao để tối ưu hóa quảng cáo hiệu quả hơn
2. Một số traffic quảng cáo có thể bị lọt vào referral, direct
Các traffic quảng cáo paid search và display đôi khi có khả năng sẽ bị gán vào nguồn như referral hoặc direct với lý do tương tự như organic search: mất referrer (lý do tại sao referrer bị mất chúng ta sẽ có câu trả lời bên dưới) hoặc do do code tracking UTM bị thiếu, sai.
Giải pháp
Nếu chạy Adwords thì kết nối Adwords với Google Analytics và kích hoạt tính năng auto-tagging, với các kênh quảng cáo khác thì sử dụng URL Builder để gắn code tracking đầy đủ tất cả các đường links quảng cáo dẫn đến website. Lưu ý giải pháp này chỉ giảm thiểu tình trạng trên chứ không giải quyết dứt điểm được.
Referral
Referral về bản chất chứa tất cả những traffic đến từ những domains khác với website đang được đo lường. Do đó trong referral sẽ chứa các nguồn traffic sau: các kênh quảng cáo như banners trên các website, links trên các website khác, các kênh mạng xã hội, emails, bộ máy tìm kiếm và đôi khi traffic đến từ chính các trang trong website của bạn.
1. Traffic từ các trang mạng xã hội
Mạng xã hội ngày nay đóng một vai trò quan trọng trong việc mang traffic đến website của bạn và ắt hẳn bạn sẽ muốn phân tích các chỉ số của traffic từ mạng xã hội một cách riêng lẽ. Nhưng hiện nay traffic từ các mạng xã hội nếu không được gắn code tracking một cách đầy đủ thì sẽ vẫn mặc định vào kênh referral hoặc đôi khi direct. Google hiện đang cố gắng phân loại các social traffic tốt hơn tuy nhiên hiện giờ vẫn chưa hoàn hảo được.
Giải pháp
Các links từ các mạng xã hội về website nên được gắn code tracking đầy đủ để có thể dễ tracking hơn. Một số công cụ quản trị mạng xã hội như Hootsuite có tính năng gắn code tracking tất cả các links một cách tự động khi schedule nội dung.
Vào phần Social Settings để add các nguồn Social vào và giúp Google phân loại tốt hơn.
2. Traffic từ email trên trình duyệt
Traffic từ email mở ra từ trình duyệt như GMail, Yahoo, Hotmail, v.v… mặc định đều sẽ nằm trong phần referral dù rằng có thể bạn sẽ muốn track các nguồn traffic email này một cách riêng biệt.
Giải pháp
Gắn code tracking cho tất cả các link tới website trong các email để đảm bảo tracking cho traffic từ nguồn này. Một số công cụ gửi email của hãng thứ 3 như MailChimp, BenchmarkEmail có hỗ trợ tự động gắn các tracking code cho các links này.
3. Self-referral
Đôi khi bạn sẽ thấy traffic từ chính domain của mình nằm trong phần referral. Rõ ràng là có gì đó không đúng vì thực chất referral chỉ chứa các URLs từ các domain khác đến website của bạn chứ không được chứa traffic từ các trang trong domain. Việc này có thể khiến cho dữ liệu referral của bạn bị không chính xác. Trường hợp này này thường xảy ra khi:
a. Javascript redirect: nếu bạn vừa migrate website và sử dụng Javascript để redirect domain cũ sang domain mới thì có khả năng sẽ gây ra self-referral.
b. Google Analytics cookies bị mất: nếu vì lý do gì đó mà Google Analytics cookies bị mất trong quá trình chuyển dịch giữa các trang cũng có thể gây ra tình trạng self-referral.
c. Cross-domain: nếu website có nhiều sub-domain ví dụ như abc.com có 1.abc.com và 2.abc.com thì bạn sẽ thấy các sub-domains này xuất hiện trong referral.
Giải pháp
Tất cả các vấn đề trên đa phần đều có cách để giải quyết:
a. Thay vì sử dụng Javascript Redirect thì sử dụng server-side redirect (301) sẽ tốt hơn.
b. Tìm hiểu nguyên nhân xem tại trang nào Google Analytics cookies lại bị mất và tại sao bằng cách vào Behavior > Site Content > Landing Pages và filter source bằng secondary dimension để tìm ra trang đó và kiếm cách giải quyết.
c. Thiết lập cross-domain tracking để tracking traffic dễ dàng giữa các domain với nhau. Hướng dẫn nếu xài Google Tag Manager và nếu không xài Google Tag Manager. Không đơn giản, nhưng cần phải làm.
Direct
Nếu bạn nghĩ rằng các kênh kia là đã lộn xộn thì chắc có lẽ bạn chưa biết bên trong direct có gì. Direct traffic không chỉ là khi người dùng gõ vào địa chỉ website mà còn bao gồm tất cả các nguồn traffic khác mà Google Analytics không xác định rõ nguồn gốc:
Như đã nói ở bên trên, một phần traffic từ các mạng xã hội cũng có thể bị gộp vào trong mảng direct nếu như các vì lý do gì đó referrer bị mất khi click từ mạng xã hội qua website.
Giải pháp
Chưa có giải pháp nào triệt để vì từ phía bạn có thể add tracking code đầy đủ cho các post trên mạng xã hội của bạn nhưng bạn không thể bắt tất cả followers, fans và những người khác làm như vậy.
2. Traffic từ các ứng dụng mobile
Các click từ các ứng dụng mobile sẽ được đưa vào dạng direct nếu không gắn tracking code đầy đủ. Một phần traffic từ ứng dụng mobile cũng sẽ bị đưa vào direct vì mất referrer.
Giải pháp
Tương tự như social, chưa có giải pháp triệt để vì dù ứng dụng của bạn có được tag tracking code đầy đủ thì không đảm bảo clicks từ các ứng dụng khác cũng sẽ như vậy.
3. Traffic từ các email clients như Outlook
Các links trong các email client như Outlook hoặc Thunderbird nếu được bấm vào sẽ vào phần direct traffic nếu không được tag tracking code đầy đủ.
Giải pháp
Tag tracking code đầy đủ cho các links trong email template.
4. Traffic offline ví dụ như pdf, powerpoint và word docs
Các links trong các documents offline như pdf, powerpoint và file words cũng thường là một phần trong mớ direct traffic.
Giải pháp
Nếu các files đó thuộc quyền của bạn thì nên tag một cách đầy đủ các links với tracking code.
5. Sai campaign code
Các tracking code nếu vì lý do gì đó mà sai (gõ sai, gõ nhầm) sẽ khiến Google Analytics không nhận diện được và các traffic đó cũng sẽ bị đưa vào direct traffic.
Giải pháp
Đừng sai sót khi tạo tracking code. Sử dụng URL Builder để đảm bảo chính xác.
6. Code Google Analytics bị thiếu
Nếu vì lý do gì đó một trang trên website của bạn bị thiếu mất tag Google Analytics thì những traffic đến trang đó và từ trang đó đi các trang khác sẽ bị xem là direct.
Giải pháp
Đảm bảo tất cả các trang đều có tracking code. Có thể dùng ứng dụng như Screaming Frog SEO Spider để check tất cả các trang xem có bị thiếu code hay không.
7. Traffic từ chính bạn
Có thể bạn không nghĩ đến nhưng traffic từ chính team của bạn, công ty của bạn đôi khi cũng có thể gây ảnh hưởng đến mức độ chính xác của nguồn direct. Nếu công ty bạn có 500 người và mỗi ngày mỗi người vào website của bạn một vài lần thì cũng có thể phần nào gây ra sự không chính xác về thông số. Việc này về lâu dài cho thể khiến các thông số của bạn bị chệch đi nhiều.
Giải pháp
Lọc bỏ các traffic đến từ các IPs của mạng công ty. Vào Account > All Filters và tạo new filters để lọc traffic đến từ 1 IPs nào đó. Nếu công ty có nhiều IPs thì phải tạo 1 filter cho mỗi IP đó.