Cách thức hoạt động, thu thập dữ liệu của google analytics thông qua website

Cách thức hoạt động, thu thập dữ liệu của google analytics thông qua website

Các công cụ phân tích web có 1 số phương pháp thu thập dữ liệu người dùng cơ bản. Cổ xưa nhất là phương pháp truy cập nhật kí tương tác giữa người dùng và website (log file) được lưu trên server của website đó. Các công cụ phân tích web khai thác dữ liệu theo cách này (Awstats, Weblog Expert, …) sẽ truy cập vào server của website và tổng hợp nhật kí web rồi hiển thị cho người phân tích theo 1 cách rõ ràng, dễ nhìn, dễ sử dụng.

1. Cách Hoạt Động Google Analytics

 

Google Analytics thì không thuộc dạng công cụ phân tích logfile. Google Analytics theo phương pháp thu thập dữ liệu thông qua trình duyệt. Ngay khi người dùng tương tác với website bằng trình duyệt của họ thì trình duyệt sẽ gửi các thông tin tương tác đó về cho Google Analytics. Trình duyệt của người dùng thực hiện các thao tác gửi thông tin này theo mệnh lệnh của 1 đoạn code “chỉ thị” (dạng javascript) được gắn trên website. Do đó, phương pháp này được gọi là Javascript tagging.

Thế thì sau khi về đến tay Google, các dữ liệu này sẽ đi tiếp như thế nào trong ‘nhà máy’ của Google Analytics?

cách hoạt động của google analytics

1 bộ phận gọi là GA collector sẽ nhận các dữ liệu đó và nó sẽ lưu trữ chúng dưới dạng các cú “hit” riêng lẻ và các “session” của các “hit” đó. Ở đây, chúng được lưu trữ gần như là 1 bộ cơ sở dữ liệu (database) nhưng theo một cách cho phép xử lý và tính toán phân phối hiệu quả nhất (efficient processing & distributed computation).

Sau đó, họ sẽ tính toán trước các dữ liệu này để cho ra các bảng, cột, các báo cáo mà họ nghĩ rằng người dùng sẽ quan tâm nhất để chúng sẵn có cho người dùng xem chỉ trong tic tắc sau 1 cái click chuột. Vì vậy, khi người dùng thực hiện 1 yêu cầu trên giao diện (UI – user interface) của Google Analytics, thì yêu cầu đó sẽ được gửi về cho Query Engine (trên hình là ? Engine) của Google Analytics. Query Engine biết rõ phải tìm dữ liệu ở đâu (ở các dữ liệu tính toán sẵn hay ở bộ dữ liệu thô) là nhanh nhất để thõa mãn yêu cầu của người dùng. Nó tìm và đáp trả lại thông tin cho người dùng trên giao diện của GA.

Trong các chức năng của GA có chức năng Custom Report giúp người dùng tự đưa ra các kiểu báo cáo theo ý mình, ngoài các báo cáo có sẵn của GA. Khi người dùng thực hiện chức năng này, thì nó cũng sẽ gửi yêu cầu về Query Engine. Lúc này Query Engine cũng sẽ tìm trên các dữ liệu tính toán sẵn, nếu không có, chúng sẽ được chuyển qua bộ dữ liệu thô rồi tính toán xếp thành bảng cột, trả kết quả lại cho người dùng. Do đó ta thấy với các bảng báo cáo Custom Report, thời gian xử lý có khi lâu hơn 1 chút hoặc nhiều tùy theo mức độ phức tạp của yêu cầu.

Đến phiên Export API cũng có cùng 1 khả năng truy cập vào Query Engine và cùng khả năng thọc sâu vào nhiều khu vực dữ liệu khác nhau. Tuy nhiên với API, người dùng sẽ không gắn kết với các kiểu bảng cột hay giao diện sẵn có của GA mà lấy dữ liệu từ GA về để tích hợp với cách tính toán thống kê riêng, hoặc với 1 giao diện của riêng. Từ đó họ có khả năng giải quyết những câu hỏi mà Custom Report hoặc basic UI Report chưa trả lời rõ ràng được cho họ.

2. Cách Thu Thập Thông Tin Google Analytics

 

hi đã hiểu rõ các khái niệm visit, pageview, visitor và các cookie rất cơ bản mà GA dùng như  utma, utmb, utmc … giờ là lúc tìm hiểu rõ hơn cách mà GA thu thập thông tin và truyễn dữ liệu từ trình duyệt của bạn về đến server của GA.

Nền tảng cho các bảng báo cáo trên công cụ Google analytics -  Gif request

Mỗi lần bạn xem 1 pageview, đoạn mã GA trên trang đó sẽ chỉ thị cho trình duyệt gửi đến server GA yêu cầu 1 file gif:

thu thập thông tin từ google analytics

-         yêu cầu này có dạng là 1 query string, thực chất các thông tin trên trình duyệt, pageview, … được bỏ trong cái “gói” query string này đưa cho server.

-         cái file gif kia có tên là __utm.gif, thực chất chỉ là 1 file ảnh 1 pixel trắng trơn nhỏ xíu, mang tính hình thức, mục đích chính là gửi được thông tin bỏ trong query string kia về cho server của GA.

Như thế mỗi lần bạn xem 1 trang trên 1 website hay thực hiện 1 event, GA server sẽ nhận được 1 “gói” thông tin đơn lẻ và trữ  chúng trong log file của GA

Như vậy toàn bộ các dữ liệu trên sẽ được ‘cất’ ngay ngắn vào trong bộ dữ liệu khổng lồ của GA, phục vụ cho việc xử lý dữ liệu và báo cáo khi người chủ website yêu cầu GA báo cáo.

Nguồn: Tổng Hợp INTERNET

Tư vấn khác:

0902.804.084