Dữ liệu hành vi người dùng như là một tín hiệu xếp hạng

Thảo luận trong 'Tối ưu hóa On-Page' bắt đầu bởi doind, 29/8/15.

  1. doind

    doind Đang làm quen

    Tham gia ngày:
    11/9/14
    Bài viết:
    870
    Đã được thích:
    6
    Điểm thành tích:
    18
    Vài ngày trước chúng ta đã được thảo luận về chủ đề: "Thước đo sự tham gia người dùng có được coi là một tín hiệu xếp hạng?" và qua bài viết đó chúng ta mới chỉ thảo luận về sự tương tác của người được Google coi là một tiêu chí để Google xếp hạng thì ở bài viết này chúng ta sẽ nói kỹ hơn về Dữ liệu hành vi người dùng trong tiêu chí xếp hạng của Google.

    [​IMG]

    Câu hỏi: Công cụ tìm kiếm giải thích trải nghiệm người dùng như thế nào?

    Trả lời: Chúng thu thập dữ liệu về hành vi của người dùng.

    Loại dữ liệu về hành vi người dùng được sử dụng bởi công cụ tìm kiếm bao gồm CTR, điều hướng, giờ, khoảng thời gian, tần số và loại truy cập.

    CTR (Click-through rate)

    Phân tích CTR là một trong những tín hiệu phản ánh chất lượng tìm kiếm nổi bật nhất. Cả Google và Microsoft đã có những nỗ lực đáng kể vào sự phát triển của cơ chế này giúp họ nhận biết được một trang nhận được CTR cao hơn hoặc thấp hơn so với dự kiến.

    Độ sai lệch về vị trí

    Giá trị CTR đang chịu ảnh hưởng nặng nề bởi vị trí vì người dùng có nhiều khả năng nhấp chuột vào kết quả đầu tiên. Điều này được gọi là “độ sai lệch về vị trí” và đó là những gì làm cho nó trở nên khó khăn để chấp nhận rằng CTR có thể là một tín hiệu xếp hạng hữu ích. Tin tốt là công cụ tìm kiếm có nhiều cách để đối phó với vấn đề độ lệch. Trong năm 2008, Microsoft phát hiện ra rằng "mô hình cascade" làm việc tốt nhất trong việc phân tích độ sai lệch. Mức độ quan trọng của mô hình này là nó cung cấp một cách hiệu quả để xử lý vị trí sai lệch, làm cho CTR thực tế hơn.

    Thu hút kết quả

    CTR tốt là một thuật ngữ tương đối. 30% CTR với kết quả top đầu trong Google sẽ không phải là một bất ngờ, trừ khi đó là một thuật ngữ có thương hiệu, nếu không nó sẽ là một CTR thật khủng khiếp. Tương tự như vậy, với một thuật ngữ có giá trị thì có tính cạnh tranh sẽ là rất cao.

    Tôi đã quan sát dữ liệu CTR trong vòng 5 năm để đưa ra kết luận rằng nó phụ thuộc vào vị trí, chất lượng snippet và tính năng tìm kiếm đặc biệt. Trong thời gian này, tôi đã đến để đánh giá giá trị của việc nhận biết khi sai lệch so với chuẩn mực đặt ra. Ngoài vị trí xếp hạng, hãy xem xét các yếu tố khác có thể ảnh hưởng đến sự lựa chọn của người dùng để click vào một kết quả:

    - Chất lượng snippet
    - Liên quan đến nhận thức
    - Sự hiện diện tính năng đặc biệt của kết quả tìm kiếm
    - Nhận biết thương hiệu
    - Cá nhân hóa

    Ứng dụng thực tiễn

    Sức hấp dẫn của kết quả tìm kiếm không phải là một vấn đề trừu tượng. Khi thực hiện đúng, nghiên cứu CTR có thể cung cấp rất nhiều giá trị cho một nhà tiếp thị hiện đại. Dưới đây là một nghiên cứu của Moz mà tôi đã tận dụng lợi thế của độ lệch CTR trung bình trong quá trình nghiên cứu.

    Nghiên cứu tiêu đề in đậm của Google

    Google cũng nhận thức được các yếu tố bổ sung góp phần dẫn đến độ sai lệch và họ đã phải làm việc cật lực với giải pháp non-position bias.

    [​IMG]

    Chúng thể hiện sự quan tâm mạnh mẽ trong việc tìm kiếm cách để cải thiện tính hiệu quả của tín hiệu thứ hạng dựa trên CTR. Ngoài việc giải quyết sự sai lệch về vị trí, các kỹ sư của Google đã đi một bước xa hơn bằng cách nghiên cứu tiêu đề snippet in đậm trong SERP. Tôi nhận thấy nó khá thú vị mà gần đây Google đã loại bỏ in đậm trong tiêu đề trên kết quả tìm kiếm, nó có khả năng loại bỏ sự sai lệch hoàn toàn. Bài viết của họ làm nổi bật giá trị khi nghiên cứu, hơn nữa nó tập trung vào các tác động độ lệch của tính năng snippet SERP cụ thể.

    Truy cập URL, thời gian, tần số và quỹ đạo

    Dữ liệu click không chỉ là tín hiệu hữu ích về hành vi người dùng. Session duration là một ví dụ, đó là một thước đo giá trị cao nếu nó được đo một cách chính xác. Ví dụ, người dùng có thể điều hướng đến một trang và để cho nó idle trong khi họ đi ra ngoài ăn trưa. Đây là nơi mà hệ thống giám sát người dùng hoạt động trở nên hữu ích.

    Có nhiều tín hiệu hỗ trợ hành vi người dùng trong khi không thể index, đo lường thời gian tham gia trên trang. Điều này bao gồm sự tương tác qua bàn phím, chuột, di chuột, máy tính bảng, bút, màn hình cảm ứng và giao diện khác.

    Gần đây, John Muelle đã giải thích rằng sự tham gia của người dùng không phải là một tín hiệu xếp hạng trực tiếp và tôi cũng tin điều này. John nói rằng loại dữ liệu này (thời gian trên trang, click…) không thể làm tự động được.

    Tại thời điểm này, chúng tôi có khả năng tìm kiếm một mô hình sanbox hơn là lắng nghe phản ứng của hệ thống khi nói đến ảnh hưởng trực tiếp của hành vi người dùng trên một trang cụ thể. Điều đó nói rằng, Google không thừa nhận những hạn chế về đánh giá chất lượng sanbox dựa trên kết quả đánh giá. Gần đây, chúng tôi đã đề xuất một hệ thống học hỏi tích cực mà sẽ đánh giá kết quả với một mẫu đại diện cho cơ sở dữ liệu người dùng của họ.

    “Định hướng cho công việc tương lai là kết hợp việc học tập tích cực để thu thập dữ liệu đại diện cho sở thích của người dùng”.

    Một bài viết của Google được xuất bản vào năm 2010. Đầu năm 2011, Google phát hành thuật toán Panda. Cuối năm đó, Panda đã thay đổi liên tục cho thấy một hệ thống học hỏi tích cực của họ. Chúng ta có thể mong đợi nhiều hơn về hệ thống của Google trong tương lai.

    Các công cụ giám sát

    Google đã thiết kế và cấp một bằng sáng chế cho một hệ thống chuyên phục trách việc thu thập và xử lý dữ liệu về hành vi người dùng. Họ gọi nó là "công cụ theo dõi".

    Bằng sáng chế mô tả thực tế công cụ giám sát của Google, nó mô tả khá dài, vì vậy nếu bạn bận thì bạn có thể đọc một vài tóm tắt của tôi.

    MetricsService

    MetricsService của Chrome là một hệ thống chịu trách nhiệm về việc mua lại và truyền tải dữ liệu người dùng đăng nhập. Biểu đồ chứa hồ sơ rất chi tiết về các hoạt động của người dùng bao gồm việc mở và đóng tab, fetch URL, cửa sổ tối đa…

    Dưới đây là một số liên kết external với thông tin chi tiết về MetricsService, lý do và các loại dữ liệu thu thập và một danh sách đầy đủ các biểu đồ.

    Sử dụng thứ hạng

    Google có thể xử lý dữ liệu trong một khoảng thời gian nào đó giống như cách sử dụng nút (URL), cạnh (liên kết) và các nhãn (dữ liệu hành vi người dùng). Tín hiệu sự tham gia trên trang chẳng hạn như giá trị session duration được sử dụng để tính toán trọng số của các nút. Dưới đây là hai phương thức của một đồ thị đơn giản bao gồm 3 nút (A, B, C) với các nhãn thời gian gắn liền với từng nút:
    [​IMG]
    Trong mô hình đồ thị trên, trọng số của các nút A là trực tiếp được thúc đẩy bởi các nhãn có giá trị (phiên hoạt động thứ 120). Trong biểu đồ bên phải, nút liên kết A đến nút B và C. Bằng cách làm như vậy, nó sẽ nhận được một khoảng thời gian từ các nút liên kết đến.

    Có thể nói, nếu bạn liên kết tới các trang mà mọi người dành nhiều thời gian ở đó, Google sẽ bổ sung thêm một phần “thời gian tin tưởng” hướng tới các trang liên kết. Đây là lý do tại sao việc kết nối ra bên ngoài lại hữu ích, nội dung hấp dẫn là một ý tưởng tốt. “Điểm số hành vi người dùng” phản ánh tần số tương đối và loại giao tiếp của người dùng.

    Mô hình Reasonable surfer

    “Reasonable surfer” là công cụ kế nhiệm của surfer. Các yếu tố làm giảm PageRank phản ánh các giả định ban đầu sau mỗi liên kết, surfer theo tưởng tượng của chúng tôi là rất ít có khả năng nhấp chuột vào một liên kết ngẫu nhiên. Hầu hết các công cụ tìm kiếm hiện nay làm việc với một mô hình tinh tế hơn bao gồm sự đa dạng về các yếu tố ảnh hưởng.

    Ví dụ, khả năng của một liên kết được click vào một trang có thể phụ thuộc:

    - Vị trí của liên kết trên trang (top, bottom, trên/dưới)
    - Vị trí của liên kết trên trang (menu, sidebar, footer, khu vực nội dung, danh sách)
    - Kích thước của anchor text
    - Kích thước phông chữ, kiểu và màu sắc
    - Kết hợp chính xác chủ đề
    - Đặc điểm URL (external/internal, dấu gạch nối, TLD, chiều dài, chuyển hướng, host)
    - Liên kết hình ảnh, kích thước và tỷ lệ
    - Số lượng liên kết trên trang
    - Các từ xung quanh liên kết, tiêu đề và heading
    - Tính thương mại của anchor text

    Ngoài ra, công cụ tìm kiếm có thể dự đoán các liên kết bằng cách quan sát các lựa chọn được sử dụng phổ biến. Một liên kết mà người dùng nhấp chuột vào nhiều hơn trong một trang có thể có trọng số cao hơn.

    Trong minh họa dưới đây, chúng ta có thể thấy 2 liên kết đi đến cùng một tài liệu (A) trỏ đến 2 tài liệu khác là B và C. Bên trái là những gì sẽ xảy ra theo mô hình "random surfer model” truyền thống, trong khi bên phải, chúng tôi có một liên kết ở vị trí nổi bật hơn và có xu hướng trở thành một lựa chọn ưa thích của nhiều khách truy cập.

    [​IMG]

    Phương thức này có thể được sử dụng trên một tài liệu duy nhất hoặc trong một phạm vi rộng hơn và cũng được áp dụng cho cá nhân người dùng và nhóm người dùng theo ngôn ngữ, lịch sử duyệt web.

    Pogo-sticking

    Một trong những tín hiệu đáng chú ý nhất đối với công cụ tìm kiếm là khi người dùng thực hiện một truy vấn và nhanh chóng quay trở lại kết quả tìm kiếm sau khi ghé thăm một trang mà không làm thỏa mãn nhu cầu của họ. Hiệu quả đã được mô tả và thảo luận trong một thời gian dài trước đây và có vô số các thử nghiệm cho thấy tính hiệu quả của của nó. Điều đó nói rằng nhiều câu hỏi về tính hợp lệ của các thử nghiệm SEO chủ yếu là do thực hiện chứ không phải không có khoa học. Vì vậy, điều đó là tốt để biết rằng hiệu ứng đã được xuất hiện trên radar của Google.

    Thanh địa chỉ

    Dữ liệu URL có thể bao gồm việc người dùng nhập URL vào thanh địa chỉ của trình duyệt web hay người dùng truy cập URL bằng cách click vào một liên kết đến một trang web hoặc một liên kết trong email. Vì vậy, ví dụ nếu người dùng nhập vào chính xác URL và nhấn Enter để tiếp cận một trang mà có tín hiệu mạnh khi khách truy cập đến trang đó sau khi một trình duyệt tự động điền hoặc đề nghị hoặc click vào một liên kết.

    - Nhập vào URL đầy đủ
    - Nhập vào một phần URL và trình duyệt tự động điền
    - Follow hyperlink

    Trang đăng nhập

    Google theo dõi người dùng và hành trình của họ khi họ duyệt web. Họ biết khi người dùng đăng nhập vào một cái gì đó (ví dụ như mạng xã hội) và họ biết khi họ kết thúc một phiên giao dịch bằng cách thoát ra. Nếu cuộc hành trình luôn bắt đầu với trang đăng nhập, Google sẽ bổ sung thêm tầm quan trọng với các trang đăng nhập trong bảng xếp hạng của họ.

    Trên thực tế, chúng tôi đang thiết lập một thử nghiệm đăng nhập để xem hành động lặp đi lặp lại của khách truy cập và sự tham gia tác động đến khả năng hiển thị tìm kiếm của trang trong bất kỳ cách nào. Độc giả bài viết có thể truy cập vào trang này để kiểm tra đăng nhập với tên người dùng: moz và mật khẩu: moz123.

    Ý tưởng thử nghiệm của tôi là phải có tất cả các tín hiệu được đề cập đến trong bài viết của mình:

    - Biết URL
    - Kích hoạt thường xuyên và lặp đi lặp lại việc truy cập
    - Phiên dự kiến dài khoảng 30-120 giây
    - Thời gian hoạt động trên trang chủ
    - Yếu tố tương tác để gắn kết (export, biểu đồ tương tác, cá bộ lọc).

    Kết hợp các tín hiệu xếp hạng tiềm ẩn và truyền thống

    Google đối xử khác nhau với dữ liệu người dùng tạo ra. Kết hợp các tín hiệu tiềm ẩn như ngày nào trong tuần, hoạt động session duration, tần số truy cập hoặc loại bài viết với các phương pháp xếp hạng truyền thống để cải thiện độ tin cậy của kết quả tìm kiếm.

    [​IMG]

    Tác động đến SEO

    Thực tế là tín hiệu hành vi của Google nhấn mạnh tầm quan trọng ngày càng tăng của việc tối ưu hóa trải nghiệm người dùng. Công việc của chúng tôi là để khuyến khích người dùng click, tham gia, chuyển đổi và trở lại. Nhiệm vụ phức tạp này đòi hỏi một sự kết hợp đa ngành, trong đó có kỹ năng về công nghệ, chiến lược và sáng tạo. Chúng tôi đánh giả cả người dùng và công cụ tìm kiếm. Việc đánh giá bắt đầu ở cấp SERP và sau đó người dùng theo dõi toàn bộ cuộc hành trình xuyên suốt trang web của bạn.

    "Trải nghiệm người dùng tốt".

    Khả năng hiển thị tìm kiếm sẽ không bao giờ phụ thuộc vào trải nghiệm người dùng. Nghiên cứu gần đây nhất của chúng tôi cho thấy người dùng không có phản ứng tốt khi phải đối mặt với số lượng lớn các văn bản (ví dụ như bài viết này) và thường sẽ đọc lướt qua nội dung và sẽ ra đi nếu họ không thể tìm thấy câu trả lời nhanh chóng. Những hành vi này có thể gửi tín hiệu sai đến trang web của bạn.

    Giải pháp của tôi là giới thiệu tất cả nội dung có sẵn cho người dùng thông qua việc sử dụng các hypertext. Kết quả là, trang thử nghiệm của chúng tôi (gần 5.000 từ) tăng thời gian người dùng trên trang từ 6-12 phút và tỷ lệ thoát giảm từ 90%-60%. Các bài viết của chúng tôi đã xuất bản cho thấy click, hovers và tăng hoạt động gấp đôi hoặc gấp 3 với các phần nội dung còn lại của chúng tôi. Đối với chúng tôi điều này đã đủ thuyết phục.

    [​IMG]

    Tôi không đồng ý với thuật toán của Google vì nó làm giảm giá trị nội dung không hiển thị trên trang theo mặc định. Các truy vấn chứa bên trong các phần chưa được mở rộng sẽ không in đậm trong SERP và hiện không được xếp hạng cũng như đối với các trang mà sao chép nội dung tương tự. Đây là một cái gì đó mà Google đã làm việc trên đó nhưng trong khi chờ đợi chúng ta phải chú ý đến quan niệm này và đưa ra tính toán quyết định trong thường hợp trải nghiệm người dùng tốt không phù hợp với thực tiễn của Google.

    Ghi nguồn
    PHP:
    www.thegioiseo.com
     
Đang tải...

Chia sẻ trang này