Аналіз сторінок в додатковому індексі Google

гіпотези
Методологія аналізу
Проведення і результати аналізу
підсумки аналізу

Як відомо, Google має два індекси: основний (Main Index) і додатковий (Supplemental Index або, в народі - "соплі" ). Перший містить в собі значущі сторінки, а в другій потрапляють ті, які мають низьку цінність, зазвичай це дублікати або сторінки з дуже малою кількістю цінного контенту. Багато сторінок з додаткового індексу приховані за посиланням "Показати приховані результати".

соплі

гіпотези

Так як офіційної інформації про додаткове індексі Google не так багато, в співтоваристві оптимізаторів виникають дві гіпотези.

1) Сторінки з додаткового індексу не беруть участі в ранжируванні.
2) Вихідні посилання з цих сторінок не працюють.

Метою даного аналізу є перевірити достовірність гіпотез.

Методологія аналізу

Для проведення аналізу, спершу, необхідно розділити сторінки сайту за індексами - які потрапили в основний, які в додатковий. Для цього використовується оператор пошуку "site" і конструкція site: devaka.ru/&. За допомогою двох запитів до Google спочатку береться загальний індекс, потім основний, скануються всі сторінки і їх різниця дає сторінки з додаткового індексу.

Для перевірки першої гіпотези для кількох сайтів проводиться аналіз трафіку в Google Analytics, а саме, перевіряються сторінки входу при обраному сегменті "Google (organic)" (спасибі Міші Сливинському за наводку). Аналізується частка трафіку, що припадає на сторінки в основному і додатковому індексі. Судячи гіпотезі, сторінки з додаткового індексу не повинні отримувати пошуковий трафік.

При перевірці другої гіпотези береться кілька випадкових посилань зі сторінок в "соплях" і проводиться аналіз їх працездатності, де під працездатністю розуміється знаходження акцептора по точному текстовому анкор на засланні.

Проведення і результати аналізу

При аналізі була проведена перевірка декількох сайтів, але ми розглянемо процес на прикладі блогу devaka.ru.

Загальний індекс можна отримати за запитом "Site: devaka.ru" (Із зазначенням filter = 0, щоб витягнути в тому числі дублі).

ru (Із зазначенням filter = 0, щоб витягнути в тому числі дублі)

Основний індекс був отриманий за запитом "Site: devaka.ru/&" .

ru/&

З скріншотів (тут відображені не перші результати) вже видно, що сторінка / articles / не відображається при другому запиті, але є у видачі при першому.

Всього було отримано:

598 результатів із загального індексу.
504 результату з основного.
94 результату в "соплях".

Нижче наведені сторінки, які потрапили в додатковий індекс.

Далі даний список порівнювався з даними з Google Analytics - кількістю трафіку з Google за останній місяць. Вийшла наступна таблиця (приведена в неповному вигляді).

Вийшла наступна таблиця (приведена в неповному вигляді)

На сторінки додаткового індексу довелося 31 відвідувач за останній місяць з Google, в той час як лише 30 976 відвідувачів. Тобто, на додатковий індекс припало близько 0,1% трафіку, хоча ці сторінки складають близько 16% всього індексу (для аналізованого сайту).

Тобто, на додатковий індекс припало близько 0,1% трафіку, хоча ці сторінки складають близько 16% всього індексу (для аналізованого сайту)

Цікаво, які саме сторінки отримали трафік?

Цікаво, які саме сторінки отримали трафік

На ці сторінки заходили за такими запитами:
- "як оптимізувати відео devaka"
- "юзабіліті і seo devaka"
- "http://www.google.com/search?q=cache: https://devaka.ru/articles/howto-write-articles " - хтось шукав посилання в кеші, по всій видимості.
- Решта "(not provided)"

Таким чином, ми бачимо, що на сторінки з додаткового індексу заходили переважно ті люди, які шукали на сайті devaka.ru (використовували бренд-запити).

Якщо аналізувати посилання на отриманих сторінках в додатковому індексі, то бачимо, що вони працюють (наприклад, ця сторінка , перевірки запит ).

Якщо аналізувати посилання на отриманих сторінках в додатковому індексі, то бачимо, що вони працюють (наприклад, ця сторінка , перевірки запит )

підсумки аналізу

В результаті аналізу ми підтвердили першу гіпотезу і спростували другу. Тобто, дійсно, сторінки в додатковому індексі не беруть участі в ранжируванні, якщо тільки текст не шукається безпосередньо на них. У нашому випадку ці сторінки отримали 0,1% Гуглівского трафіку (переважно по бренд-запитам). Однак, посилання зі сторінок в додатковому індексі все ж працюють, принаймні при пошуку по точному входженню тексту посилання акцептор знаходиться.

Які висновки можна зробити, виходячи з результатів аналізу? Я для себе зробив такі:

1. Варто стежити за якістю індексу для свого сайту. Не завжди більше сторінок - краще. Велика кількість сторінок в індексі (від 15% до 99% у великих порталів) можуть отримувати всього 0,1 - 1% пошукового трафіку.

2. У додатковий індекс потрапляють малоінформативні сторінки і дублі. З тих сторінок, що мені вдавалося аналізувати, в додатковому індексі присутні найчастіше дублі (як внутрішні, так і з зовнішніх ресурсів, наприклад, якщо на сайті активно копіюють контент, то додатковий індекс для сайту може рости), а також сторінки, на яких крім наскрізних блоків присутній дуже мало тексту (менше 70-80 слів) або тільки посилання (в незалежності від обсягів).

3. "Соплі" рідко переіндексіруются. Судячи логам сервера, сторінки в "соплях" незначні для роботів і переіндексіруются дуже рідко, ними складно маніпулювати і купувати з них посилання не має економічного сенсу.

4. Деякі сторінки потрапляють в додатковий індекс, якщо більша частина їх унікального тексту дублюється на сторінці-категорії. Це було помічено для деяких документів, у яких немає зовнішніх дублів. Частина їх тексту просто копіюється на сторінці-категорії. У зв'язку з цим, анонси в категорії краще пускати унікальні, щоб залишати унікальним текст самої статті.

У будь-якому випадку "соплі" це погано 🙂

Цікаво, які саме сторінки отримали трафік?
Com/search?
Які висновки можна зробити, виходячи з результатів аналізу?