Семантическая SEO: переход от строк к вещам

Semantic SEO - это зарождающееся искусство оптимизации веб-сайтов и других веб-ресурсов для семантического поиска. Но, строго говоря, нет необходимости говорить о «семантическом SEO» или «семантическом поиске», потому что реальность современных поисковых систем сделала излишним квалификатор.

Технологии семантического веба в настоящее время являются неотъемлемой частью работы современных поисковых систем, и стратегии органического поискового маркетинга должны учитывать эту реальность.

Это версия выступления, которое я выступил на SMX East в Нью-Йорке 2 октября 2013 года под несколько иным названием «Стратегическое семантическое SEO».

Я думаю, что тема, которую Майк, Джон и я рассмотрим сегодня, является жизненно важной для SEO. Фактически, я думаю, что изменения, внесенные технологиями семантической сети в работу поисковых систем, сигнализируют о поворотном моменте в практике SEO.

Прежде чем я начну исследовать природу этого изменения, коротко обо мне. Я изучал семиотику, библиотекарь, веб-дизайнер и SEO. Я не знаю, есть ли тот опыт, который делает меня особенно квалифицированным, чтобы говорить о пересечении поискового маркетинга и семантической сети, но именно это привело к тому, что я заинтересовался этой областью.

И это поле взрывается! Начиная с графика знаний Google и заканчивая снимками Bing и Google Hummingbird, внезапно появляется повсеместный семантический поиск, и люди обращают на это внимание, потому что, ну, трудно игнорировать, как изменился поиск.

Как поиск, я думаю, коренным образом изменился.

Что это за природа этого сейсмического сдвига?

По сути, это переход от струн к вещам.

«Вещи, а не строки»
Фраза, придуманная Google, чтобы подчеркнуть переход к реальным вещам в поиске.

От ключевых слов до сущностей. От слов, которые используются для описания вещей, до описываемых вещей.

В качестве ключевой фразы, используемой для продвижения графа знаний, «струны к вещам» - это незначительный маркетинговый триумф. Но как полезная информация для SEO фраза довольно бесполезна, по крайней мере, сама по себе.

Не то, чтобы оптимизаторы бездействовали в своих попытках оптимизировать семантический поиск.

В частности, маркетологи быстро освоили schema.org и авторство Google.

Семантический поиск и разрыв в стратегии SEO
До сих пор большая часть семантической SEO работы была проведена в стратегической пустоте

Это было относительно легко продать для поисковых маркетологов, потому что награда очевидна и очевидна: получить богатые фрагменты, получить более высокий CTR из поисковой выдачи, заработать больше денег.

Это прекрасная тактика, и они дают хорошие результаты, но в основном они выполняются в стратегической пустоте.

По мере того, как поиск становится все более семантическим, маркетологам необходимо понимать контекст этой тактики, чтобы они могли разрабатывать стратегии для семантического SEO и оттуда разрабатывать собственную эффективную и инновационную тактику.

Это то, что я надеюсь помочь предоставить сегодня - контекст и некоторые стратегии, которые вытекают из лучшего понимания этого контекста.

И этот контекст - все о семантических веб-технологиях, без которых Google и Bing не выглядели бы отдаленно, как сегодня.

Но не пугайтесь. Я не думаю, что семантическая паутина где-то так сложна, как это делают люди, и в интересах откладывать мои деньги там, где я говорю, я расскажу лишь о двух действительно простых принципах семантической паутины, и после этого предоставим вам трехзначное определение семантического SEO, которое, в отличие от «строк в вещи», будет пригодным для использования в ведрах, если мне удастся объяснить его вам.

Так что насчет этих строк и прочего?

Первая семантическая веб-технология, о которой я хочу поговорить, имеет отношение к строкам, а не к вещам, так что коротко расскажу о различиях между ними.

В поисковых системах и семантическом языке эти «вещи» называются «сущностями».

Сущности отличаются от ключевых слов. Это то, что ключевые слова используются для идентификации.

Сами ключевые слова неточны.

Различные ключевые слова могут использоваться для ссылки на один и тот же объект.

Разные ключевые слова, одна и та же сущность
Ключевые слова не являются надежным способом обозначения реальных вещей

«Дин Мартин», «закадычный друг Джерри Льюиса» и «член группы Крыс с самым сильным питьем» - все это относится к одному и тому же имени.

И одни и те же ключевые слова могут быть использованы для ссылки на разные объекты. В детстве я время от времени проходил через Париж, но не тот Париж, который, вероятно, приходит на ум, когда ты слышишь это слово.

Одно и то же ключевое слово, разные объекты
Ключевые слова не являются надежным способом обозначения реальных вещей

Есть много типов сущностей. «Дин Мартин» является именованным личным лицом. «Париж» - это географическое образование. Но сущности не обязательно должны быть собственными существительными: такие понятия, как «кошка» и «письменный стол», также являются сущностями - тематическими сущностями.

Так как же - теперь, наконец, прийти к первому из этих двух простых принципов, которые я хочу обсудить - обрабатываются сущности в мире семантического поиска?

В приложениях семантической сети каждому объекту присваивается уникальный идентификатор.

Уникальные идентификаторы
Для данного домена идентификатор, а не ключевые слова, представляет саму вещь

Уникальные идентификаторы позволяют компьютерам говорить о вещах : уникальный идентификатор представляет собой фактическую вещь , о которой говорит слово. Не ключевое слово, а значение, лежащее в основе ключевого слова.

Это критическое различие, потому что в ключевой вселенной нет канонического слова «баклажан» или «баклажан», которое можно было бы использовать для надежной и однозначной ссылки на концепцию этого конкретного овоща, но во вселенной сущности - формальной вселенной семантическая паутина - есть.

В мире семантической сети эти уникальные идентификаторы, как правило, представляют собой URL - URI, если вы хотите получить все модные и семантические - как адреса Wikipedia и IMDb на слайде.

А URL-адреса создают отличные идентификаторы по целому ряду причин, включая тот факт, что они легко доступны в Интернете, и что вы можете предоставить полезную информацию об этом по этому URL-адресу.

Какого рода информация? Это подводит нас к другой фундаментальной семантической сети, о которой я хочу поговорить.

Семантическая сеть имеет стандарт для описания вещей, структуру описания, основанную на тройке.

Как следует из названия, тройка - это утверждение о чем-то из трех частей.

Тройки: субъект> предикат> объект
Семантические веб-приложения используют стандартную модель для описания ресурсов

Тройка состоит из субъекта, предиката и объекта.

Предмет - то, что описывается - в первом примере г-н Дин Мартин.

Предикат указывает, что именно описывается в предмете - это будет его рост.

Объект - это значение - которое может быть фрагментом текста или числом - предмета, описываемого предикатом. Вот это значение роста Дина Мартина - 5'10 ".

Эта структура позволяет вам описывать практически любую информацию о любом объекте в формате, понятном для компьютеров. Этот формат является структурой, которая упоминается во фразе «структурированные данные».

И если вы когда-либо размечали HTML с помощью микроформатов, или schema.org, или Open Graph, вы использовали тройки.

Тройки в действии
Свойства schema.org выражают отношения между субъектом и объектом

Когда вы публикуете приведенный выше код schema.org, вы очень недвусмысленно говорите Google: «Этот продукт называется« Acme 8 Gigabyte USB Drive »».

И это, в свою очередь, позволяет вам сказать и другие очень однозначные вещи о названном USB-накопителе, например, что он имеет цену в десять баксов, или что 32 человека просмотрели его, или что он синий.

И когда объединить эту структуру описания с уникальными идентификаторами URL, все становится ужасно захватывающим.

Нет, правда!

Потому что, когда вы сможете выяснить, что это такое и как их найти - уникальные идентификаторы - и понять предоставленную вам информацию об этих вещах - структуру описания - вы сможете установить всевозможные значимые связи между всеми видами вещи.

ВВП Франции ... и многое другое
Из структурированных источников и / или источников Google проанализировал и структурировал

Посмотрите на эти результаты Графа знаний по запросу «ВВП Франции». Помимо желаемого ответа, вы увидите, что результаты переполнены другими объектами и информацией о них.

Среди показанных фактов вы найдете такие вещи, как население Франции и ВВП Великобритании. Почему Google отображает эту информацию?

Из журналов запросов он знает, что люди, которые искали «ВВП Франции», также искали эти другие цифры. Но он не знает этого, просто складывая вхождения ключевых слов и фраз в запросах, выполненных в одном сеансе.

Связанные запросы: строки против вещей
Семантический поиск позволяет Google определять смысл запросов

Он знает об этом, потому что использовал эти ключевые слова и контекст запросов для извлечения и устранения неоднозначности сущностей (для уникального идентификатора) и для хранения утверждений о них (в виде троек). Подобные результаты - или, скажем, функция сравнения Google Hummingbird - просто были бы невозможны без технологий, которые я описал.

Это семантическая сеть на работе, и это новое лицо поиска.

Он превращает веб-страницы из изолированных островов в острова, к которым присоединяются миллиарды мостов. Это поисковая среда, которая не только пытается дать ответы о вещах, но и о связях между вещами . И это среда, для которой поисковым маркетологам требуется стратегия оптимизации.

И с этим мы вернулись к строкам и вещам.

Стратегия SEO на сегодняшний день была сосредоточена на ключевых словах - строках, описывающих вещи.

Традиционное определение «SEO»
На протяжении большей части своей истории SEO был ориентирован на ключевые слова

Хотя ключевые слова будут продолжать играть центральную роль в поиске - именно потому, что они действительно описывают вещи - стратегии, разработанные только для ключевых слов, для строк, не подходят для динамического мира вещей.

На пути к определению «семантического SEO»
Сущности являются необходимым компонентом - но только компонентом - семантического SEO

Очевидно, что сущности важны для семантического SEO, но простая замена «ключевых слов» на «сущности» в качестве цели оптимизации не особенно полезна, и в ней не рассматривается то, что делает семантический поиск настолько мощным.

Эта сила - способность понимать, что это за вещи и как они связаны - и это те отношения, которые вы хотите, чтобы ваша веб-страница, или видео, или электронная почта, или твит, или пин-код, или картинка, или сообщение сыграли свою роль .

Вы хотите, чтобы ваш сайт появился только в тот момент, когда Google соединяет точки для поисковика.

Ваша стратегия поисковой оптимизации должна включать не только существительные, но и глаголы.

Семантическое SEO - это не оптимизация для строк или вещей, а для связей между вещами .

«Семантическое SEO»
Смещение фокуса с соответствия строк на отношения между вещами

Семантическое SEO оптимизирует отношения.

Отношения между сущностями облегчаются благодаря возможности однозначно и однозначно идентифицировать их и предоставлять однозначные данные о них.

И если вы преуспеете в этом, ваше присутствие в поиске будет расширено, и вы будете связаны с поисковиками, которые ищут очень конкретные вещи. Вы будете появляться не только для «blender», но и для «рекомендаций blender», «хороших blenders до $ 200» и «blender до 18 дюймов», а также с неявными запросами, которые поисковые системы все чаще могут выполнять из запросить контекст и информацию о пользователе, например, "рекомендованные моими друзьями блендеры" или "машина для маргариты с дробленым льдом" или "сравнить блендеры и соковыжималки".

Поскольку семантическое SEO уходит своими корнями в мир вещей, логической отправной точкой для семантической стратегии SEO является идентификация вещей, и в частности вещей, найденных на вашем сайте.

СТРАТЕГИЯ: выявить и устранить неоднозначность
Утилиты извлечения и API могут помочь в идентификации именованных и тематических объектов

Существуют мощные инструменты, которые вы можете использовать - например, API для извлечения сущностей - для идентификации сущностей, присутствующих в вашем контенте. Фактически, многие из этих API-интерфейсов опираются на одни и те же ресурсы, такие как Википедия и Freebase, используемые графом знаний Google или снимками Bing.

Но идентификация сущностей мало чем отличается от проверенной и надежной задачи определения ключевых слов для поиска в поиске, и многие методы и инструменты, используемые в исследовании ключевых слов, могут быть применены к этой задаче, хотя и с критическим отличием, что сущности являются реальными вещами. эти ключевые слова используются для описания.

Точно так же, как определение сущностей мало чем отличается от исследования ключевых слов, устранение неоднозначности сущностей мало чем отличается от поиска и консолидации страниц, которые каннибализируют друг друга - каннибализация ключевых слов, - и концептуально не отличается от определения канонической версии URL.

Объекты: только столько идентификаторов, сколько необходимо
Каннибализация сущности - это новое ключевое слово каннибализации: просто скажите нет

Однако сайт, свободный от страниц, которые каннибализируют ключевые слова, может иметь несколько страниц, которые ссылаются на одну и ту же сущность - разные строки, указывающие на одну и ту же вещь. В эпоху семантического поиска использование нескольких страниц для покрытия синонимов, относящихся к одной и той же базовой вещи, является совершенно неправильным подходом.

Другой важный подход - начать думать о вашем контенте - точнее, о данных , находящихся в этом контенте - так же, как это делает поисковая система.

СТРАТЕГИЯ: определить предметы и свойства
Структурирование вашего контента поможет, когда дело доходит до его структурирования для поисковых систем.

После идентификации ваших сущностей вы можете затем определить свойства, связанные с ними, типы значений, которые вы ожидаете увидеть для этих свойств, и, что наиболее важно, свойства и значения, которые являются общими для сущностей.

Вы можете или не можете в конечном итоге создавать свои собственные тройки - например, разметку кода на schema.org - но понимаете, что Google и Bing будут использовать тройки для хранения ваших материалов и обработки запросов независимо от того, структурированы ли данные на вашей странице или нет. или нет.

А подход к вашему контенту с этой точки зрения поможет вам в самых разных задачах - от таргетинга запросов до архитектуры сайта.

У меня нет времени вдаваться в подробности, но я думаю, что такого рода организация данных - это анализ ключевых слов будущего, и, действительно, анализ ключевых слов является важным инструментом для организации данных таким образом.

Конечно, основным средством обеспечения того, чтобы поисковые системы однозначно понимали ваши сущности, является их официальное объявление и предоставление информации о них.

СТРАТЕГИЯ: объявить свои данные
Предоставьте свои данные в структурированном формате для потребления машиной

И самый очевидный способ сделать это с помощью структурированной разметки данных. Это включает в себя разметку существующего кода с помощью schema.org (с использованием микроданных или RDFa), микроформатов и метатегов Open Graph.

Если определенный тип сущности важен для вашего бизнеса, но он не является частью какой-либо легко используемой схемы, найдите способ - в любом случае - объявить эти сущности и их свойства. Используйте существующий структурированный словарь или, что еще лучше, расширьте schema.org и работайте над добавлением добавленной схемы или схем в словарь.

Отсутствует в действии ... но не обязательно навсегда
Если ресурс отсутствует в schema.org, вы можете добавить его как расширение

Знаете ли вы, что для видеоигр нет схемы? Я знаю, что сейчас в США это индустрия всего за 15 миллиардов долларов, но, тем не менее, я думаю, что хорошо продуманное расширение, поддерживающее разметку видеоигр, было бы положительно воспринято.

Но стоит ли размечать сущности, для которых в настоящее время не создаются богатые фрагменты результатов поиска?

Одним словом да.

Поисковые системы стараются изо всех сил заставить веб-мастеров кормить их структурированными данными, что говорит о том, что они находят это полезным по причинам, отличным от создания богатых фрагментов.

Нет фрагмента? Нет проблем!
Google все еще хочет ваши данные

Где богатый фрагмент, сгенерированный свойством "musicBy" для schema.org/TVSeries? Где богатый фрагмент, когда вы рассказываете Google о кухне ресторана с помощью Data Highlighter? Google игнорирует эту информацию?

Нет, он использует данные, чтобы лучше понять описываемые ресурсы. И хотя обещание богатых отрывков по-прежнему заключается в том, что перед веб-мастерами по-прежнему прячется кнут, чтобы поощрять использование структурированной разметки данных, в конечном итоге эта разметка, по словам Data Highlighter, помогает поисковым системам « понимать данные вашего сайта» .

Наконец, если - как я уже говорил - семантическая SEO направлена на оптимизацию отношений, тогда вам нужно знать, как вещи связаны между собой на вашем сайте или сайтах.

К счастью, механизм выявления отношений, существующих между вещами в сети, не таинственный, а гиперссылка.

Структурированные данные предоставляют метод явного объявления отношений между вещами, но для любого типа ресурса поисковая система не будет соединять точки, когда их ничто не связывает, поэтому вам нужно убедиться, что ваш контент разумно связан.

Возьмите страницу продукта на сайте электронной коммерции.

СТРАТЕГИЯ: карта и объявить ваши отношения
Гиперссылка соответствующих объектов и ресурсов, предпочтительно со структурированными данными

Это связано с аналогичными типами предметов? Для продуктов, которые принадлежат к той же марки? На страницу верхнего уровня, которая представляет бренд в этом домене? Связан ли блог компании с этой же страницей при обсуждении этого бренда? Связаны ли кнопки «Поделиться» на этой странице с проверенными аккаунтами компании? И так далее.

Хотя это необходимо , однако, этого недостаточно для идентификации, предоставления информации и установления связей между вещами на ваших страницах и за их пределами. Для поисковых систем вы также должны продемонстрировать, что предоставленные вами данные заслуживают доверия.

Ключевые слова - строки - не оцениваются поисковыми системами по качеству данных, поскольку они только косвенно связаны с данными. Но когда в игру вступают семантически объявленные сущности, это все о данных - в конце концов, они не называются структурированными данными даром.

Таким образом, хотя поисковые системы могут судить, насколько релевантен такой ресурс, как, например, веб-страница или видео, для определенного ключевого слова , просматривая целую совокупность ключевых слов этого ресурса, для семантического поиска они также обеспокоены достоверностью данных, которые было предложено.

Как вы демонстрируете поисковым системам, что ваши данные заслуживают доверия?

СТРАТЕГИЯ: создать доверие к вашим данным
Доверие с помощью подтверждения: Google+, проверенная сеть Google для идентификации

Обязательно используйте методы проверки, когда они доступны и по мере их появления.

Что делает Google Авторство, пожалуй, убийственным поисковым приложением, это Google+. Хотя я уверен, что у Google есть все надежды на то, что Google+ превратится в любимую всеми социальную сеть, но это будет иметь огромное значение для Google, если в нем будет ровно ноль постов, фотографий и видео от нулевых участников. Это проверенная идентификационная сеть, которая позволяет Google устранять неоднозначность отдельным лицам, предприятиям и другим корпоративным организациям и связывать все это с веб-сайтами и страницами веб-сайтов.

С точки зрения данных, что написано в подписи, «эта статья была написана кем-то вроде этого». Когда эта подпись связана с подтвержденной идентификацией, Google точно знает, кто такой-то и такой-то, в том числе, возможно, какие люди, организации, социальные сети, веб-сайты и темы, с которыми они связаны.

Воспользуйтесь всеми методами проверки
Проверка личности и данных с помощью поисковых систем и социальных сетей

Теги Bing, Twitter-карты и Pinterest Rich Pins - все это схожие методы проверки личности, которые, в свою очередь, помогают поисковым системам и другим потребителям данных воспринимать ваши данные как более надежные.

В дополнение к проверке данных - и особенно при отсутствии методов проверки - вы должны убедиться, что ваши данные согласованы между источниками, и даже стараться изо всех сил демонстрировать эту точность данных.

Укрепление доверия с помощью согласованности данных
Поисковые системы будут больше доверять вашим данным, если они согласованы между доменами

В среде электронной коммерции это означает, что вы должны предоставлять ту же информацию о товаре, которая отображается на вашем сайте, закодирована в структурированных данных на вашем сайте, перечислена в каналах вашей поисковой системы и везде, где вы можете ее отобразить - например, Facebook, Twitter или Pinterest.

Укрепление доверия в среде электронной коммерции
Продукты должны быть однозначно идентифицированы, а данные электронной торговли должны быть согласованными

Для покупок в Google теперь требуются уникальные идентификаторы товаров в торговых лентах. Зачем? «Продолжать улучшать качество данных в Google Shopping». И Bing, который явно демонстрирует принцип достоверности данных, теперь начал предлагать «богатые титры», которые отображают информацию о цене и доступности продукта, если - и только если - информация, отображаемая на сайте продавца, идентична информации, предоставленной для Bing в ленте рекламы товаров. Связанные, конечно же, уникальным идентификатором, URL продукта.

Если это все хорошие стратегии для семантического SEO, каковы ожидаемые результаты их использования?

Результаты: повышенная видимость поиска
От авторства до ящиков с ответами богатые фрагменты есть везде - даже по электронной почте!

Во-первых, вы должны увидеть улучшенную видимость поиска в виде «богатых фрагментов». Я использую фразу «богатые фрагменты» в кавычках, потому что я имею в виду любые расширенные результаты поиска, выноски, поле ответа, вертикальные и все остальное, что выглядит или связано с Графиком знаний Google или Колибри или моментальными снимками Бинга.

Пит Майерс из Моза недавно идентифицированный 85 - считайте их, 85 - другой тип «богатых поисковой выдачи», и, вероятно, со временем мы увидим еще большее разнообразие. Эра 10 синих ссылок хорошо и действительно мертва, и семантический поиск убил ее.

Менее заметный результат эффективного семантического SEO - и, я думаю, в конечном счете, более важный - это то, что поисковые системы будут гораздо лучше понимать ваш контент. Вы будете «ранжироваться» лучше в том смысле, что будете лучше ассоциироваться с объектами, на которые ссылается ваш контент, - своевременно появляясь в поисковой выдаче, поскольку поисковые системы устанавливают связи от имени своих пользователей.

Для обоих этих результатов измерение успеха, увы, в настоящее время проблематично.

Измерение бед: это все еще о ключевых словах
Традиционная аналитика затрудняет оценку успеха семантического SEO

До недавнего времени в отчетах об успехе поиска в Интернете основное внимание уделялось ключевым словам. Любые попытки классифицировать трафик по ссылочным объектам - в отличие от строк, на которые они ссылаются, - требуют большого ручного поднятия тяжестей, и практически нет способа надежно отследить щелчок до расширенного результата поиска, не говоря уже о типе поля ответа. или вертикальный или богатый фрагмент, где появился этот результат.

И даже когда речь идет о строках, семантический поиск делает данные о ключевых словах все менее и менее надежными, поскольку облегчает поиск информации.

Струны и вещи не всегда смешиваются
Посещения семантического поиска могут скрыть исходный запрос

Но мне больше не нужно показывать вам этот слайд, показывающий, как данные ключевых слов путаются с помощью семантического поиска - в значительной степени основанного на превосходной и продуманной презентации под названием " Расставание с данными вашего ключевого слова "нашим координатором вопросов и ответов Энни Кушинг - потому что примерно через две недели после того, как я создал эту колоду, Google объявила о своем намерении расстаться со всеми нами.

На общем уровне успешное семантическое SEO должно привести к увеличению трафика от поиска, если ваш контент это поддерживает.

Но даже если это не так, вы должны ожидать, что качество поискового трафика улучшится, потому что поисковые системы лучше сопоставляют то, что присутствует в пользовательских запросах, с тем, что присутствует на вашем сайте.

Таким образом, вы ожидаете увидеть более высокие коэффициенты конверсии, меньше отказов, увеличение вовлеченности и больше повторных посещений для поискового трафика.

Я надеюсь, что грядущий (не предусмотренный) апокалипсис будет стимулировать разработку инструментов и методов отчетности, но вполне вероятно, что создание метрик для семантического поиска останется проблемой в обозримом будущем.

В заключение, семантический поиск - это все о поисковых системах, связывающих пользователей с данными. Сделайте эти связи вашими целями, и пусть поисковые машины будут вашими партнерами.

Что это за природа этого сейсмического сдвига?
Так что насчет этих строк и прочего?
Так как же - теперь, наконец, прийти к первому из этих двух простых принципов, которые я хочу обсудить - обрабатываются сущности в мире семантического поиска?
Какого рода информация?
Почему Google отображает эту информацию?
Но стоит ли размечать сущности, для которых в настоящее время не создаются богатые фрагменты результатов поиска?
Нет фрагмента?
Org/TVSeries?
Где богатый фрагмент, когда вы рассказываете Google о кухне ресторана с помощью Data Highlighter?
Google игнорирует эту информацию?