Реєстрація в каталогах: автоматичний вибір категорії

Фахівці в галузі пошукової оптимізації досить давно використовують автоматичні та напівавтоматичні програмні системи, що полегшують працю і тимчасові витрати на реєстрацію, який просувається в різних інформаційних службах та тематичних каталогах. Якщо говорити про найбільш відомих програмних комплексах, то це Allsubmitter і Smile SEO Tools. Суть таких програм полягає в автоматичному заповненні форм реєстрації, які перед відправкою перевіряються на правильність заповнення безпосередньому самою людиною (при роботі в напівавтоматичному режимі). Напівавтоматичний режим вважається найбільш кращим способом якісно зареєструвати сайт у великій кількості каталогів.

Ключовим моментом при автоматичному заповненні форми є вибір найбільш відповідної за тематикою категорії із заздалегідь визначеного списку. Цю процедуру, здавалося б, просту для ручного виконання самою людиною, автоматично досить складно реалізувати, оскільки список можливих категорій апріорі невідомий фахівцеві, який реєструє сайт в каталогах.

Слід зазначити також той факт, що списки категорій часто представляють в псевдоіерархіческом вигляді за допомогою різних роздільників слів ( «>», «::», «-», «|»). При цьому, фізично список категорій на веб-сторінці має плоску структуру.

У широко популярній програмі Allsubmiter автоматизація вибору категорії грунтується на заданому списку ключових слів. Слова задані в порядку зменшення їх пріоритету, наприклад:

туризм відпочинок тур послуги агентства інше різне інше

Спочатку програма аналізує по порядку категорії в списку на наявність першого ключового слова, потім, в разі незнаходження відповідності, проводитиметься пошук на наявність другого ключового слова і так далі до тих пір, поки не знайдеться категорія, назва якої містить ключове слово. Далеко не завжди в результаті застосування даного способу автоматичного вибору категорії виходить вірний результат. Наприклад, описаний спосіб безсилий для такого списку:

Туризм> Готелі
Туризм> Пансіонати
Туризм> Агентства
...

В даному випадку програма зробить невірний вибір категорії «Туризм> Готелі». У зв'язку з цим, описаний вище метод є неефективним при автоматичному виборі категорії (за статистикою категорія вибирається правильно в 50-75% випадків) і потребує доопрацювання, ускладнення аналізу списку.

Автором цієї статті була розроблена нова методика автоматичного вибору категорії із заданого списку, що дає на 85-95% вірний результат за умови, що відповідна за тематикою категорія насправді мається на уже згадуваному списку і список ключових слів складений правильно.

Суть методики також полягає в попередньому складанні списку ключових слів, розташуванні їх в порядку убування пріоритету і подальшому аналізі наявного списку категорій. Маючи заданий список Li, (i = 1 .. n) з n ключових слів, введемо поняття ваги ключового слова:

Далі, аналізуючи послідовно категорії списку Kj, (j = 1 .. m), отримуємо показники сумарної ваги для кожної категорії (сума ваг всіх ключових слів, що містяться в назві категорії):

В кінцевому рахунку, категорія, що має найбільший сумарний вага W сум j буде найбільш підходящою для заданого спочатку списку ключових слів. Таким чином, завдяки введенню ваги ключових слів, описана методика дозволяє давати досить точні результати навіть при аналізі списків зі схожими назвами категорій.

← До списку статей