Автор статьи: ev1
>
Согласно исследованию японских ученых, люди, пользующиеся компьютерами каждый день, к тридцати годам практически полностью теряют способность что-либо запоминать.
|
Катастрофа? Жизненное фиаско? Вовсе нет, им приходят на помощь поисковые машины: если что-то нельзя вспомнить, это можно найти. Эта горстка сайтов, любовно называемая поисковиками и искалками, играет огромную роль в современном мире. Достаточно взглянуть на врезку <Корзина с фактами>, чтобы понять, что многие из нас уделяют времени поисковикам значительно больше, чем своей жене и детям. Эта статья - еще один шанс немного обделить вниманием близких людей для тех, кто мечтает о толпах посетителей в гуще своего сайта.
Рассказать о поисковиках непросто - в этом безумном мире запросов и ответов информация устаревает едва ли не в момент появления. Поэтому я попытаюсь избежать советов <как надо сделать, чтобы...> Надо учиться искать и думать. Где искать, что искать и о чем думать - да, вы угадали, именно этим вопросам посвящена статья.
Что такое успешная оптимизация?
Цель оптимизации сайта - получить максимум целевых посетителей, то есть тех, которые что-то купят, заполнят анкету или заинтересуются темой сайта. Как достичь этого? Давайте думать.
Если сайт нацелен на какой-то регион, логично сделать упор на местные поисковики. При этом выбор поисковика резонно делать на основе его посещаемости, которую можно узнать из
Впрочем, и тут не обошлось без подводных камней. Взгляните на рейтинг MediaMetrix: кажется, что Google - не лучший выбор для раскрутки сайта.

Но давайте думать. из таблицы альянсов поисковиков обнаруживается, что кроме своего сайта Google присутствует на Yahoo и Netscape, а это уже сила.
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Следовательно, выбирая поисковик, нужно смотреть не только на посещаемость, но и на тех, кто использует его механизм поиска. Получается, что для целей оптимизации стоит исследовать максимум 5-7 поисковых механизмов:
Оценивая позицию в результатах поиска, помните, что около 60% пользователей ограничиваются первой страницей результатов поиска, и почти 90% - первыми тремя. Поэтому место ниже 30, как правило, не результат, хотя по самым популярным запросам оно может давать сотни посетителей.
Алгоритмы
Откуда брать информацию об алгоритмах?
Если алгоритмы поиска станут известны всем, тут же появятся <идеальные> странички, про которые поисковик подумает <До чего ж хороши!> и поставит их на первые места вместо страниц, которые ожидал найти пользователь. Отсюда ясно, что никогда, нигде ни один поисковик не откроет своих настоящих алгоритмов, за исключением трех случаев:
Откуда еще можно брать информацию? Давайте думать.
А мне недавно сказали...
Когда кто-то говорит о новом факторе ранжирования, часто следует вопрос: правда это или нет? Давайте думать. Чтобы ответить на него, нужно знать, к чему стремятся алгоритмы поиска, какая у них цель и какие проблемы.
Эффективность поиска принято оценивать по двум основным критериям: полноте и точности. Чем больше процент релевантных (соответствующих запросу) документов среди всех найденных, тем выше точность. И чем больше найдено релевантных документов среди всех, что хранятся в базе поисковика, тем лучше полнота. Основная же проблема - ресурсоемкость поиска (нужно хранить много данных и
Следовательно, если <новый фактор ранжирования> может улучшить показатели точности или полноты, не вызвав резкого увеличения потребности в ресурсах, он правдоподобен. Например, именно из-за затрат времени не индексируются JavaScript-код и Flash, хотя технически реализовать и то, и другое не так уж сложно.
<Пора в путь-дорогу...>
С точки зрения оптимизации сайта у крупного поисковика существует три основных источника информации для вычисления релевантности страницы: 1) содержание страницы и сайта, 2) другие веб-сайты, 3) поведение пользователей. Если первым источником легко манипулировать, второй поддается только ограниченному воздействию, то влиять же на третий крайне сложно. Поэтому поисковики придают большой вес последним двум источникам.
Оптимизируя сайты, всегда проговаривайте про себя вопрос: <Как поисковик будет действовать в момент запроса?>, очень часто это помогает найти новые решения. Простой пример. Когда пользователь задает слово запроса строчными буквами, Яндекс находит все вхождения слова, независимо от его регистра; но если слово написано с прописной буквы, Яндекс будет искать только такие варианты. Следовательно, начиная с прописной буквы в тексте страницы все слова, которые пользователь часто пишет с большой буквы, вы повышаете вероятность нахождения страницы по всем видам данного запроса.
Содержание страницы и сайта
Текст страницы
Поисковик интересуется, прежде всего, тем, насколько часто встречается слово из запроса в документе по сравнению с другими словами. Если слов в запросе несколько, то вес каждого из них тем больше, чем в меньшем количестве документов базы оно содержится. В то же время, страница со слишком часто встречающимся словом запроса считается спамом, и ее позиция в результатах поиска заметно понижается.
Каким образом следует выбирать ключевые слова для оптимизации? Давайте думать.
Теги и мета-теги
Откуда пошли мифы про чудодейственную силу мета-тегов? из истории поисковиков. Когда поисковики были маленькими, а веб-мастера неопытными,
Alt-теги изображений учитывают далеко не все поисковики, но некоторые к ним внимательно прислушиваются, так что забывать о них не стоит.
Но есть один особенно важный тег - это тег
Положение слов на странице
Когда на запрос <свободная экономическая зона> находятся тексты о переполнении зон
Многие поисковики учитывают расстояние от начала страницы до слова, считая, что в начале чаще располагается важная информация.
Как оптимизировать с учетом этих данных? Давайте думать.
Оформление
Когда страница встречает заголовком с буквами таких размеров, что возникают сомнения, поместится ли здесь
Сайт в целом
Представьте себе переборчивого жениха, который никак не может отыскать невесту с нужными характеристиками, скажем, интеллигентную. Вот эта, кажется, подходит, но родители у нее землекопы; а вон та, похоже, интеллигентная, но, беря пример с брата-уголовника и отца-депутата, она, думает парень, вряд ли останется такой. Тогда жених определяет для себя: если все родственники у невесты, как и она сама, интеллигентны, значит подходит. Примерно так же рассуждает поисковик, когда дает приоритет тем сайтам, на которых больше число страниц, соответствующих запросу. В чем-то это верно, когда речь идет про интеллигентность, но если нужно выбрать невесту с длинными волосами, то коротко остриженные родственники, на мой взгляд, не должны быть помехой.
Как лучше оптимизировать сайт? Давайте думать. Чем больше страниц на сайте, включающих слова запроса, тем больше вес каждой из них. Следовательно, надо увеличивать число страниц как можно больше. Этот совет имеет еще два плюса:
Тема сайта
Некоторые поисковики стараются определить тему сайта, и если она не совпадает с темой запроса, то такой сайт даже не рассматривается. Как избежать такого? Давайте думать. Алгоритмы, определяющие тему сайта, как правило, исследуют слова, присутствующие на странице, сравнивая их со словами, часто встречающимися для данной темы. Следовательно, если изучить частоты слов из десятка текстов на интересующую вас тему, и увериться, что все самые популярные слова есть на страницах сайта, то с темой будет полный порядок.
Хижина дяди Сэма
Есть вещи, которые покупаются редко или раз и навсегда: дом, неподкупный политик, домен для сайта. Логично предполагать, что покупатель не пожелает себе плохого, а постарается, чтобы приобретение соответствовало его вкусам и роду деятельности. Основываясь на этой догадке, поисковики придают дополнительный вес страницам, у которых домен или имя файла совпадают с ключевым словом. У многих искалок есть еще одно предпочтение - некоммерческие домены первого уровня (вроде edu и gov) и домен com.
И что же делать? Давайте думать. Домен не так важен, как кажется - достаточно взглянуть на результаты поиска, чтобы убедиться, что доменов, совпадающих с запросом, в первой десятке довольно мало. В то же время, когда можно задать имя файла, совпадающее с ключевым словом, не стоит игнорировать эту возможность.
Другие веб-сайты
PageRank
Подробное описание алгоритма вы можете найти в статье
Ссылочное ранжирование
Когда на сайт ссылаются десятки страниц словами <а эти козлы не вернули мне деньги>, это, как правило, означает, что по ссылке действительно можно найти козлов. Правда, этот же сайт будет находится и по слову <деньги>, что, в принципе, тоже верно, потому что деньги остались у козлов. Так вот, это и называется ссылочным ранжированием. Написать на своей странице можно что угодно, но когда на нее все ссылаются теми же словами, поисковик начинает доверять.
Что тут делать? Давайте думать. До того, как начнете регистрироваться в каталогах и обмениваться ссылками, выберите краткое название своего сайта, включающее слова, под которые он оптимизируется. Тогда, с большой вероятностью, ссылка будет выглядеть так, как вам хочется. Несмотря на простоту, алгоритм имеет огромное значение при вычислении релевантности, и ему нужно уделять самое пристальное внимание.
Присутствие в каталоге
Многие поисковики имеют при себе каталоги. Как они используют их?
Как можно это использовать? Давайте думать. А что тут думать, регистрируйтесь!
Пользовательская оценка
Есть такая интересная система DirectHit. Ее идея оценки качества сайтов основана на предположении, что если пользователь переходит по ссылке, значит, он счел ее хорошей, и если долго не возвращается на страницу поисковика, значит, его ожидания подтвердились. именно эти критерии - число переходов по ссылке, время нахождения на странице и возвраты к поисковику - легли в основу корректора релевантности, который DirectHit предлагает другим сайтам.
Рамблер до пяти первых сайтов в результатах поиска берет из рейтинга Top100 (а посещаемость - своего рода пользовательская оценка). У Яндекса есть <Популярные находки> - раздел, в котором отображаются сайты с относительно небольшой релевантностью, но часто выбираемые пользователями.
И что, совсем-совсем нельзя повлиять на это? Давайте думать. Повлиять можно. Представьте, на основе каких критериев пользователи решают перейти на сайт. Заголовок, раз. Описание, два. URL, три. Заголовки должны учитывать психологию восприятия (см.
Спам
Если вы пробовали сунуть руку в пчелиный улей, то знаете, что это может быть больно. Теперь представьте обратную ситуацию: пчел в улее десяток-другой, а вот рук, тянущихся к меду, сотни тысяч. Естественно, что пчелы - сотрудники поисковиков - не любят спамеров! Пока есть масса легальных методов улучшить позицию страницы в результатах поиска, заниматься спамом,
Какие виды спама бывают?
индексация
Как ускорить переиндексацию?
Чем чаще сайт переиндексируется, тем более свежая информация доступна пользователю при поиске и, самое главное, можно проводить значительно больше экспериментов по оптимизации. Как же ускорить переиндексацию? Давайте думать.

Особенности интернациональной индексации
|
Опыты без взрывов
Можно ли, поставив эксперимент, узнать алгоритм поисковика или его часть? Конечно!
Метод деления пополам
Допустим, вас заинтересовал какой-либо показатель, влияющий на релевантность страницы, и вы предполагаете, что у него есть оптимум - меньшее значение делает страницу менее релевантной, а большее уже рассматривается как спам. Условно будем считать таким показателем процент ключевых слов на странице.
Для эксперимента создаются три страницы, в одной из которых процент ключевых слов близок к нулю, во второй - таков, что гарантированно будет сочтен спамом, а третья находится ровно посередине. Регистрируем и ждем индексации страниц. В зависимости от того, первая или вторая страница оказалась более релевантной, отсекаем половину исследуемого диапазона сверху или снизу. Повторяем до тех пор, пока оптимум не найден с нужной точностью.
Примечания:
Недостатков у метода два, но больших.
Метод дроби
Зная, как и в предыдущем случае, примерный диапазон изменения процента ключевых слов, можно сделать не одну страницу, а
Аналитические методы
В случаях, когда характер зависимости не ясен даже примерно, либо на исследуемые показатели нет возможности влиять, следует изучать зависимости на основе чужих сайтов. В такой ситуации резко возрастает влияние посторонних факторов и шумов, поэтому появляется необходимость использовать методы интеллектуального анализа данных (data mining, статистические пакеты и др.).
Учитывая сложность получения данных (например, веса страницы по алгоритму PageRank), на первом этапе сбор информации может касаться относительно небольшого числа страниц и запросов (десятки), для которых будет собрано максимальное число показателей, известных вам. После предварительного анализа информации можно выделить показатели, наиболее сильно связанные с интересующим вас параметром, и на следующих этапах собирать данные только о них. Эта тема достойна отдельной книги, и, увы, никак не может вместиться в объем статьи.
Выводы
Мы прошлись по основным алгоритмам поисковиков, посмотрели, как надо оптимизировать сайт, где брать информацию и с чего начинать. Что дальше? Мой совет остается неизменным: давайте думать и работать, и превосходный результат обязательно появится!
P. S. Благодарю Илью Сегаловича (Яндекс) за ценные замечания по статье.
Recent Comments