Автор статьи:
|
|||||||||||||
| Несмотря на то, что фреймы* в настоящее время очень популярны (особенно среди непрофессионалов), их использование в приложении к поисковикам считается моветоном. раньше поисковые роботы индексировали только текст, находящийся на страницах с описанием фреймов, полностью игнорируя ссылки на внутренние фреймы, из-за чего в старых рекомендациях по построению веб-сайтов всегда можно встретить упоминание об обязательном использовании html-тега noframes. Сейчас эта ситуация изменилась, и фреймы обрабатываются корректно многими поисковиками (хотя, например, Altavista все еще придерживается старых традиций), однако страница с описанием фрейма — это лишний запрос для поискового робота, который не может посвящать все свое время вашему веб-сайту, так что из-за выборки страницы с фреймом он отложит индексирование какой-нибудь другой, более важной, страницы на другое посещение вашего веб-сайта. Кроме того, если в результатах поиска появятся ссылки на внутренние страницы, то пользователь увидит их без фреймового обрамления (разве что вы воспользуетесь стандартным трюком с обработкой http-заголовка Referer, но он работает далеко не всегда). Поэтому, если вы обратите внимание на портфолио серьезных веб-дизайнерских групп, то обнаружите, что фреймами они не пользуются никогда.
Проблему лишнего запроса порождает и использование заставок (splash screen). Это может быть, например, страница с логотипом фирмы и ссылкой «вход» или выбором языка — страница, не несущая информации, но зато требующая лишнего запроса робота и занимающая полезное место в базе данных поисковой системы. Почему бы просто не расположить логотип в одном верхнем углу страницы, а переключатель языка в другом? |
|
||||||||||||
Поскольку поисковики индексируют только текст, графика остается невостребованной. Сейчас почти все поисковые системы предоставляют возможность поиска по имени файла изображения, но это не совсем то, что хотелось бы, поэтому для всех изображений рекомендуется проставлять подписи (параметр alt html-тега img). То же относится и к флеш-роликам, на которых сейчас строятся целые веб-сайты. Если вся система навигации вашего веб-сайта построена на флеш-роликах, то робот остановится на первой же странице и не сможет пройти глубже, поскольку не найдет ссылок. В настоящее время поисковая система «Рамблер» умеет выбирать ссылки из флеш-файлов как раз для того, чтобы решить эту проблему, но при создании веб-сайта желательно все-таки ориентироваться на то, что «умеет» как можно большее количество поисковиков. Самый простой метод решения «проблемы флеш» — создать две версии веб-сайта: флеш-версию и html-версию. Таким образом вы одновременно позаботитесь и о тех посетителях, которые не могут пользоваться флеш-версией из-за ограничений браузера или медленной связи.
Не следует забывать, что при выборке ссылок для дальнейшего «продвижения» по вашему веб-сайту робот анализирует html-теги a, поэтому навигация через формы (html-тег form) и яваскрипт* останется для него незамеченной, и пользоваться такой навигацией можно только при условии, что она ведет на страницы, которые не нужно индексировать, либо к этим страницам есть альтернативный доступ через html-теги a. При проектировании «ссылочной инфраструктуры» веб-сайта следует помнить о том, что некоторые роботы (например, Altavista) не обрабатывают ссылки, содержащие знак ?, которые они считают динамическими. Поэтому, если у вас есть несколько динамических страниц с параметрами, которые вы желаете обязательно проиндексировать, воспользуйтесь, например, внутренними редиректами, которые предоставляет модуль mod_rewrite популярного веб-сервера* apache. С помощью одной простой директивы можно сделать так, чтобы ссылка на вашем веб-сайте имела вид /cities/russia/moscow.html, а настоящий запрос выглядел как /cgi-bin/citie |
|
||||||||||||
| В ссылках на первые страницы веб-сайтов и на директории желательно ставить в конце символ / (слеш), так как в ответ на запрос вида http://masterhost.ru любой уважающий себя веб-сервер возвратит редирект на http://masterhost.ru/, так же как на ссылку вида http://hostinfo.ru/news возвратится редирект на http://hostinfo.ru/news/. лишний редирект — это лишний запрос для поискового робота, который зря потратит на него время.
При верстке веб-сайта на каждой странице желательно поместить три основных тега, которые могут существенно повлиять на положение данной страницы в результатах поиска, если в них встречаются слова из запроса.
Не все поисковые системы одинаково обрабатывают данные теги (например, «Рамблер» игнорирует description и keywords), но в данном случае лучше рассчитывать на те поисковики, которые «умеют» больше. Помещать какие-то слова в html-комментарии «<!— —>» в качестве своеобразной замены мета-тега keywords не рекомендуется, так как омментарии поисковиками игнорируются. |
|
||||||||||||
| Многие поисковые роботы планируют посещения вашего веб-сайта в зависимости от того, насколько много информации несут его страницы, а также насколько часто они изменяются. В связи с этим категорически не рекомендуется выкладывать полупустые страницы «under construction», особенно на длительный срок, иначе потом вам придется очень долго ждать, пока робот не «поймет», что ваш веб-сайт уже давно стал нормальным и заслуживает более пристального внимания.
В каждой поисковой системе неявно заложено некое максимальное количество страниц, которые можно проиндексировать для одного веб-сайта (обычно несколько тысяч). При подходе к этому лимиту поисковый робот почти все свое время, выделенное для обработки вашего веб-сайта, начинает тратить на проверку изменений в уже проиндексированных страницах, а новые добавляет в базу данных все реже и реже. Поэтому, если ваш веб-сайт очень большой, рекомендуется разрешить для индексации только наиболее значимые его части (о том, как ограничить индексацию, см. ниже). Например, для новостного веб-сайта можно разрешать индексацию только новостей за несколько последних месяцев, а поиск в полном архиве новостей организовать «у себя». Вообще, желательно сразу закрывать доступ к страницам, не несущим полезной информации либо меняющим свое содержание или от запроса к запросу или в зависимости от cookies*. |
|
||||||||||||
| Поисковый робот «путешествует» по вашему веб-сайту, руководствуясь своим алгоритмом, вмешиваться в который вы не можете. Единственное доступное вам средство управления действиями робота — это ограничение доступа к различным частям веб-сайта. Каждый «официальный» поисковый робот периоди |


