Недавно озаботился тем как гугл обрабатывает мои страницы если я использую ссылки с параметрами, причем эти параметры нужны только для страницы и не влияют на содержимое. Люблю я ссылаться так http://clipdiary.com/?s=fromblog или http://clipdiary.com/?s=reclamacnn или ?s=menu, ?s=nagscreen etc, все время думаю что потом проанализирую, разумеется не анализирую, но ссылаться все равно люблю 🙂
Недавно заметил в google webmaster tools –> Links to your site –> много таких ссылок (видимо народ приходит с программы на сайт, копирует ссылки и потом она уже расползается по инету) и задумался а как гугл их обрабатывает – понимает ли он что это все одна страница или нет ? С одной стороны гугл умный, с другой – на странице есть динамическое содержание – так что хз. В сврусе подсказали что есть специальный тег rel="canonical". То есть просто во все “дублирующиеся” страницы добавляем <link rel="canonical" href="наш правильный урл"> и типа все будет ок. Подробнее о теге canonical
Сегодня подправил движок сайта таким образом что бы если в запрашиваем урле есть строка запроса (?someparameters) то мы в <head> автоматически добавляем ссылку на “каноническую страницу” – эту же, но без строки запроса. имхо изящно:) Работы мало – порядку больше. Теперь осталось посмотреть изменятся ли данные в webmaster tools.