К вопросу о pingback и trackback
Занимаюсь реализацией пинга для MaxSite CMS и как-то возник «философский вопрос»: «А нафига?». Дабы понять о чем речь, кратенько расскажу об этих технологиях. Я уже когда-то их описывал и теперь немного технической информации.
Дело в том, что пинги работают по такому алгоритму: мой сайт получив запрос от чужого сайта, должен отправиться на чужой сайт и проверить а) наличие указания на пинг-сервер (XMLRPC), б) найти в тексте ссылку на мой сайт. Если условия выполнены, то на моем сайте появляется комментарий.
Трекбак работает чуть по другому. Вместо того, чтобы отправляться на чужой сайт, мой сайт просто ставит трекбак на премодерацию. Но трекбак с чужого сайта передает и текст для комментария. А в нем может быть всё, что угодно.
Обе технологии уже скомпроментированы, поскольку давно взяты на вооружение спамерами.
Пинг. Спецификация такова, что отправить запрос (пинг) может кто угодно. То есть злоумышленник может подделать пинг и указать в качестве ответной ссылки страницу жертвы. Такой пинг можно отправить сразу на десятки-сотни-тысячи блогов. А поскольку у многих используется WordPress с настройкой принимать пинги и трекбаки, то все эти блоги «полезут» на сайт жертвы проверять установленные на них ссылки. И главное здесь не в том, что ссылки как таковой нет, а в том, что создается значительная нагрузка на сервер жертвы. В общем получается DDOS-атака.
Иной раз спамер может отправить и нормальный пинг на вашу запись. Вы даже можете это вручную проверить и убедитесь в том, что ссылка стоит. Вы, естественно, разрешаете публикацию этого пинга и ссылка спамера оказывается на вашем сайте. Но, поскольку вы не собираетесь вручную проверять ссылки каждый день, то спамер преспокойно удаляет вашу ссылку через несколько дней. (Таким образом спамер уменьшает количество внешних ссылок на своем сайте. Считается, что это благотворно сказывается на поисковой выдаче. Очень спорно, ИМХО.)
Трекбак. С ним ситуация еще хуже, поскольку можно отправить свой спамерский текст сразу на множество блогов. И хотя в этом случае блог не будет проверять ответную ссылку, а лишь отправит короткий ответ (вроде «ОК»), всё равно количество трекбаков может оказаться значительным. Проблема здесь в том, что автор блога вынужден вручную проверять каждый трекбак. Ну или с помощью спам-фильтров.
Поскольку трекбак позволяет отправлять произвольный текст, то спамеры расчитывают на то, что на некоторых блогах трекбаки не нуждаются в премодерации. Например для WordPress будет достаточно указать только одну ссылку в тексте трекбака, чтобы миновать «подозрительность». И если блог настроен публиковать все комментарии, то спам будет опубликован автоматически.
Из-за того, что в трекбаках доля спама значительно превышает нормальные, то многие блогеры давно уже отключили возможность их получения. Таким образом они сразу отсекли львинную долю спама.
С пингами несколько сложнее. С одной стороны спам через них не пройдет, поскольку нет ответной ссылки, но, подумайте сами, не только блог жертвы подвергается атаке через ваш, но и ваш также, поскольку процесс обоюдный: именно ваш блог запрашивает указанную страницу. При большом количестве пингов через ваш сайт, создается нагрузка уже вашего сервера. То есть вы видите, что посещаемость на обычном уровне, а сервер выдает перегрузку, поскольку сам генерирует множество запросов.
Возможно в 2001 году, когда придумали pingback, Интернет был не таким массовым и спамеры в основном использовали электронную почту. С появлением блоговых «движков», где этот механизм уже встроен, спамеры и прочие вредители просто получили в подарок еще один инструмент.
Вот такая невеселая картина получается.
Существует еще один псевдоплюс во всей этой технологии: пинг на ping-сервисы или как их называют - сервисы обновлений. То есть при публикации новой записи отправляется пинг на такой сервис. Вроде как вы уведомляете, что появилась новая запись в вашем блоге.
В последнее время я всё больше сомневаюсь в полезности этих сервисов. Теоретически, после отправки вами пинга, ваша новая запись (например заголовок и ссылка) должны появиться на пинг-сервисе. Я просмотрел список из нескольких десятков и только на единицах есть некое подобие такого списка. То есть никакого трафика или обратной ссылки с них вы не получите.
Я допускаю, что пинг-сервис нужен для поисковика, но даже всеми нами горячо любимый Яндекс хоть и принимает пинг, всё, что готов сделать, так это направить (?) своего робота на новую запись.
Вроде бы всё замечательно, но точно с таким же успехом поисковик проверит сайт и через RSS-ленту. А нормальные поисковики, помимо всего, еще учитывают и meta «revisit-after» и robots.txt, что делает этот процесс более управляемым.
Даже если взять Google, то с помощью своего feedburner.com он отслеживает огромное количество обновлений блогов через RSS. Думаю, что в этом каждый убеждался, когда читает записи через Google Reader и видит с какой задержкой они там появляются - всего несколько десятков минут.
Таким образом смысл в пинг-сервисах стремительно падает до нуля.
Главный же вопрос: каким образом организовать нормальное автоматическое уведомление от других блогов, остается открытым. Может кто-то что-то и придумает...
Постоянная ссылка: http://maxsite.org/?p=393
Версия для печати
RSS: К вопросу о pingback и trackback

