+7(495)280-3723 info@stack.net
 

Поисковик Turtle.Ru - быстрая черепаха

[ 13.09.2007 ]

Сегодня в Рунете начал действовать новый поисковый механизм Turtle.Ru. Weblook уже сообщал о разработке компанией "Стек" нового детища, и плоды труда специалистов (поисковик Rambler - дело их же рук) не заставили себя долго ждать.

По сравнению со своими оффлайновыми родственниками, новый поисковик действует достаточно резво и эффективно. Так на запрос "черепаха", обработанный сервером за 0,0033 секунды, Turtle выдал 53096 документов. В то же время Яндекс на аналогичную просьбу выдает 55473 результата поиска, а Rambler - 31108.

Сейчас Turtle.Ru индексирует информацию примерно 81 миллионов документов российского Интернета. Новая поисковая машина понимает 24 языка. "Скрупулезно изучая каждую ячейку паутины, Turtle выясняет, с какой частотой и по каким принципам изменяется ее содержимое, чтобы точно знать, когда вернуться за новостями. Такими характеристиками не может похвастаться ни один из старожилов зоопарка!" - сообщают создатели механизма, имея в виду под словом "зоопарк" Рунет.

Сообщается также о том, что физически поисковик Turtle будет размещаться на технологической площадке компании РТКомм.Ру.

Объясняя выбор названия для ресурса, разработчики говорят о том, что работы над системой начались в марте 2001 года. "Поначалу дела шли весьма медленными темпами. Первые полгода мы занимались чисто исследовательскими проблемами различных компонент архитектуры (см. "Поисковая система Turtle. Физиология и Анатомия"). Можно сказать, что мы продвигались черепашьими шагами, так как до практической реализации дело так и не доходило. Все тестовые программы разрабатывались под этим шутливым именем. Мы не торопились, так как хотели все реализовать правильно, а не получить как можно быстрее хоть какой-то результат. Однако, когда была близка к отладке первая составляющая системы накопления и индексации, наши "черепашки" показали весьма обнадеживающие скоростные характеристики. Мы почесали в затылках и решили ничего не менять в названии. Теперь для нас равнозначными являются имена Turtle, Turtilla, "Черепаха". Как говорят, прилипло".

Создатели поисковика Turtle сообщают также, что владелец любого сайта может запретить роботам поисковой машины индексировать как ресурс в целом, так и отдельные документы. Роботы индексируют и динамические страницы, однако "Обычно мы исключаем из числа сканируемых документы, которые генерируют неоправданно большое количество новых ссылок. Кроме того, мы безжалостно "выкусываем" из URL фрагменты, которые поисковая машина считает частью, предназначенной для идентификации сессии. Мы не рекомендуем помещать в URL документа такие поля, для этого существует механизм "Cookies" - предупреждают разработчики.

Кстати, по адресу turtilla.ru расположена простая форма для поиска, наподобие ya.ru у Яндекса.

weblook.ru

См. также

Полнотекстовый поиск: поисковик StackSearch
Поисковая машина StackSearch: преимущества
Поисковая система StackSearch: характеристики системы
Поисковая машина StackSearch: поисковик в сравнении с другими