+7(495)280-3723 info@stack.net
 

Поисковик Turtle.Ru: резвый старт "Черепашки"

[ 13.09.2007 ]

Недавно мы стали свидетелями появления на свет новой фигуры на горизонтах российской части Сети. 27 июня в торжетсвенной обстановке была запущена в эксплуатацию поисковая машина Turtle.Ru. Уже сейчас ясно, что она готова составить конкуренцию уважаемым Интернет-ресурсам, как "Рамблер", "Яндекс" и Google.

Казалось бы, рынок поисковых Интернет-услуг уже давно и прочно поделен. Однако разработчики поисковика Turtle.Ru с оптимизмом оценивают перспективы своего детища. Основания для хороших прогнозов имеются: как-никак автором проекта стала группа компаний Stack Group, в свое время приложившая руку к созданию "Рамблера". Таким образом, новая система опирается на реальный опты ее специалистов и серьезную алгоритмическую базу. Партнером по реализации выступил один из крупнейших отечественных поставщиков услуг связи RTComm.Ru. Итак, что же получилось в результате их сотрудничества?

Изобретать велосипед не пришлось. Turtle.Ru, как и все современные поисковые машины, действует по давно опробованной и зарекомендовавшей себя схеме. Автономные роботы-краулеры постоянно обходят все доступные сайты, лежащие в пределах определенной доменной зоны (в данном случае это национальные домены второго уровня России и стран СНГ), "складируя" добытую информацию в общую базу данных. Именно по ее индексам и осуществляется поиск запрошенных пользователями слов и фраз. Чтобы база не теряла актуальности, данные в ней должны постоянно обновляться, что зависит от количества и скорости роботов. Этому участку было уделено особое внимание: разработчики считают, что созданные ими "черепашки" превосходят все существующие аналоги по быстроте и продуктивности. Другой немаловажный фактор успешной работы поисковика общий объем его базы. В этом отношении у Turtle.Ru тоже все в порядке: на момент запуска в эксплуатацию система уже хранила более 80% данных Рунета, емкость которого оценивается более чем в 100 млн документов. И эти цифры продолжают расти.

Немаловажен и такой показатель, как релевантность выдаваемых результатов, который в любой поисковой машине рассчитывается по своей уникальной схеме. Та, что применена в Turtle, не стала исключением. Авторы уверены, что она наиболее прогрессивна из всех современных, однако обещают вносить в нее необходимые коррективы по мере накопления статистики обращений к серверу.

Наконец, есть у "Черепахи" и еще одна черта, делающая ее непохожей на другие поисковики. Дело в том, что архитектура системы изначально разрабатывалась как распределенная (в отличие от аналогов, построенных по централизованному принципу). На практике это означает, что каждый из множества компьютеров, составляющих внутренние ресурсы поисковика Turtle.Ru, выполняет отдельные логические операции. Кроме этого, распределенный механизм позволяет создавать локальные проекты, действующие, скажем, в рамках какого-либо региона или отрасли. Поскольку критерии ограничения зоны поиска легко меняются, программная база способна удовлетворить запросы практически любого клиента. Например, если бы правительство Москвы решило организовать подобную систему поиска по Интернет-ресурсам города, то такая версия поисковика обслуживала только столицу. В дальнейшем авторы как раз планируют заняться продажей всем желающим информационных решений, основанных на Turtle.

Впрочем, по словам разработчиков поисковика, на запуск своего детища их подвигла не жажда денег. Как подчеркнул на презентации генеральный директор компании "Стек Технологии", входящей в структуру Stack Group, руководитель группы разработчиков поисковика Д.В.Крюков, главной задачей было внедрение новаторских решений и, вероятно, лучшей на сегодняшний день технологии.

В день открытия мы опробовали возможности сервера Turtle. Ru. С точки зрения обычного пользователя, работа на нем ничем не отличается от поиска в других аналогичных системах. Разве что порадовала такая интересная особенность как "поиск по фрагменту", когда задается не одно слово или строка, а целый фрагмент текста, один-два абзаца. Таким образом, например, легко находится первоисточник интересующего нас документа или, наоборот, отслеживается явный плагиат.

Несмотря на еще совсем "скромный возраст", точность поиска "Черепахи" почти не отстает от конкурентов. Да, качества результатов, выдаваемых тем же Google, ей пока достичь не удается. Но это временные проблемы, которые должны исчезнуть по мере накопления статистической базы данных.

Юрий Анищенко, "Компьютеры"

См. также

Полнотекстовый поиск: поисковик StackSearch
Поисковая машина StackSearch: преимущества
Поисковая система StackSearch: характеристики системы
Поисковая машина StackSearch: поисковик в сравнении с другими