+7(495)280-3723 info@stack.net
 

Черепаха стоимостью более чем $100 тыс. доползла до финиша

[ 13.09.2007 ]

27 июня в интернет-центре CafeMax состоялась торжественная презентация новой поисковой машины Turtle.Ru.

Среди приглашенных на конференцию были представители практических всех интернет-изданияй Рунета. Об особенностях нового поисковика рассказывали руководители Группы компаний Стек, а также представители компании РТКомм.Ru.

По словам руководства Stack Group, разработка "Черепахи" началась в феврале прошлого года. В основу нового поисковика легли собственные разработки Группы компаний Стек, являющиеся результатом многолетних исследований в области вычислительных алгоритмов, распределенных вычислений и компьютерной лингвистики.

Высокоскоростные каналы своей магистральной сети для обеспечения оптимального доступа к "Черепахе" на всей территории России предоставил крупнейший всероссийский оператор - компания РТКомм.Ru.

"Объединение технологических возможностей двух компаний, специализирующихся в области информационных и ip-технологий, позволит интегрировать в интернет целый спектр сервисов, где требуется поиск такого масштаба", - говорится в совместном заявлении Stack Group и РТКомм.Ru.

Как удалось выяснить корреспонденту "Вебпланеты", на сегодняшний день в разработку "Черепахи", с учетом работы специалистов, аренды каналов и стоимости серверов, вложено больше $100 тыс. Изначально на коммерческий успех разработчики Turtle.Ru пока не рассчитывают. Как заявили они на прошедшей презентации, намного важнее сейчас понять, насколько будет востребована и популярна "Черепаха" в первое время работы сервиса. Не исключено, что в ближайшее время будет проведена рекламная кампания нового поисковика.

Turtle представляет собой расширяемую многоязычную систему. Основное преимущество "Черепахи" перед другими поисковыми машинами - принцип распределения ресурсов. Это означает, что отдельные компоненты поисковика Turtle могут находиться на общем сервере или располагаться на разных компьютерах, объединенных общими "информационными шинами".

Такая структура поисковика позволяет: во-первых, легко наращивать мощность поисковой машины, подключая в минимальном количестве дополнительные аппаратные ресурсы; во-вторых, в случае необходимости заменять без остановки системы ее отдельные элементы. Составляющие "Черепахи" позволяют одновременно оперировать двумя потоками информации: один связан с непрерывным осмотром интернета, другой с обработкой конкретных поисковых запросов. Другой особенностью поисковика Turtle.Ru является возможность распознавания 24 языков народов мира. К тому же, возможно подключение других языков.

В поисковике Turtle, по словам разработчиков, используется новый метод ранжирования результатов. "Первые выданные в результатах поиска документы наиболее точно соответствуют запросу", утверждают в Stack Group. Однако, что из себя представляет новый метод ранжирования результатов выяснить так и не удалось.

"Уже сейчас объем базы данных превышает 80 млн. документов и охватывает практически все информационное пространство Рунета", - говорят разработчики "Черепахи". Это, кстати, намного больше, чем у популярного в Рунете "Яндекса", которому известно 68,3 млн. документов.

На сегодняшний день сканированием Рунета занимается 12 специальных серверов. За одни сутки эти сервера обходят примерно 5 млн. документов. Нетрудно подсчитать, что за 8-10 дней довольно шустрая "Черепаха" обходит почти весь Рунет, что само по себе является немаловажным фактом - процент "мертвых ссылок" довольно быстро сводится к нулю. Как сообщила корреспонденту "Вебпланеты" руководитель по связям с общественностью Stack Group Елена Воробьева, "Черепаха" способна обрабатывать 10 млн. запросов за одну секунду.

Будет ли яркое будущее у "Черепахи" - пока сказать сложно. Несмотря на всю ее быстроту, качество поиска пока оставляет желать лучшего. Например, при поисковом запросе "Вебпланета", "Черепаха" выдает в первых результатах ссылку на интернет-издание RICN, а ссылка на заглавную страницу "Вебпланеты" в первых 10 найденных документах отсутствует. "Яндекс", Google, "Рамблер" и "Апорт" этот тест пока проходят на пять баллов.

Вебпланета

См. также

Полнотекстовый поиск: поисковик StackSearch
Поисковая машина StackSearch: преимущества
Поисковая система StackSearch: характеристики системы
Поисковая машина StackSearch: поисковик в сравнении с другими