Яндекс для всех - М. Абрамзон
- Категория: 🟢Компьютеры и Интернет / Интернет
- Название: Яндекс для всех
- Автор: М. Абрамзон
- Возрастные ограничения:Книга может включать контент, предназначенный только для лиц старше 18 лет.
- Поделиться:
Шрифт:
Интервал:
Закладка:
Михаил Абрамзон
Яндекс для всех
Аркадий Волож — основатель и генеральный директор компании "Яндекс".
Является соучредителем и членом Совета директоров компании Infinet Wireless (производитель оборудования WiMAX в России). Был соучредителем компании CompTek International, одного из крупнейших дистрибьюторов сетевого и телекоммуникационного оборудования в России, и руководил этой компанией с 1989 по 2000 год. Принимал активное участие в процессе дерегулирования частот для беспроводных сетей, легализации IP-телефонии. У Аркадия высшее образование в области прикладной математики.
Введение
Так начинался "Яндекс"
В 2000 году акционерами CompTek — компании, создавшей и в течение долгого времени развивавшей проект Яndex, была учреждена компания "Яндекс". Компания ru-Net Holdings инвестировала 5 млн 280 тыс. долларов и получила в новой компании долю в 35,72 %. В число акционеров вошли также менеджмент и ведущие разработчики поисковой системы. Генеральным директором стал Аркадий Волож. Но история Яндекса началась задолго до этого события.
Десятью годами ранее в компании "Аркадия" начались разработки поискового программного обеспечения. Через два года были созданы две информационно-поисковые системы — Международная классификация изобретений, а также Классификатор товаров и услуг. Системы работали под DOS и позволяли проводить поиск, выбирая слова из заданного словаря с использованием стандартных логических операторов.
Еще через РіРѕРґ "Аркадия" стала РѕРґРЅРёРј РёР· подразделений компании CompTek Рё РІ течение РґРІСѓС… последующих лет выполняла работы РїРѕ усовершенствованию поисковых технологий. Р’ сотрудничестве СЃ лабораторией Р®. Р”. Апресяна (Рнститут проблем передачи информации Р РђРќ) был разработан словарь, обеспечивающий РїРѕРёСЃРє СЃ учетом морфологии СЂСѓСЃСЃРєРѕРіРѕ языка. Теперь пользователи могли задавать РІ запросе любые формы слов.
Рти разработки позволили создать "Библейский компьютерный справочник", справочник стандартов "Рнформ — Норматив", электронные научные издания "Рђ. РЎ. Грибоедов", "Пушкин. Рлектронный фонд СЂСѓСЃСЃРєРѕР№ классической литературы", словарь языка Грибоедова.
Следующим шагом стала разработка алгоритма построения гипотез, после чего морфологический разбор перестал быть привязанным к словарю — если какого-либо слова в словаре нет, то находятся наиболее похожие на него словарные слова, и по ним строится модель словоизменения.
Летом 1996 РіРѕРґР° руководство компании CompTek Рё разработчики РїРѕРёСЃРєРѕРІРѕР№ системы пришли Рє выводу, что развитие самой технологии важнее Рё интереснее, чем создание прикладных продуктов РЅР° базе РїРѕРёСЃРєР°. Рсследования рынка показали своевременность Рё большие перспективы поисковых технологий.
Первая демонстрация продуктов серии Яndex (Яndex.Site, Яndex.Dict) была проведена на выставке Netcom'96 18 октября 1996 года. Первый из них обеспечивает поиск по своему сайту и установлен на сотнях серверов Рунета. Второй продукт, морфологическое расширение запроса, до сих пор используется для передачи запросов на AltaVista.
Рђ уже 21 РЅРѕСЏР±СЂСЏ была выполнена первая установка системы РЇndex.Site РЅР° веб-сервере Рздательского РґРѕРјР° "Открытые системы". Рто дало возможность искать информацию СЃ учетом морфологии СЂСѓСЃСЃРєРѕРіРѕ языка. Р РІ том же РЅРѕСЏР±СЂРµ всем пользователям была предоставлена бесплатная возможность русифицированного РїРѕРёСЃРєР° необходимой информации СЃ учетом морфологии СЂСѓСЃСЃРєРѕРіРѕ языка СЃ помощью РїРѕРёСЃРєРѕРІРѕРіРѕ сервера AltaVista.
Еще через полгода появился Яndex.CD — поиск документов на CD-ROM, а затем Яndex.Lib — полнофункциональная библиотека Яndex для встраивания в различные приложения и базы данных. Рнаконец осенью 1997 года был открыт Yandex.Ru.
Основными нововведениями поисковой системы Yandex.Ru были проверка уникальности документа — этим достигалось исключение копий в различных кодировках, и отличительные свойства поискового алгоритма Yandex: поиск с учетом морфологии русского языка, с учетом расстояния и тщательно разработанный алгоритм оценки релевантности.
Оптимизация поискового алгоритма позволила реализовать проблему поиска по разным зонам текста, ограничение поиска на группу сайтов, поиск по ссылкам и изображениям. Также, впервые в Рунете, было введено понятие индекс цитирования — количество сайтов, ссылающихся на данный ресурс. Затем был открыт "Семейный Яндекс" с фильтрацией результатов поиска от мата и порнографии.
Название РЇndex появилось РІ то время, РєРѕРіРґР° будущий генеральный директор будущей компании Аркадий Волож Рё будущий директор РїРѕ технологиям компании Рлья Сегалович разрабатывали технологию РїРѕРёСЃРєР° неструктурированной информации СЃ учетом морфологии СЂСѓСЃСЃРєРѕРіРѕ языка. Требовалось слово, отражающее суть РЅРѕРІРѕР№ технологии, которое Р±С‹ хорошо звучало, легко писалось Рё запоминалось. РўРѕРіРґР° РЅР° РѕСЃРЅРѕРІРµ английского слова index был предложен вариант — yet another indexer ("еще РѕРґРёРЅ индексатор" или Языковой иНдекс). РљСЂРѕРјРµ этого, Аркадий предложил Р±СѓРєРІСѓ "РЇ" РІ названии — специфически СЂСѓСЃСЃРєСѓСЋ — СЂСѓСЃСЃРєРѕР№ Рё оставить, для наглядности. Так появилось слово "РЇndex".