Категории

🟢Любовные романы
- Слеш
- Порно
- Фемслеш
- Современные любовные романы
- Любовно-фантастические романы
- Остросюжетные любовные романы
- Короткие любовные романы
- Книги 18+
- Исторические любовные романы
- Зарубежные любовные романы
- Роман
- love
- Прочие любовные романы
🟠Фантастика и фэнтези
- Социально-философская фантастика
- Бизнес
- Ироническая фантастика
- Ироническое фэнтези
- Фэнтези
- Попаданцы
- Боевая фантастика
- Научная Фантастика
- Детективная фантастика
- Юмористическая фантастика
- Космическая фантастика
- Городская фантастика
- Эпическая фантастика
- Героическая фантастика
- Разная фантастика
- Альтернативная история
- Ужасы и Мистика
- Киберпанк
- LitRPG
- Космоопера
- Мистика
- Технофэнтези
- Русское фэнтези
- Книги магов
- Боевое фэнтези
- Историческое фэнтези
- Иностранное фэнтези
- Городское фентези
- Сказочная фантастика
- Любовное фэнтези
- Романтическая фантастика
- Разное фэнтези
- Романтическое фэнтези
- Стимпанк
- Историческая фантастика
- Зарубежная фантастика
- Постапокалипсис
- Социально-психологическая
- Социально-философская фантастика
- Ненаучная фантастика
🟢Приключения
- Исторические приключения
- Путешествия и география
- Прочие приключения
- Природа и животные
- Морские приключения
- Приключения про индейцев
- Вестерн
- Зарубежные приключения
🟠Детективы и Триллеры
- Детектив
- Триллер
- Боевик
- Классический детектив
- Иронический детектив
- Полицейский детектив
- Криминальный детектив
- Исторический детектив
- Шпионский детектив
- Крутой детектив
- Политический детектив
- Иностранный детектив
- Маньяки
- Зарубежные боевики
🟢Документальные книги
- Биографии и Мемуары
- Публицистика
- Прочая документальная литература
- Критика
- Искусство и Дизайн
- Военная документалистика
🟠Проза
- Юмор
- Современная проза
- Русская классическая проза
- Русская современная проза
- Классическая проза
- Историческая проза
- Советская классическая проза
- Проза
- О войне
- Повести
- Контркультура
- Зарубежная современная проза
- Зарубежная классика
- Рассказы
- Разное
- Эссе
- Очерки
- Афоризмы
- Магический реализм
- Сентиментальная проза
- Эпистолярная проза
- Семейный роман/Семейная сага
- Антисоветская литература
- Феерия
- Новелла
🟢Научные и научно-популярные книги
- О животных
- Биохимия
- География
- Шпаргалки
- История
- История Европы
- Прочая научная литература
- Психология
- Политика
- Юриспруденция
- Культурология
- Медицина
- Религиоведение
- Науки: разное
- Языкознание
- Техническая литература
- Воспитание детей, педагогика
- Биология
- Психология, личное
- Деловая литература
- Научпоп
- Детская психология
- Беременность, ожидание детей
- Физика
- Образовательная литература
- Психотерапия
- Математика
- Филология
- Литературоведение
- Науки о космосе
- Социология
- Иностранные языки
- Альтернативная медицина
- Обществознание
- Химия
- Транспорт, военная техника
- География
- Зоология
- Архитектура
- Педагогика
- Ветеринария
- Зарубежная психология
- Государство и право
- Зарубежная публицистика
- Радиотехника
- Учебники
- Ботаника
- Астрология
- Экология
- Рефераты
- Биофизика
🟠Детская литература
- Загадки
- Сказка
- Детская фантастика
- Детские приключения
- Детская проза
- Детские остросюжетные
- Прочая детская литература
- Детская образовательная литература
- Учебная литература
- Детские стихи
- Зарубежные детские книги
- Детские детективы
- Школьные учебники
- Бизнес для детей
- Книги для подростков
- Книги для дошкольников
- Буквари
- Детская познавательная и развивающая литература
- Внеклассное чтение
- Детский фольклор
🟢Разная литература
- Подростковая литература
- Пословицы, поговорки
- Прочее
- Периодические издания
- Фанфик
- Гиды, путеводители
- Военное
- Военная техника, оружие
- Военная история
- Литература 19 века
- Современная зарубежная литература
- Великолепные истории
- Цитаты из афоризмов
- Газеты и журналы
- Зарубежная образовательная литература
- Музыка, музыканты
- Визуальные искусства
- Кино
- Современная литература
- Музыка, танцы
- Начинающие авторы
- Авто и ПДД
- Отраслевые издания
- Недвижимость
- Боевые искусства
- Изобразительное искусство, фотография
- Готические новеллы
- Истории из жизни
- Спецслужбы
- Культура и искусство
- Зарубежная прикладная литература
- Шахматы
🟠Религия и духовность
- Религия: окультизм
- Религия: протестантизм
- Хиромантия
- Религии: разное
- Религия
- Эзотерика
- Самосовершенствование
- Прочая религиозная литература
- Буддизм
- Зарубежная религиозная литература и эзотерика
- Язычество, паганизм
- Религия: христианство
- Православие
- Религия: иудаизм
- Индуизм
- Религия: ислам
🟢Поэзия, Драматургия
- Мистерия
- Поэзия
- Драматургия
- Кино, театр
- Палиндромы
- в стихах
- Зарубежная драматургия
- Эпическая поэзия
- Театр
- Сценарии
- Драма
- Водевиль
- Трагедия
- Верлибры
- Лирика
- Киносценарии
- Песенная поэзия
- Экспериментальная поэзия
- Зарубежная поэзия
- Басни
🟠Домоводство, Дом и семья
- Интерьеры
- Фэн-шуй
- Эротика, Секс
- Ремонт в квартире
- Здоровье
- Кулинария
- Спорт
- Хобби и ремесла
- Прочее домоводство
- Домашние животные
- Сделай сам
- Сад и огород
- Развлечения
- Семейная психология
- Дом, семья
- Отдых / туризм
- Рыбалка
- Охота
🟢Юмор
- Комедия
- Юмористическая проза
- Прочий юмор
- Любовные романы
- Юмористическое фэнтези
- Юмористические стихи
- Анекдоты
- Драматургия
- Сатира
🟠Бизнес
- Внешнеэкономическая деятельность
- Тайм-менеджмент
- О бизнесе популярно
- Менеджмент и кадры
- Бизнес
- Малый бизнес
- Управление, подбор персонала
- Личная эффективность
- Менеджмент
- Корпоративная культура, бизнес
- Личные финансы
- Экономика
- Ценные бумаги и инвестиции
- Личная эффективность
- Маркетинг, PR, реклама
- Финансы
- Работа с клиентами
- Переговоры
- Банковское дело
- Поиск работы
- Ораторское искусство / риторика
- Продажи
- Бухучет и аудит
- Государственное и муниципальное управление
- Кадровый менеджмент
- Делопроизводство, офис
- Краткое содержание
- Интернет-бизнес
- Зарубежная деловая литература
🟢Компьютеры и Интернет
- Цифровая обработка сигналов
- Прочая околокомпьтерная литература
- Программирование
- Интернет
- Программы
- Программное обеспечение
- Компьютерное "железо"
- Базы данных
🟠Старинная литература
- Древневосточная литература
- Мифы. Легенды. Эпос
- Античная литература
- Европейская старинная литература
- Прочая старинная литература
- Древнерусская литература
- Фольклор
- Зарубежная старинная литература
🟢Справочная литература
- Энциклопедии
- Руководства
- Справочники
- Прочая справочная литература
- Словари
🟠Блог

Меню

Самые читаемые

Путевые заметки рассеянного магистра - Владимир Левшин

Человек: откуда, как и куда - Анни Безант

Правила Святой Православной Церкви с толкованиями - Епископ Никодим Милош

ChitatKnigi.com » 🟢Компьютеры и Интернет » Программирование » Грокаем алгоритмы. Иллюстрированное пособие для программистов и любопытствующих - Адитья Бхаргава

Грокаем алгоритмы. Иллюстрированное пособие для программистов и любопытствующих - Адитья Бхаргава

Читать онлайн Грокаем алгоритмы. Иллюстрированное пособие для программистов и любопытствующих - Адитья Бхаргава

1 ... 37 38 39 40 41 42 43 44 45 46

Перейти на страницу:

Шрифт:

Интервал:

Закладка:

Сделать

В данном случае все элементы в массиве просто суммируются: 1 + 2 + 3 + 4 + 5 = 15! Я не буду рассматривать свертку более подробно, потому что в Интернете хватает руководств по этой теме.

MapReduce использует эти две простые концепции для выполнения запросов на нескольких машинах. При использовании большого набора данных (миллиарды записей) MapReduce выдаст ответ за минуты, тогда как традиционной базе данных на это потребуются многие часы.

Фильтры Блума и HyperLogLog

Представьте себя на месте сайта Reddit. Когда пользователь публикует ссылку, нужно проверить, публиковалась ли эта ссылка ранее. Истории, которые еще не публиковались, считаются более ценными.

Или представьте себя на месте поискового бота Google. Обрабатывать веб-страницу нужно только в том случае, если она еще не обрабатывалась ранее. Итак, нужно проверить, обрабатывалась ли страница ранее.

Или представьте себя на месте bit.ly — сервиса сокращения URL. Пользователи не должны перенаправляться на вредоносные сайты. У вас имеется набор URL-адресов, которые считаются вредоносными. Теперь нужно выяснить, не направляется ли пользователь на URL-адрес из этого набора.

Во всех этих примерах возникает одна проблема. Имеется очень большой набор данных.

Появляется новый объект, и вы хотите узнать, содержится ли он в существующем наборе. Эта задача быстро решается при помощи хеша. Например, представьте, что Google создает большой хеш, ключами которого являются все обработанные страницы.

Как узнать, обрабатывался ли сайт adit.io? Нужно заглянуть в хеш.

У adit.io имеется свой ключ в хеше, а значит, адрес уже обрабатывался. Среднее время обращения к элементам в хеш-таблице составляет O(1). Таким образом, вы узнали о том, что страница adit.io уже проиндексирована за постоянное время. Неплохо!

Вот только этот хеш получится просто огромным. Google индексирует триллионы веб-страниц. Если хеш содержит все URL-адреса, индексируемые Google, он займет слишком много места. У Reddit и bit.ly возникает аналогичная проблема. Сталкиваясь с такими объемами данных, приходится действовать более изобретательно!

Фильтры Блума

Для решения проблемы можно воспользоваться вероятностными структурами данных, которые называются фильтрами Блума. Они дают ответ, который может оказаться ложным, но с большой вероятностью является правильным. Вместо того чтобы обращаться к хешу, вы спрашиваете у фильтра Блума, обрабатывался ли этот URL-адрес ранее. Хеш-таблица даст точный ответ. Фильтр Блума дает ответ, правильный с высокой вероятностью:

• возможны ложно-положительные срабатывания. Фильтр скажет: «Этот сайт уже обрабатывался», хотя этого не было;

• ложно-отрицательные срабатывания исключены. Если фильтр утверждает, что сайт не обрабатывался, вы можете быть в этом уверены.

Фильтры Блума хороши тем, что занимают очень мало места. Хеш-таблице пришлось бы хранить все URL-адреса, обрабатываемые Google, а фильтру Блума это не нужно. Фильтры Блума очень удобны тогда, когда не нужно хранить точный ответ (как во всех приведенных примерах). Например, bit.ly может сказать: «Мы полагаем, что сайт может оказаться вредоносным, будьте особенно внимательны».

HyperLogLog

Примерно так же действует другой алгоритм, который называется HyperLogLog. Предположим, Google хочет подсчитать количество уникальных поисков, выполненных пользователями. Или Amazon хочет подсчитать количество уникальных предметов, просмотренных пользователями за сегодняшний день. Для получения ответов на эти вопросы потребуется очень много места! Так, в примере с Google придется вести журнал всех уникальных вариантов поиска. Когда пользователь что-то ищет, вы сначала проверяете, присутствует ли условие в журнале, и если нет, добавляете его. Даже для одного дня этот журнал получится гигантским.

HyperLogLog аппроксимирует количество уникальных элементов в множестве. Как и фильтры Блума, он не дает точного ответа, но выдает достаточно близкий результат с использованием малой части памяти, которую обычно занимает такая задача.

Если вы используете большие объемы данных и вас устраивают приближенные ответы — воспользуйтесь вероятностными алгоритмами!

Алгоритмы SHA

Помните процедуру хеширования из главы 5? На всякий случай освежу вашу память: имеется ключ, вы хотите поместить связанное с ним значение в массив.

Элемент, в котором размещается значение, определяется хеш-функцией.

Значение сохраняется в соответствующей позиции массива.

Хеширование позволяет выполнять поиск с постоянным временем. Когда вам потребуется узнать значение, связанное с ключом, вы снова применяете хеш-функцию, и она за время O(1) сообщает, какую позицию следует проверить.

Хеш-функция должна обеспечивать достаточно равномерное распределение. Итак, хеш-функция получает строку и возвращает номер ячейки, соответствующий этой строке.

Сравнение файлов

Одну из разновидностей хеш-функций составляет алгоритм SHA (Secure Hash Algorithm). Он получает строку и возвращает хеш-код этой строки.

Возможно, терминология не настолько проста, насколько хотелось бы. Алгоритм SHA — хеш-функция; эта функция генерирует хеш-код, который представляет собой короткую строку. Хеш-функция для хеш-таблиц преобразует строку в индекс

1 ... 37 38 39 40 41 42 43 44 45 46

Перейти на страницу:

Отывы о книге