Категории

🟢Любовные романы
- Слеш
- Порно
- Фемслеш
- Современные любовные романы
- Любовно-фантастические романы
- Остросюжетные любовные романы
- Короткие любовные романы
- Книги 18+
- Исторические любовные романы
- Зарубежные любовные романы
- Роман
- love
- Прочие любовные романы
🟠Фантастика и фэнтези
- Социально-философская фантастика
- Бизнес
- Ироническая фантастика
- Ироническое фэнтези
- Фэнтези
- Попаданцы
- Боевая фантастика
- Научная Фантастика
- Детективная фантастика
- Юмористическая фантастика
- Космическая фантастика
- Городская фантастика
- Эпическая фантастика
- Героическая фантастика
- Разная фантастика
- Альтернативная история
- Ужасы и Мистика
- Киберпанк
- LitRPG
- Космоопера
- Мистика
- Технофэнтези
- Русское фэнтези
- Книги магов
- Боевое фэнтези
- Историческое фэнтези
- Иностранное фэнтези
- Городское фентези
- Сказочная фантастика
- Любовное фэнтези
- Романтическая фантастика
- Разное фэнтези
- Романтическое фэнтези
- Стимпанк
- Историческая фантастика
- Зарубежная фантастика
- Постапокалипсис
- Социально-психологическая
- Социально-философская фантастика
- Ненаучная фантастика
🟢Приключения
- Исторические приключения
- Путешествия и география
- Прочие приключения
- Природа и животные
- Морские приключения
- Приключения про индейцев
- Вестерн
- Зарубежные приключения
🟠Детективы и Триллеры
- Детектив
- Триллер
- Боевик
- Классический детектив
- Иронический детектив
- Полицейский детектив
- Криминальный детектив
- Исторический детектив
- Шпионский детектив
- Крутой детектив
- Политический детектив
- Иностранный детектив
- Маньяки
- Зарубежные боевики
🟢Документальные книги
- Биографии и Мемуары
- Публицистика
- Прочая документальная литература
- Критика
- Искусство и Дизайн
- Военная документалистика
🟠Проза
- Юмор
- Современная проза
- Русская классическая проза
- Русская современная проза
- Классическая проза
- Историческая проза
- Советская классическая проза
- Проза
- О войне
- Повести
- Контркультура
- Зарубежная современная проза
- Зарубежная классика
- Рассказы
- Разное
- Эссе
- Очерки
- Афоризмы
- Магический реализм
- Сентиментальная проза
- Эпистолярная проза
- Семейный роман/Семейная сага
- Антисоветская литература
- Феерия
- Новелла
🟢Научные и научно-популярные книги
- О животных
- Биохимия
- География
- Шпаргалки
- История
- История Европы
- Прочая научная литература
- Психология
- Политика
- Юриспруденция
- Культурология
- Медицина
- Религиоведение
- Науки: разное
- Языкознание
- Техническая литература
- Воспитание детей, педагогика
- Биология
- Психология, личное
- Деловая литература
- Научпоп
- Детская психология
- Беременность, ожидание детей
- Физика
- Образовательная литература
- Психотерапия
- Математика
- Филология
- Литературоведение
- Науки о космосе
- Социология
- Иностранные языки
- Альтернативная медицина
- Обществознание
- Химия
- Транспорт, военная техника
- География
- Зоология
- Архитектура
- Педагогика
- Ветеринария
- Зарубежная психология
- Государство и право
- Зарубежная публицистика
- Радиотехника
- Учебники
- Ботаника
- Астрология
- Экология
- Рефераты
- Биофизика
🟠Детская литература
- Загадки
- Сказка
- Детская фантастика
- Детские приключения
- Детская проза
- Детские остросюжетные
- Прочая детская литература
- Детская образовательная литература
- Учебная литература
- Детские стихи
- Зарубежные детские книги
- Детские детективы
- Школьные учебники
- Бизнес для детей
- Книги для подростков
- Книги для дошкольников
- Буквари
- Детская познавательная и развивающая литература
- Внеклассное чтение
- Детский фольклор
🟢Разная литература
- Подростковая литература
- Пословицы, поговорки
- Прочее
- Периодические издания
- Фанфик
- Гиды, путеводители
- Военное
- Военная техника, оружие
- Военная история
- Литература 19 века
- Современная зарубежная литература
- Великолепные истории
- Цитаты из афоризмов
- Газеты и журналы
- Зарубежная образовательная литература
- Музыка, музыканты
- Визуальные искусства
- Кино
- Современная литература
- Музыка, танцы
- Начинающие авторы
- Авто и ПДД
- Отраслевые издания
- Недвижимость
- Боевые искусства
- Изобразительное искусство, фотография
- Готические новеллы
- Истории из жизни
- Спецслужбы
- Культура и искусство
- Зарубежная прикладная литература
- Шахматы
🟠Религия и духовность
- Религия: окультизм
- Религия: протестантизм
- Хиромантия
- Религии: разное
- Религия
- Эзотерика
- Самосовершенствование
- Прочая религиозная литература
- Буддизм
- Зарубежная религиозная литература и эзотерика
- Язычество, паганизм
- Религия: христианство
- Православие
- Религия: иудаизм
- Индуизм
- Религия: ислам
🟢Поэзия, Драматургия
- Мистерия
- Поэзия
- Драматургия
- Кино, театр
- Палиндромы
- в стихах
- Зарубежная драматургия
- Эпическая поэзия
- Театр
- Сценарии
- Драма
- Водевиль
- Трагедия
- Верлибры
- Лирика
- Киносценарии
- Песенная поэзия
- Экспериментальная поэзия
- Зарубежная поэзия
- Басни
🟠Домоводство, Дом и семья
- Интерьеры
- Фэн-шуй
- Эротика, Секс
- Ремонт в квартире
- Здоровье
- Кулинария
- Спорт
- Хобби и ремесла
- Прочее домоводство
- Домашние животные
- Сделай сам
- Сад и огород
- Развлечения
- Семейная психология
- Дом, семья
- Отдых / туризм
- Рыбалка
- Охота
🟢Юмор
- Комедия
- Юмористическая проза
- Прочий юмор
- Любовные романы
- Юмористическое фэнтези
- Юмористические стихи
- Анекдоты
- Драматургия
- Сатира
🟠Бизнес
- Внешнеэкономическая деятельность
- Тайм-менеджмент
- О бизнесе популярно
- Менеджмент и кадры
- Бизнес
- Малый бизнес
- Управление, подбор персонала
- Личная эффективность
- Менеджмент
- Корпоративная культура, бизнес
- Личные финансы
- Экономика
- Ценные бумаги и инвестиции
- Личная эффективность
- Маркетинг, PR, реклама
- Финансы
- Работа с клиентами
- Переговоры
- Банковское дело
- Поиск работы
- Ораторское искусство / риторика
- Продажи
- Бухучет и аудит
- Государственное и муниципальное управление
- Кадровый менеджмент
- Делопроизводство, офис
- Краткое содержание
- Интернет-бизнес
- Зарубежная деловая литература
🟢Компьютеры и Интернет
- Цифровая обработка сигналов
- Прочая околокомпьтерная литература
- Программирование
- Интернет
- Программы
- Программное обеспечение
- Компьютерное "железо"
- Базы данных
🟠Старинная литература
- Древневосточная литература
- Мифы. Легенды. Эпос
- Античная литература
- Европейская старинная литература
- Прочая старинная литература
- Древнерусская литература
- Фольклор
- Зарубежная старинная литература
🟢Справочная литература
- Энциклопедии
- Руководства
- Справочники
- Прочая справочная литература
- Словари
🟠Блог

Меню

Самые читаемые

Путевые заметки рассеянного магистра - Владимир Левшин

Человек: откуда, как и куда - Анни Безант

Правила Святой Православной Церкви с толкованиями - Епископ Никодим Милош

ChitatKnigi.com » 🟢Компьютеры и Интернет » Прочая околокомпьтерная литература » Большие данные. Революция, которая изменит то, как мы живем, работаем и мыслим - Виктор Майер-Шенбергер

Большие данные. Революция, которая изменит то, как мы живем, работаем и мыслим - Виктор Майер-Шенбергер

Читать онлайн Большие данные. Революция, которая изменит то, как мы живем, работаем и мыслим - Виктор Майер-Шенбергер

1 ... 8 9 10 11 12 13 14 15 16 ... 57

Перейти на страницу:

Шрифт:

Интервал:

Закладка:

Сделать

Получается, что беспорядочность не является неотъемлемой частью больших данных как таковых. Она скорее результат несовершенства инструментов, которые мы используем для измерения, записи и передачи информации. Если бы технологии вдруг стали совершенными, проблема неточности исчезла бы сама собой. Беспорядочность — не внутренняя характеристика больших данных, а объективная реальность, с которой нам предстоит иметь дело. И, похоже, она с нами надолго. Как правило, кропотливое повышение точности нецелесообразно с экономической точки зрения, поскольку польза от гораздо большего количества данных выглядит более убедительно. Происходит смещение центра внимания, как и в предыдущую эпоху, когда специалисты по сбору статистики отказались от наращивания размеров выборки в пользу увеличения случайности. Теперь же мы готовы мириться с незначительными неточностями в обмен на дополнительные данные.

В рамках проекта Billion Prices Project[51] можно найти занимательный пример. Каждый месяц американское Бюро статистики труда публикует индекс потребительских цен (ИПЦ), который используется для расчета уровня инфляции. Эти цифры крайне важны для инвесторов и компаний. Федеральная резервная система учитывает ИПЦ при решении вопроса о повышении или понижении процентных ставок. Основной оклад компаний увеличивается с поправкой на инфляцию. Федеральное правительство учитывает величину оклада при расчете пособий (таких как пособие по социальному обеспечению), а также процента, выплачиваемого по некоторым облигациям.

Чтобы получить эти цифры, сотни сотрудников бюро по телефону, факсу или лично связываются с магазинами и офисами в 90 городах по всей территории США. В итоге они формируют отчет из 23 000 цен на все товары и услуги — от помидоров до такси. На это уходит около 250 миллионов долларов США в год. В такую сумму обходятся однородные, понятные и упорядоченные данные. А к моменту публикации они успевают устареть на несколько недель.

Как показал финансовый кризис 2008 года, такое отставание может быть непростительным. Ответственным лицам нужно быстрее получать показатели инфляции, чтобы действовать эффективнее. Но с традиционными методами, которые сосредоточены на сборе выборок и придают большое значение точности, это невозможно.

В ответ на это два экономиста из Массачусетского технологического института (MТИ), Альберто Кавелло и Роберто Ригобон, предложили альтернативу — взять курс на большие данные, отличающиеся гораздо большей беспорядочностью. Используя программное обеспечение для сканирования веб-страниц, они ежедневно собирают полмиллиона цен на товары. Эти данные беспорядочны, и не все собранные точки данных легко сопоставимы. Но, объединив собранные большие данные с глубоко продуманными системами анализа, в рамках проекта удалось обнаружить дефляционные колебания цен, последовавшие сразу за банкротством инвестиционного банка Lehman Brothers в сентябре 2008 года. Те же, кто привык ориентироваться на официальные данные ИПЦ, смогли увидеть это только в ноябре.

Проект МТИ вырос до пяти миллионов продуктов от 300 розничных торговцев в 70 странах и дал начало коммерческой компании PriceStats, которая используется банками и другими заинтересованными лицами для принятия взвешенных экономических решений. Безусловно, полученные цифры требуют осторожного истолкования и лучше демонстрируют тенденции в области ценообразования, чем точные цены. Но поскольку в данном случае сведений о ценах гораздо больше и они поступают в режиме реального времени, это дает ответственным лицам значительное преимущество.

Беспорядочность в действии

Во многих общественных и технологических областях мы склоняемся в пользу беспорядочности, а не точности. Рассмотрим классификацию контента. На протяжении веков люди разрабатывали таксономии и индексы для хранения и извлечения материалов. Такие иерархические системы всегда были несовершенными, и это подтвердит каждый, кто не понаслышке знаком с библиотечной картотекой. В мире малых данных эти системы были достаточно эффективны. Однако стоило увеличить масштаб на много порядков — и эти системы, в которых все якобы идеально размещено, разваливаются. На сайте для обмена фотографиями Flickr в 2011 году хранилось более шести миллиардов фотографий почти от ста миллионов пользователей. Было бы бесполезно пытаться пометить каждую из фотографий в соответствии со стандартными категориями. Разве среди них найдется категория «Кошки, похожие на Гитлера»?

На смену понятным таксономиям и, как предполагается, совершенным классификациям приходят новые механизмы — более беспорядочные, зато гораздо более гибкие. Они легче адаптируются к миру, который непрерывно развивается и изменяется. Загружая фотографии на сайт Flickr, мы добавляем к ним теги, то есть назначаем любое количество текстовых меток, и используем их для упорядочения и поиска материала. Пользователи создают и добавляют теги по своему усмотрению. Нет единой стандартизированной, предопределенной иерархии, классификации или таксономии, которых следует придерживаться. Чтобы добавить новый тег, достаточно ввести его. Добавление тегов фактически стало стандартом классификации веб-контента, который используется на сайтах социальных сетей, таких как Facebook, а также в блогах и на прочих ресурсах. Благодаря этому стандарту стало гораздо удобнее бороздить просторы веб-контента, особенно нетекстового (изображений, видео, музыки), для которого поиск по словам не подходит.

Конечно, в тегах возможны опечатки. Такие ошибки привносят неточность (не в сами данные, а только в их порядок), а это наносит удар по традиционному способу мышления, основанному на точности. Но взамен беспорядочности того, как устроены наши коллекции фотографий, мы получаем гораздо больший спектр меток и, соответственно, более широкий доступ к своим фотографиям. Мы можем объединять поисковые теги для фильтрации своих фотографий такими способами, которые были недоступны прежде. Принять неточность, присущую методу меток, — значит принять естественную беспорядочность окружающего мира. Это лекарство от более точных систем, которые пытаются навязать суматошному миру ложную стерильность, делая вид, что все на свете можно четко систематизировать. Вокруг еще столько всего, что не укладывается в рамки такой философии!

Многие популярнейшие сайты не скрывают свою симпатию к неточности. Взглянув на значок Twitter или на кнопку «Нравится» на веб-странице Facebook, можно увидеть количество других людей, которые их нажали. Пока числа небольшие, например 63, каждое нажатие идет в расчет. Но при больших количествах нажатий указывается лишь приблизительное количество, например 4 тысячи. Нельзя сказать, что система не знает точных цифр. Просто с увеличением масштаба точность уже не играет большой роли. Кроме того, числа могут меняться так быстро, что на момент отображения будут уже неактуальны. Такого же принципа придерживается почтовая служба Gmail компании Google, в которой время последних сообщений указывается с точностью до минуты, например «11 минут назад», но более длительные интервалы округляются, например «2 часа назад».

Область бизнес-аналитики и аналитического программного обеспечения долгое время строилась вокруг обещания клиентам «единой версии правды» — популярного выражения среди поставщиков технологий в этих областях в 2000-х годах. Руководители произносили эту фразу без иронии. Некоторые так поступают и до сих пор. Под этой фразой подразумевается, что все, кто получает доступ к информационно-технологическим системам компании, могут использовать одни и те же данные. А значит, отделам маркетинга и продаж не придется спорить, чьи данные о количестве клиентов и продаж правильнее, еще до начала встречи. Исходя из сказанного, их интересы могут во многом совпадать, если факты излагаются единообразно.

Идея «единой версии правды» кардинально меняется. И суть не в том, чтобы согласиться с тем, что единой правды не существует. Важно понять, что гнаться за ней — неблагодарное дело. Для того чтобы пожинать плоды освоения масштабных данных, нужно признать, что беспорядочность здесь — в порядке вещей, и не нужно тратить лишнюю энергию на то, чтобы от нее избавиться.

Мы даже можем наблюдать, как характерные черты неточности проникают в одну из наименее терпимых к ней областей — проектирование баз данных. Для обычных механизмов системы управления базами данных (СУБД) требуются точные и хорошо структурированные данные, которые не просто хранятся, а разбиваются на «записи» с полями. Каждое поле содержит информацию конкретного типа и длины. Например, в числовое поле длиной в семь цифр невозможно записать сумму, равную десяти миллионам и более. А в поле для телефонных номеров не получится ввести «недоступен». Приспособиться к таким изменениям можно, только изменив структуру базы данных. Мы все еще воюем с этими ограничениями на компьютерах и смартфонах, когда программное обеспечение отказывается принимать данные, которые мы хотим ввести.

1 ... 8 9 10 11 12 13 14 15 16 ... 57

Перейти на страницу:

Отывы о книге