Поиск книг по лучшей цене!

Актуальная информация о наличии книг в крупных интернет-магазинах и сравнение цен.


  • Натан Марц и Джеймс Уоррен. Большие данные. Принципы и практика построения масштабируемых систем обработки данных в реальном времени
    Большие данные. Принципы и практика построения масштабируемых систем обработки данных в реальном времени
    Натан Марц и Джеймс Уоррен
    В этой книге представлены теоретические основы организации систем больших данных и поясняется, каким образом они воплощаются на практике. В ней рассматривается лямбда-архитектура, предназначенная для построения подобных систем, и на примере конкретного веб-приложения поясняются особенности реализации всех уровней этой архитектуры с помощью инструментальных средств вроде Hadoop, Cassandra и Storm. Для чтения этой книги не требуется предварительное знакомство с особенностями анализа крупномасштабных данных или баз данных типа NoSQL, хотя полезно знать о традиционных базах данных. В крупномасштабных веб-приложениях, которые поддерживают работу социальных сетей, выполняют аналитику в реальном времени или поддерживают электронную торговлю, приходится обрабатывать большие массивы данных, объем и скорость обмена которыми превышают возможности информационных систем, основанных на традиционных базах данных. Для подобных приложений требуются архитектуры, в основе которых лежат кластеры машин для хранения и обработки данных любого объема и с любой скоростью. Правда, масштабируемость и простота не являются взаимоисключающими свойствами подобных архитектур. Эта книга поможет читателю научиться строить системы больших данных, используя архитектуру, специально предназначенную для фиксации и анализа данных в масштабе веб. В ней представлена простая для понимания и масштабируемая лямбда-архитектура, позволяющая разрабатывать информационные системы усилиями небольших команд. В книге даются теоретические основы организации систем больших данных и поясняется, каким образом они воплощаются на практике. Помимо общей инфраструктуры для обработки больших данных, читатель может ознакомиться с конкретными технологическими и инструментальными средствами вроде Hadoop, Storm и баз данных типа NoSQL. В этой книге рассматриваются следующие темы: Введение в системы больших данных. Описание особенностей обработки данных масштаба веб в реальном времени. Применение инструментальных средств вроде Hadoop, Cassandra и Storm. Возможность расширить свои знания и навыки за пределы традиционных баз данных. Для чтения этой книги не требуется предварительное знакомство с особенностями анализа крупномасштабных данных или баз данных типа NoSQL, хотя полезно знать о традиционных базах данных. Об авторах Натан Марц — создатель системы Apache Storm и инициатор применения лямбда-архитектуры для построения систем больших данных. Джеймс Уоррен — архитектор-аналитик с квалификацией в области машинного обучения и научных расчетов. Книга рассчитана на читателей, стремящихся освоить принципы построения систем больших данных и внедрить их на практике.
  • С. Э. Мастицкий. Визуализация данных с помощью ggplot2
    Визуализация данных с помощью ggplot2
    С. Э. Мастицкий
    Визуализация данных играет важную роль на всех этапах статистического анализа - от первичного ознакомления со свойствами данных до диагностики качества построенных моделей и представления полученных результатов. Из всего разнообразия статистических программ выделяется R - интенсивно развивающаяся и свободно распространяемая система статистических вычислений, в которой реализовано множество классических и современных методов анализа данных. Программные реализации алгоритмов, входящих в базовую версию R, проверены на практике не одним поколением пользователей и ученых. Кроме того, пользователи R постоянно разрабатывают многочисленные дополнения (т. е. "пакеты") для этой системы. Настоящая книга посвящена ggplot2 - одному из таких пакетов, который значительно расширяет и без того богатые базовые графические возможности R.В 2015 г. ggplot2 был установлен более миллиона раз. Такая популярность этого пакета обусловлена несколькими причинами, среди которых можно отметить эстетическую привлекательность и пригодное для публикации качество получаемых с его помощью графиков, возможность создавать пользовательские типы диаграмм, а также большой набор опций для тонкой настройки внешнего вида графиков. В этой книге описаны основы работы с ggplot2 и приведены многочисленные примеры кода, которые читатели легко могут модифицировать для собственных нужд.Книга окажется полезной для всех пользователей R, желающих освоить новый мощный инструмент анализа данных.
  • Л. Б. Соколинский. Параллельные системы баз данных
    Параллельные системы баз данных
    Л. Б. Соколинский
    Цель учебного пособия состоит в изложении основ технологий параллельных систем баз данных. Особое внимание уделяется вопросам реализации СУБД для кластерных систем. Дается классификация известных форм параллельной обработки транзакций. Приводится сравнительный анализ различных архитектур параллельных систем баз данных. Рассматриваются возможные технологические подходы к организации параллельной обработки запросов. Обсуждается итерационная модель, синхронный и асинхронный конвейеры. Излагаются методы фрагментации данных и способы организации межпроцессорных обменов. Предлагается подход к автоматическому преобразованию последовательного плана выполнения запроса в параллельный. Большое внимание уделяется вопросам моделирования параллельных систем баз данных и организации эффективной буферизации в условиях использования фрагментного параллелизма. Книга ориентирована на студентов, аспирантов и научных работников, специализирующихся в области разработки технологий параллельных систем баз данных и их применения для обработки сверхбольших объемов данных на современных многоядерных и многопроцессорных системах с кластерной архитектурой. Ключевые слова: параллельные системы баз данных, фрагментный параллелизм, асинхронный конвейер, балансировка загрузки, моделирование параллельной обработки транзакций, алгоритм LFU-K.

© 2017 books.iqbuy.ru