Big Data простым языком Благирев Алексей Павлович, Хапаева Наталья Наш телефон знает о нас больше, чем мы думаем. Он умеет собирать и анализировать информацию о том, как мы передвигаемся по городу, какие посты лайкаем и какими приложениями пользуемся. Он сообщит о пробках и поторопит на работу, чтобы мы не опоздали; подберет музыку под наше настроение и составит список персональных рекомендаций, чем можно занять себя в течение дня. Телефон - больше не устройство, по которому звонят, это уже средство управления окружающим нас миром. Незаметно мы окружили себя такими интерфейсами, которые создают невидимый барьер между человеком и окружающей средой. Планирование, управление, коммуникация, все теперь строится через эти программы и девайсы. Даже человеческие отношения.
Но насколько глубока кроличья нора? Каждому предстоит разобраться в этом самому. Эта книга поможет донести основные принципы проектирования и создания таких интерфейсов управления бизнесом, обществом и окружающим нас миром посредством Больших данных. Читайте, наслаждайтесь и помните: сожжение книг противозаконно.
BIG DATA. Вся технология в одной книге Вайгенд Андреас Революция социальных данных делает измеримыми вещи, которые не измерялись или не могли быть измерены прежде. В прошлом мы имели все основания утверждать, что не имеем информации или инструментария для описания и анализа возможностей выбора, который стоит перед обществом. Теперь это не так. Мы можем точно представлять себе и выбор, и его последствия. Чем больше личной информации о нас накапливается в базах данных компаний, тем в большей степени мы существуем, и тем больше узнаем о самих себе.
Реальная проблема в том, чтобы сделать компании, собирающие личные данные, прозрачными для нас в той же степени, в какой мы прозрачны для них, и обеспечить себе право голоса в вопросах использования этих данных. В этой книге рассказывается о том, как достичь этих целей.
Андреас Вайгенд - директор компании Social Data Lab, ex-руководитель по Big Data компании Amazon, лектор школы информационных технологий Калифорнийского университета Беркли.
Технологии монетизации больших данных от гигантов рынка - Google, Microsoft, Uber, Twitter, Amazon, Facebook, Netflix и WhatsApp.
Вы узнаете, как с помощью Big Data инновационные компании:
- следят за поведением пользователей
- определяют круг интересов человека
- управляют репутацией
- формируют мнение потребителей
Андреас Вайгенд - один из ведущих мировых экспертов по будущему Big Data, директор компании Social Data Lab и лектор IT- школы Калифорнийского университета Беркли. Разрабатывал стратегию больших данных компаний Alibaba, Goldman Sachs, Lufthansa, Thomson Reuters, работал руководителем по Big Data компании Amazon.
DAMA-DMBOK. Свод знаний по управлению данными
Эффективное управление данными играет ключевую роль для успеха любой компании, которая оперирует массивами информации. Второе издание "Свода Знаний по управлению данными (DMBOK2)" организации DAMA International - всеобъемлющий авторитетный справочник, написанный ведущими аналитиками и тщательно отредактированный членами DAMA.
Главная задача книги - определить набор руководящих принципов и описать их применение в функциональных областях управления данными. Издание всесторонне описывает проблемы, возникающие в процессе управления данными, и предлагает способы их решения. В нем подробно описаны широко принятые практики, методы и приемы, функции, роли, результаты и метрики.
"DAMA-DMBOK: Свод знаний по управлению данными. Второе издание" предоставляет специалистам по управлению данными, ИТ-специалистам, руководителям, преподавателям и исследователям обширный материал для совершенствования информационной инфраструктуры.
Задачи "DAMA-DMBOK2":
- Выработка общепринятого согласованного представления об областях знаний по управлению данными (выделено 11 таких областей);
- Определение руководящих принципов управления данными;
- Предоставление стандартных определений для наиболее часто используемых понятий (общих и по областям знаний);
- Обзор общепринятых лучших практик, широко распространенных методов и методик, а также наиболее известных альтернативных подходов;
- Краткий обзор общих организационных и культурных вопросов;
- Уточнение границ сферы управления данными
2-е издание.
Data mining, или интеллектуальный анализ данных для занятых. Полный курс Рафалович Владимир Что такое информация? Как можно проанализировать данные, которые у вас есть? А если данных очень много и они требуют вычислительной мощи современных компьютеров? Какие выводы можно сделать из этого массива данных? Может - никаких, а может - это неиссякаемый источник, приносящий все новые возможности.
Самое ценное, что есть у любого человека, это его знания, помноженные на опыт. Эта книга помогает занятому человеку быстро погрузиться в увлекательный мир интеллектуального анализа данных с целью извлечения полезной информации, которую можно использовать в дальнейшем, например, в бизнесе или в принятии решений. Эта деятельность по-английски называется Data mining и содержит методы, используемые самыми разными специалистами-аналитиками, исследующими медицинские, политические, экономические и другие всевозможные источники данных.
Предполагается, что читатель более-менее знаком с Excel и пользуется им время от времени. Знания SQL-сервера не требуется, но полезно иметь.
Data mining. Извлечение информации из Facebook, Twitter, LinkedIn, Instagram, GitHub Рассел Мэтью, Классен Михаил В недрах популярных социальных сетей - Twitter, Facebook, LinkedIn и Instagram - скрыты богатейшие залежи информации. Из этой книги исследователи, аналитики и разработчики узнают, как извлекать эти уникальные данные, используя код на Python, Jupyter Notebook или контейнеры Docker.
Сначала вы познакомитесь с функционалом самых популярных социальных сетей (Twitter, Facebook, LinkedIn, Instagram), веб-страниц, блогов и лент, электронной почты и GitHub. Затем приступите к анализу данных на примере Twitter.
Прочитайте эту книгу, чтобы
- Узнать о современном ландшафте социальных сетей
- Научиться использовать Docker, чтобы легко оперировать кодами, приведенными в книге;
- Узнать, как адаптировать и поставлять код в открытый репозиторий GitHub;
- Научиться анализировать собираемые данные с использованием возможностей Python 3;
- Освоить продвинутые приемы анализа, такие как TFIDF, косинусное сходство, анализ словосочетаний, определение клика и распознавание образов;
- Узнать, как создавать красивые визуализации данных с помощью Python и JavaScript.
Мэтью Рассел (Matthew Russell) - директор Built Technologies, он возглавляет команду лидеров, работающую над улучшением нашего мира. Вне работы Мэтью рациональный индивидуалист, готовящийся к возможному зомби-апокалипсису.
Михаил Классен (Mikhail Klassen) - главный специалист по обработке и анализу данных в Paladin AI, стартапе, занимающемуся адаптивными технологиями обучения. Он увлекается проблемами искусственного интеллекта и анализом данных. Когда Михаил не занят на работе, он любит читать и путешествовать.
Data Science. Наука о данных с нуля Грас Джоэл Книга позволяет освоить науку о данных, начав "с чистого листа". Она написана так, что способствуют погружению в Data Science аналитика, фактически не обладающего глубокими знаниями в этой прикладной дисциплине.
При этом вы убедитесь, что описанные в книге программные библиотеки, платформы, модули и пакеты инструментов, предназначенные для работы в области науки о данных, великолепно справляются с задачами анализа данных.
А если у вас есть способности к математике и навыки программирования, то Джоэл Грас поможет вам почувствовать себя комфортно с математическим и статистическим аппаратом, лежащим в основе науки о данных, а также с приемами алгоритмизации, которые потребуются для работы в этой области.
В сегодняшнем хаотическом потоке данных скрыты ответы на многие волнующие человека вопросы. Книга познакомит с методологией, которая позволит правильно сформулировать эти вопросы и найти на них ответы.
Вместе с Джоэлом Грас и его книгой:
- Пройдите интенсивный курс языка Python
- Изучите элементы линейной алгебры, математической статистики, теории вероятностей и их применение в науке о данных
- Займитесь сбором, очисткой, нормализацией и управлением данными
- Окунитесь в основы машинного обучения
- Познакомьтесь с различными математическими моделями и их реализацией по методу k-ближайших соседей, наивной байесовской классификации, линейной и логистической регрессии, а также моделями на основе деревьев принятия решений, нейронных сетей и кластеризации
- Освойте работу с рекомендательными системами, приемы обработки естественного языка, методы анализа социальных сетей, технологии MapReduce и баз данных
"Джоэл проведет для вас экскурсию по науке о данных. В результате вы перейдете от простого любопытства к глубокому пониманию насущных алгоритмов, которые должен знать любой аналитик данных".
Роит Шивапрасад, Специалист компании Amazon в области Data Science с 2014 г.
Об авторе
Джоэл Грас работает инженером-программистом в компании Google. До этого занимался аналитической работой в нескольких стартапах. Активно участвует в неформальных мероприятиях специалистов в области науки о данных. Всегда доступен в Tweeter по хэштегу @joelgrus.
Data Science. Наука о данных с нуля Грас Джоэл Книга позволяет изучить науку о данных (Data Science) и применить полученные знания на практике. Она содержит краткий курс языка Python, элементы линейной алгебры, статистики, теории вероятностей, методов обработки данных. Приведены основы машинного обучения. Описаны алгоритмы k ближайших соседей, наивной байесовой классификации, линейной и логистической регрессии, а также модели на основе деревьев принятия решений, нейронных сетей и кластеризации. Рассмотрены приемы обработки естественного языка, методы анализа социальных сетей, основы баз данных, SQL и MapReduce.
Во втором издании примеры переписаны на Python 3.6, игрушечные наборы данных заменены на "реальные", добавлены материалы по глубокому обучению и этике данных, статистике и обработке естественного языка, рекуррентным нейронным сетям, векторным вложениям слов и разложению матриц.
2-е издание.
Data Science. Инсайдерская информация для новичков. Включая язык R О`Нил Кэти, Шатт Рэйчел Data Science (исследование данных) - одна из самых востребованных специализаций нашего времени. Изучение данных позволяет преобразить любую традиционную или инновационную бизнес-модель. Эта книга основана на вводном курсе по Data Science из Колумбийского университета, и начинающему специалисту-аналитику она совершенно необходима.
Эта книга увлекательно и доступно рассказывает о:
- Байесовском методе;
- Статистических алгоритмах;
- Финансовом моделировании;
- Рекомендательных движках;
- Визуализации данных;
- MapReduce.
С примерами на языках Python и R.
Golang для профи. Работа с сетью, многопоточность, структуры данных и машинное обучение с Go Цукалос Михалис Вам уже знакомы основы языка Go? В таком случае эта книга для вас. Михалис Цукалос продемонстрирует возможности языка, даст понятные и простые объяснения, приведет примеры и предложит эффективные паттерны программирования.
Изучая нюансы Go, вы освоите типы и структуры данных языка, а также работу с пакетами, конкурентность, сетевое программирование, устройство компиляторов, оптимизацию и многое другое. Закрепить новые знания помогут материалы и упражнения в конце каждой главы.
Уникальным материалом станет глава о машинном обучении на языке Go, в которой вы пройдёте от основополагающих статистических приемов до регрессии и кластеризации. Вы изучите классификацию, нейронные сети и приёмы выявления аномалий. Из прикладных разделов вы узнаете: как использовать Go с Docker и Kubernetes, Git, WebAssembly, JSON и др.
2-е издание.
Google BigQuery. Всё о хранилищах данных, аналитике и машинном обучении Лакшманан Валиаппа, Тайджани Джордан Вас пугает необходимость обрабатывать петабайтные наборы данных? Познакомьтесь с Google BigQuery, - системой хранения информации, которая может консолидировать данные по всему предприятию, облегчает интерактивный анализ и позволяет реализовать задачи машинного обучения. Теперь вы можете эффективно хранить, запрашивать, получать и изучать данные в одной удобной среде.
Вальяппа Лакшманан и Джордан Тайджани научат вас работать в современном хранилище данных, используя все возможности масштабируемого, безсерверного публичного облака.
С этой книгой вы:
- Погрузитесь во внутреннее устройство BigQuery
- Изучите типы данных, функции и операторы, которые поддерживает Big Query
- Оптимизируете запросы и реализуете схемы повышения производительности или снижения затрат
- Узнаете о GIS, time travel, DDL / DML, пользовательских функциях и сценариях SQL
- Решите множество задач машинного обучения
- Узнаете, как защитить данные, отслеживать работу и авторизовать пользователей.
Google Analytics для профессионалов Клифтон Брайан Станьте профессиональным пользователем Google Analytics с помощью полного руководства "Google Analytics для профессионалов" Брайана Клифтона!
В этом, посвященном последней версии Google Analytics, третьем издании бестселлера, приведено намного большее количество советов по увеличению ROI, чем когда-либо ранее. Хотите
Cтать специалистом по использованию всех мощных возможностей и отчетов Google Analytics?
Измерять эффективность проводимых кампаний в реальном времени?
Открыть наилучшие пути отслеживания посетителей из социальных сетей и мобильных посетителей?
Оценивать влияние мультиканального маркетинга?
Вы найдете ответы на эти и многие другие вопросы в данном полном практическом руководстве. Изучите новые средства Google Analytics и способы их использования. Все это позволит увеличить посещаемость вашего веб-сайта, раскрутить свой бренд и извлечь чистую прибыль.
Быстро увеличивайте продуктивность с помощью нового пользовательского интерфейса и великолепных новых инструментов, таких как мультиканальные последовательности
Узнайте о новых возможностях, среди которых отслеживание мобильных посетителей и посетителей из социальных сетей, а также использования встроенного видео
Изучите удобные обходные пути, а также усовершенствованные приемы и тактики, которые можно применить немедленно
Следуйте полезным советам и разберите реальные примеры
Оптимизируйте поисковый маркетинг, монетизируйте некоммерческие сайты и отслеживайте оффлайновый маркетинг наравне с онлайновым
Интегрируйте данные Google Analytics в системы и приложения от сторонних разработчиков, включая систему CRM.
Об авторе
Доктор философии Брайан Клифтон является всемирно признанным экспертом по Google Analytics, который консультирует глобальных клиентов по вопросам оптимизации эффективности веб-сайтов. В 2005 г. Брайан присоединился к Google Europe. В качестве бывшего лидера веб-аналитики для Google Europe, Ближнего Востока и Африки, он определял стратегию набора и создания команды специалистов по общеевропейской продукции. Он помог запустить центр индивидуальной аттестации по Google Analytics (Google Analytics Individual Qualificatio- GA IQ). Брайан регулярно принимает участие в отраслевых выставках, ведет популярный блог Measuring Success (www.advanced-web-metrics.com/blog) и является автором двух предыдущих изданий этой книги, которые используются студентами и специалистами по всему миру.
3-е издание.
Python и машинное обучение Рашка Себастьян Крайне необходимое издание по новейшей предсказательной аналитике для более глубокого понимания методологии машинного обучения
Использование разных машинно-обучаемых моделей для формулирования различных вопросов в отношении данных
Конструирование нейронных сетей при помощи библиотек
Написание красивого и лаконичного кода с оптимальным использованием созданных вами алгоритмов
Встраивание машинно-обучаемой модели в веб-приложение для повышения ее общедоступности
Обнаружение скрытых повторяющихся образов и структур в данных посредством кластерного анализа
Организация данных с помощью эффективных методов предобработки и использование передовых практических подходов к оценке машинно-обучаемых моделей
Анализ мнений для подробной интерпретации текстовых данных и информации из социальных сетей
Python и анализ данных Маккини Уэс В данной книге рассматриваются вопросы форматирования, очистки и обработки данных на Python.
Во втором издании код переписан под версию Python 3.6, добавлены сведения о последних версиях библиотек pandas, NumPy, IPython и Jupyter.
Издание идеально подойдет как аналитикам, только начинающим осваивать Python, так и опытным программистам на Python, еще не знакомым с научными приложениями.
Python и машинное обучение. Машинное и глубокое обучение с использованием Python, scikit-learn Рашка Себастьян, Мирджалили Вахид Книга является всеобъемлющим руководством по машинному и глубокому обучению с использованием языка Python. Она служит как пошаговым учебным пособием, так и справочником, к которому вы постоянно будете возвращаться в ходе построения систем машинного обучения.
Книга наполнена четкими пояснениями, визуальными представлениями, работающими примерами и детально раскрывает все важные методики машинного обучения. В то время как некоторые книги учат вас следовать инструкциям, Рашка и Мирджалили излагают принципы, лежащие в основе машинного обучения, что позволит вам самостоятельно строить модели и приложения.
Третье издание книги обновлено с целью учета версии библиотеки TensorFlow 2 и последних добавлений в scikit-learn. Оно расширено для охвата двух самых современных методик машинного обучения: обучения с подкреплением и порождающих состязательных сетей.
Эта книга — ваш попутчик в машинном обучении с применением Python, будь вы разработчиком приложений на языке Python, не знакомым с машинным обучением, или разработчиком, желающим углубить свои знания в современных областях.
Основные темы книги
Фреймворки, модели и методики, которые позволяют машинам "учиться" на основе данных
Использование scikit-learn для машинного обучения и TensorFlow для глубокого обучения
Применение машинного обучения для классификации изображений, смыслового анализа, создания интеллектуальных веб-приложений и многого другого
Построение и обучение нейронных сетей, порождающих состязательных сетей и других моделей
Реализация веб-приложений с искусственным интеллектом
Выполнение очистки и подготовки данных для машинного обучения
Классификация изображений с использованием глубоких сверточных нейронных сетей
Рекомендуемые приемы для оценки и настройки моделей
Прогнозирование непрерывных целевых результатов с использованием регрессионного анализа
Обнаружение скрытых шаблонов и структуры в данных с помощью кластеризации
Углубление в текстовые данные и данные социальных сетей с применением смыслового анализа
Прикладное машинное обучение с прочным теоретическим фундаментом.
Новое издание пересмотрено и расширено с целью охвата TensorFlow 2, порождающих состязательных сетей (GAN) и обучения с подкреплением. Книга является всеобъемлющим руководством по машинному и глубокому обучению с использованием языка Python. Она служит как пошаговым учебным пособием, так и справочником, к которому вы постоянно будете возвращаться в ходе построения систем машинного обучения.
Книга наполнена четкими пояснениями, визуальными представлениями и работающими примерами, детально раскрывая все важные методики машинного обучения. В то время как некоторые книги учат вас следовать инструкциям, Рашка и Мирджалили излагают принципы, лежащие в основе машинного обучения, что позволит вам самостоятельно строить модели и приложения.
Обновленное с учетом библиотеки TensorFlow 2.0 третье издание предлагает читателям ознакомиться с ее новыми средствами API-интерфейса Keras, а также с последними добавлениями в scikit-learn. Оно расширено для охвата самых современных методик обучения с подкреплением, основанных на глубоком обучении, и введения в порождающие состязательные сети. Наконец, в книге также проводится исследование подобласти обработки естественного языка (NLP), называемой смысловым анализом, что поможет вам использовать алгоритмы машинного обучения для классификации документов.
Книга обсуждается в отдельном сообщении в блоге Виктора Штонда.
3-е издание.
Python и машинное обучение: машинное и глубокое обучение с использованием Python, scikit-learn и Ten Рашка Себастьян, Мирджалили Вахид Машинное обучение поглощает мир программного обеспечения. Освойте и работайте с передовыми технологиями машинного обучения, нейронных сетей и глубокого обучения с помощью 2-го издания бестселлера Себастьяна Рашки.
Будучи основательно обновленной с учетом самых последних технологий с открытым кодом, включая такие библиотеки, как scikit-learn, Keras и TensorFlow, эта книга предлагает практические знания и приемы, которые необходимы для создания эффективных приложений машинного и глубокого обучения на языке Python. Обладающие уникальной проницательностью и знанием дела авторы книги, Себастьян Рашка и Вахид Мирджалили, ознакомят вас с алгоритмами машинного обучения и глубокого обучения и постепенно подведут к сложным темам в анализе данных. В книге предлагается сочетание теоретических принципов машинного обучения с практическим подходом к написанию кода для полного понимания теории машинного обучения и реализация с помощью Python.
Основные темы книги
Освойте основные фреймворки в науке о данных, машинном обучении и глубоком обучении
Задайте новые вопросы своим данным через модели машинного обучения и нейронные сети
Используйте всю мощь самых последних библиотек Python с открытым кодом для машинного обучения
Научитесь строить реализации глубоких нейронных сетей с применением библиотеки TensorFlow
Встраивайте модели машинного обучения в доступные веб-приложения
Прогнозируйте непрерывные целевые результаты с применением регрессионного анализа
Раскройте скрытые шаблоны и структуры в данных с помощью кластеризации
Анализируйте изображения с использованием приемов глубокого обучения
Углубитесь в текстовые данные и данные из социальных сетей с применением смыслового анализа
Если вы читали 1-е издание книги, то вам доставит удовольствие найти новый баланс классических идей и современных знаний в машинном обучении.
Каждая глава была серьезно обновлена, и появились новые главы по ключевым технологиям. У вас будет возможность изучить и поработать с TensorFlow более вдумчиво, нежели ранее, а также получить важнейший охват библиотеки для нейронных сетей Keras наряду с самыми свежими обновлениями библиотеки scikit-learn.
Об авторах
Себастьян Рашка, автор ставшего бестселлером 1-го издания этой книги, обладает многолетним опытом написания кода на языке Python. Он проводил многочисленные семинары по практическому применению науки о данных, машинному обучению и глубокому обучению, включая руководство по машинному обучению на SciPy - ведущей конференции, посвященной научным расчетам с помощью Python.
Несмотря на то что исследовательские проекты Себастьяна сосредоточены главным образом на решении задач в области вычислительной биологии, ему нравится писать и говорить на темы науки о данных, машинного обучения и языка Python в общем, и он стремится помочь людям разрабатывать решения, управляемые данными, без обязательного знания подоплеки машинного обучения.
Недавно его работа и вклад были отмечены званием выдающегося аспиранта 2016-2017, а также наградой ACM Computing Reviews' Best of 2016.
В свободное время Себастьян любит участвовать в проектах с открытым кодом, а методы, которые он реализовал, теперь успешно используются в состязаниях по машинному обучению, таких как Kaggle.
Вахид Мирджалили получил звание PhD в машиностроении, работая над новаторскими методами для крупномасштабных вычислительных эмуляций молекулярных структур. В настоящее время он сосредоточил свою научно-исследовательскую работу на приложениях машинного обучения в разнообразных проектах компьютерного зрения в отделении компьютерных наук и инженерии Университета штата Мичиган.
Вахид избрал Python в качестве главного языка программирования, и на протяжении своей научно-исследовательской карьеры накопил громадный опыт в написании кода Python. Он преподавал программирование на Python инженерной группе в Университете штата Мичиган, что дало ему возможность помочь студентам понять разные структуры данных и разрабатывать эффективный код на Python.
Наряду с тем, что обширные исследовательские интересы Вахида сконцентрированы на приложениях глубокого обучения и компьютерного зрения, он особенно интересуется использованием приемов глубокого обучения для усиления приватности в биометрических данных, таких как изображения лиц, чтобы не раскрывалась информация сверх той, что пользователи намеревались показывать. Кроме того, он также сотрудничает с командой инженеров, работающих над беспилотными автомобилями, где проектирует модели на основе нейронных сетей для слияния многоспектральных изображений с целью обнаружения пешеходов.
2-е издание
Python для сложных задач. Наука о данных и машинное обучение Плас Дж. Вандер Книга "Python Data Science Handbook" - это подробное руководство по самым разным вычислительным и статистическим методам, без которых немыслима любая интенсивная обработка данных, научные исследования и передовые разработки. Читатели, уже имеющие опыт программирования и желающие эффективно использовать Python в сфере Data Science, найдут в этой книге ответы на всевозможные вопросы, например: 1) как мне считать этот формат данных в мой скрипт? 2) Как преобразовать, очистить эти данные и манипулировать ими? 3) Как визуализировать данные такого типа? Как при помощи этих данных разобраться в ситуации, получить ответы на вопросы, построить статистические модели или реализовать машинное обучение?
Анализ и обработка социологических данных. Учебник Кравченко Альберт Иванович Основное внимание уделено количественной и качественной методологии, фундаментальному и эмпирическому исследованию, конструированию теоретического языка социологии и теоретической модели предмета исследования, концептуализации, конкретизации и операционализации понятий, построению социологических переменных и выдвижению гипотез. Рассматриваются программа социологического исследования, ее разделы и организация. Социальная статистика и проблема измерения в социологии анализируются через соответствующий инструментарий: индексы и индикаторы, динамические ряды, статистическую закономерность, основные типы измерительных шкал, их валидность и надежность, методы многомерного анализа, в том числе факторный и регрессионный анализ.
Соответствует ФГОС ВО последнего поколения.
Для студентов бакалавриата, изучающих дисциплину "Анализ и обработка социологических данных".
Анализ социальных медиа на Python Бонцанини Марко Извлекайте и анализируйте данные из всех уголков социальной паутины на Python.
Язык программирования Python является оптимальным выбором для исследователей-аналитиков, поскольку позволяет создавать прототипы, визуализировать и анализировать наборы данных малого и среднего размера. Бесчисленное количество предприятий обращается к Python для решения задач, связанных выявлением особенностей поведения потребителей и превращением исходных данных в действенную информацию о клиентах.
Настоящая книга рассказывает, как с помощью научного инструментария Python получать и анализировать данные из наиболее популярных сетей, таких как Facebook, Twitter, Stack Exchange и др.
В русскоязычное издание добавлено приложение об анализе данных из сети "ВКонтакте".
Издание предназначено для специалистов по анализу данных, а также будет полезно всем разработчикам на Python, желающим извлекать коммерческую пользу из социальных сетей.
Из этой книги вы узнаете, как:
- взаимодействовать с социально-медийными платформами посредством публичного API из приложений на Python;
- сохранять социальные данные в формате, удобном для последующего анализа;
- анализировать социальные данные
и извлекать из них выборки, используя инструменты Python;
- с помощью приемов обработки текстов понять, о чем люди говорят в социальных медиа;
- применять продвинутые статистические и аналитические приемы для извлечения полезной информации из данных;
- как с применением технологий веба отображать данные в удобном графическом виде для их исследования и представления результатов обработки.
Аналитическое прогнозирование для чайников Бари Анассе, Чаучи Мохамед, Юнг Томми Сегодняшний бизнес опирается на эффективное использование данных для прогнозирования тенденций и продаж. Аналитическое прогнозирование - инструмент, который может это сделать, и данная книга просто и понятно показывает, как его использовать. Вы научитесь подготавливать и обрабатывать свои данные, ставить цели, создавать прогностические модели, привлекать к работе заинтересованные стороны вашей организации и многое другое.
2-е издание.
Анализ данных в Tableau на практике Слипер Райан Есть у вас практический опыт использования си-стемы бизнес аналитики Tableau или вы делаете свои первые шаги в этой области, данная книга позволит вам научиться строить наглядные ин-терактивные визуализации данных.
Автор книги Райан Слипер - один из наиболее ква-лифицированных консультантов по Tableau - ис-пользует советы и практические задания для де-монстрации использования системы с целью полу-чения важной аналитической информации из данных.
Краткое содержание частей книги:
- основы: знакомство и первые шаги в Tableau;
- типы диаграмм: пошаговая инструкция по по-строению в Tableau разнообразных визуализаций;
- практические советы и хитрости: инновационный подход к применению параметров и теории цвета, советы по повышению эффективности рабочих книг Tableau и многое другое;
- план действий: знакомство с планом действий INSIGHT, особый подход к построению дашбордов (dashboard) в Tableau;
- рассказываем историю: изучаем эффективные тактики построения рассказа на основе данных, которые вы сможете незамедлительно применить на практике.