LibKing » Книги » foreign_business » Ким Хо - О чем говорят цифры. Как понимать и использовать данные

Ким Хо - О чем говорят цифры. Как понимать и использовать данные

Тут можно читать онлайн Ким Хо - О чем говорят цифры. Как понимать и использовать данные - бесплатно ознакомительный отрывок. Жанр: Business, издательство Манн Иванов Фербер, год 2014. Здесь Вы можете читать ознакомительный отрывок из книги ознакомительный отрывок из книги онлайн без регистрации и SMS на сайте LibKing.Ru (ЛибКинг) или прочесть краткое содержание, предисловие (аннотацию), описание и ознакомиться с отзывами (комментариями) о произведении.
Ким Хо - О чем говорят цифры. Как понимать и использовать данные
  • Название:
    О чем говорят цифры. Как понимать и использовать данные
  • Автор:
  • Жанр:
  • Издательство:
    Манн Иванов Фербер
  • Год:
    2014
  • ISBN:
    978-5-00057-118-7
  • Рейтинг:
    3/5. Голосов: 11
  • Избранное:
    Добавить в избранное
  • Ваша оценка:

Ким Хо - О чем говорят цифры. Как понимать и использовать данные краткое содержание

О чем говорят цифры. Как понимать и использовать данные - описание и краткое содержание, автор Ким Хо, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru
Неважно, чем вы интересуетесь, в какой сфере работаете и каких размеров ваша компания – цифры и аналитика сегодня повсюду, и всем приходится иметь с ними дело. Эта книга в доступной форме познакомит вас с количественным анализом, его терминами и методами, поможет развить аналитические навыки и разговаривать на одном языке с количественными аналитиками. На русском языке публикуется впервые.

О чем говорят цифры. Как понимать и использовать данные - читать онлайн бесплатно ознакомительный отрывок

О чем говорят цифры. Как понимать и использовать данные - читать книгу онлайн бесплатно (ознакомительный отрывок), автор Ким Хо
Тёмная тема

Шрифт:

Сбросить

Интервал:

Закладка:

Сделать

В зависимости от применяемых методов и видов данных, подлежащих сбору и анализу, аналитику можно разделить на количественную и качественную. Цель качественной аналитикисостоит в углубленном понимании причин и мотивов тех или иных явлений. Обычно для этого собирают ограниченное количество неструктурированных данных на основе нерепрезентативной выборки [2] Нерепрезентативная – выборка, не отражающая характеристик генеральной совокупности. Прим. перев. , а анализ проводят нестатистическими методами. Качественная аналитика полезна при проведении поисковых исследований, то есть на первом этапе исследований аналитических. Количественная аналитикапредставляет собой систематическое изучение событий при помощи статистических, математических и вычислительных процедур. На основе сбора информации о большом количестве репрезентативных событий с последующей статистической обработкой обычно получают структурированные данные.

В зависимости от целей исследователи применяют различные аналитические методы:

статистика – сбор, систематизация, анализ, интерпретация и оглашение данных;

прогнозирование – оценка динамики той или иной переменной в определенный момент в будущем на основе данных о ее динамике в прошлом;

интеллектуальный анализ данных (Data mining) – автоматизированное или полуавтоматизированное выявление ранее неизвестных зависимостей в больших массивах данных с помощью специальных вычислительных алгоритмов или статистических методов;

интеллектуальный анализ текстов – выявление неизвестных зависимостей или тенденций в тексте методами, подобными интеллектуальному анализу данных;

оптимизация – использование математических методов для того, чтобы найти оптимальные решения на основе заданных критериев и установленных ограничений.

эксперимент – формирование тестовой и контрольной групп методом случайного отбора и выявление причин и степени влияния независимых переменных на зависимую переменную.

В этом списке приведены широко известные аналитические методы, причем многие из них используют одни и те же аналитические приемы и процедуры. Например, регрессионный анализ – наиболее распространенный аналитический прием в предсказательной аналитике – не менее популярен и в статистике, прогнозировании и интеллектуальном анализе данных. Точно так же анализ временн ы х рядов, специальная аналитическая процедура из арсенала статистики, предназначенная для анализа меняющихся во времени значений переменных, используется не только в статистике, но и в прогнозировании.

Учетные данные, помогающие принимать решения по персоналу (мы уже говорили о них), являются структурированными (легко представляются в виде таблицы), количественными и относительно небольшими по объему (не более терабайта или двух даже в очень крупных компаниях). Такие данные традиционно использовались в аналитике, поэтому назовем их малыми данными . Долгое время аналитики ни с чем другим дела не имели.

Но сегодня крупные компании, некоммерческие организации и даже стартапы сталкиваются с так называемыми большими данными – неструктурированными массивами информации колоссальных объемов. Их источниками могут быть онлайновые дискуссии в интернете, видеоматериалы или данные анализа ДНК пациентов больницы. У данных такого рода объем намного больше – иногда тысячи петабайт [3] Один петабайт равен 1 073 741 824 мегабайтам. Прим. перев. . Например, Google обрабатывает порядка 24 петабайт интернет-данных ежедневно, а AT&T [4] AT&T Inc – одна из крупнейших телекоммуникационных компаний в США, провайдер телефонной и беспроводной связи. Прим. ред. передает по телекоммуникационным сетям около 30 петабайт музыки и прочих данных в день. Благодаря новым прикладным компьютерным программам и техническим новшествам мы можем анализировать огромные массивы данных и извлекать из них полезную информацию.

Что такое большие данные

Термин большие данныеприменяется для обозначения данных уникально большого объема или неструктурированных данных. Приведем несколько примеров:

• За месяц 600 миллионов пользователей Facebook добавили в сеть 30 миллиардов единиц контента.

• Компания Zynga, занимающаяся сетевыми виртуальными играми, ежедневно обрабатывает более петабайта игровой информации.

• Пользователи YouTube просматривают более двух миллиардов видеоклипов в день.

• Пользователи Twitter выполняют 32 миллиарда поисковых запросов в месяц.

• Пользователи Google в 2011 году выполняли почти 5 миллиардов поисковых запросов в день.

• В 2009 году ежедневно отсылалось более 2,5 миллиарда текстовых сообщений.

• В 2010 году население планеты использовало 5 миллиардов мобильных телефонов.

• Объем файла с полной расшифровкой человеческого генома составляет около одного терабайта.

• Беспроводной датчик для контроля физических параметров одной коровы передает около 200 мегабайт данных в год.

• В 2008 году количество подключенных к интернету устройств превысило численность населения земного шара.

• По оценке компании Cisco Systems, к концу 2011 года двадцать типичных домохозяйств генерировали более интенсивный интернет-трафик, чем все пользователи интернета в 2008 году.

• McKinsey & Company считает, что почти в каждой отрасли американской экономики компании с численностью персонала более 1000 человек накапливают в среднем больший объем информации, чем Библиотека Конгресса США.

Большие данные и основанная на них аналитика способны существенно изменить практически каждую отрасль экономики и бизнес-процессы в течение следующих десяти лет. Любая организация (и любой ее сотрудник), если вовремя ознакомится с сутью и методами обработки больших данных, получит огромное конкурентное преимущество. Точно так же как компании, в свое время первыми освоившие методы обработки малых данных, опередили своих конкурентов, сейчас на позиции лидеров выйдут те, кто раньше других сумеет использовать возможности больших данных.

Потенциал больших данных можно реализовать благодаря глобальным устройствам их сбора и обработки. Сенсоры и микропроцессоры в скором времени будут везде. Практически каждое механическое или электронное устройство регистрирует свои действия, местонахождение или состояние. Эти устройства и люди, их эксплуатирующие, поддерживают связь через интернет, а это еще один колоссальный источник данных. Если добавить к этому объемы информации, проходящие через прочие средства связи (беспроводные и проводные телефонные линии, кабели, спутники и т. п.), трудно даже оценить все перспективы.

Читать дальше
Тёмная тема

Шрифт:

Сбросить

Интервал:

Закладка:

Сделать


Ким Хо читать все книги автора по порядку

Ким Хо - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




О чем говорят цифры. Как понимать и использовать данные отзывы


Отзывы читателей о книге О чем говорят цифры. Как понимать и использовать данные, автор: Ким Хо. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
Большинство книг на сайте опубликовано легально на правах партнёрской программы ЛитРес. Если Ваша книга была опубликована с нарушениями авторских прав, пожалуйста, направьте Вашу жалобу на PGEgaHJlZj0ibWFpbHRvOmFidXNlQGxpYmtpbmcucnUiIHJlbD0ibm9mb2xsb3ciPmFidXNlQGxpYmtpbmcucnU8L2E+ или заполните форму обратной связи.
img img img img img