Карл Андерсон - Аналитическая культура
- Название:Аналитическая культура
- Автор:
- Жанр:
- Издательство:Манн, Иванов и Фербер
- Год:2017
- Город:Москва
- ISBN:нет данных
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Карл Андерсон - Аналитическая культура краткое содержание
Книга будет интересна CEO и владельцам бизнеса, менеджерам, аналитикам.
Аналитическая культура - читать онлайн бесплатно ознакомительный отрывок
Интервал:
Закладка:
Аналитическим локомотивом за этим успехом был стартап Dunnhumby, в котором Tesco впоследствии выкупила контрольный пакет акций. Лорд Маклорин, бывший на тот момент председателем совета директоров компании, заявил супружеской чете основателей Dunnhumby: «Меня в этой ситуации пугает то, что спустя три месяца вы узнали о моих покупателях больше, чем я за 30 лет». Dunnhumby назвали «одной из жемчужин в короне Tesco».
Как дела у Tesco сегодня? Ее акции торгуются на самой низкой отметке за последние 11 лет. Компания потеряла 2,7 млрд долл. из-за неудачной попытки выйти на рынок США с сетью Fresh & Easy и объявила об убытке в объеме 9,6 млрд долл. за 2014 налоговый год. Председатель совета директоров с позором покинул свой пост, после того как попытался завысить показатель прибыли на 400 млн долл. Компания сократила почти 9 тыс. рабочих мест и закрыла 43 магазина и их офисы. «С Tesco я допустил огромную ошибку», — признался Уоррен Баффет. Более того, Dunnhumby, чья программа лояльности Clubcard обходится в 750 млн долл. ежегодно (цена, при которой положительная рентабельность крайне маловероятна), выставлена на продажу за 3 млрд долл.
Сложно выделить одну причину этого падения. Высокие показатели прибыли не помогли. Конкуренты разработали собственные программы лояльности, большинство из которых проще, а простота всегда привлекает! Вместо абстрактных «баллов» они предлагают своим клиентам более материальные бонусы, например газету или, что актуально для британцев, чашку чая [270].
К сожалению, управление на основе данных, и даже качественное управление на основе данных, не гарантирует успеха, а тем более устойчивого успеха. Во-первых, большинство успешных стратегий могут быть скопированы конкурентами, которые не преминут воспользоваться удачным опытом. Во-вторых, у руля компании все-таки стоит топ-менеджмент. И если руководство формулирует неверное в и дение или стратегию для компании, даже решения, принятые на основе данных и поддерживающие эту стратегию, в итоге приведут к кораблекрушению. История Tesco, которую мы рассказали, — один из подобных примеров.
При этом на протяжении всей книги я приводил результаты разных исследований, свидетельствующие, что управление на основе данных окупается. Компаниям удается принимать решения быстрее и эффективнее и быстрее внедрять инновации. Компании, проводящие больше тестов, не только знают, когда что-то сработало, но и, скорее всего, знают, почему это произошло. Компании отличаются более высоким уровнем открытости, и любой сотрудник может внести свой вклад и увидеть, как это отразится на эффективности компании.
Дополнительная литература
Аналитика
Aiken P. and Gorman M. The Case for the Chief Data Officer (New York: Morgan Kaufmann, 2013).
Davenport T. H. and Harris J. G. Analytics at Work (Boston: Harvard Business Press, 2007).
Davenport T. H., Harris J. G. and Morison R. Competing on Analytics (Boston: Harvard Business Press, 2010) [271].
Eckerson W. Secrets of Analytical Leaders: Insights from Information Insiders (Denville, NJ: Technics Publications, 2012).
Анализ данных
O’Neil C. and Schutt R. Doing Data Science (Sebastopol, CA: O’Reilly, 2014).
Shron M. Thinking With Data (Sebastopol, CA: O’Reilly, 2014).
Siegel E. Predictive Analytics (Hoboken: John Wiley & Sons, 2013) [272].
Silver N. The Signal and the Noise (New York: Penguin Press, 2012) [273].
Принятие решений
Kahneman D. 2011. Thinking, Fast and Slow. Farrar, Straus & Giroux, New York. Data Visualization [274].
Визуализация данных
Few S. Now You See It (Oakland: Analytics Press, 2009).
Few S. Show Me the Numbers: Designing Tables and Graphs to Enlighten (Oakland: Analytics Press, 2012).
Tufte E. R. Envisioning Information (Cheshire, CT: Graphics Press, 1990).
Tufte E. R. Visual Explanations (Cheshire, CT: Graphics Press, 1997).
Tufte E. R. The Visual Display of Quantitative Information (Cheshire, CT: Graphics Press, 2001).
Wong D. M. The Wall Street Journal Guide To Information Graphics (New York: W. W. Norton & Company, 2010).
A/B-тестирование
Siroker D. and Koomen P. A/B Testing (Hoboken: John Wiley & Sons, 2013).
Приложение А. О необоснованной эффективности данных: почему больше данных лучше?
* * *

Данное приложение воспроизводится (с небольшими изменениями и исправлениями) на основе публикации в авторском блоге [275] . Заголовок публикации сохранен.
В научной работе The Unreasonable Effectiveness of Data («Необоснованная эффективность данных») [276]авторы, все сотрудники компании Google, утверждают, что происходит интересная вещь, когда массивы данных попадают в вычислительную инфраструктуру (web scale [277]):
Простые модели на основе большого объема данных значительно выигрывают у более сложных моделей на основе меньшего объема данных.
В этой научной работе и более подробной лекции, прочитанной Норвигом [278], авторы демонстрируют: когда размер обучающей выборки доходит до сотен миллионов или триллионов примеров, очень простые модели способны быть эффективнее более сложных, основанных на тщательно разработанных онтологиях, но на меньшем объеме данных. К сожалению, авторы практически не предоставляют объяснений, почему больше данных лучше. В этом приложении я хочу попытаться найти ответ на этот вопрос.
Мое предположение состоит в том, что существует несколько типов проблем и причин, почему больше данных лучше.
Проблемы типа «ближайший сосед»
Первый тип проблем можно условно назвать « ближайший сосед ». Халеви и др. приводят пример:
Джеймс Хейс и Алексей Эфрос занялись задачей дополнения сцены: они решили удалить фрагмент изображения (портящий вид автомобиль или бывшего супруга) и заменить фон путем добавления пикселей, взятых из большого набора других фотографий [279].

Рисунок 1 Хейса и Эфроса
Норвиг изобразил следующую зависимость:

и описал ее как «порог данных», при котором результаты из очень плохих стали очень хорошими.
Я не уверен, что существует какая-то пороговая величина или что-то напоминающее фазовый переход. Скорее, мне кажется, суть проблемы заключается в поиске ближайшего соответствия. Чем больше данных, тем ближе может быть соответствие.
Хейс и Эфрос отмечают:
Результаты наших первых экспериментов с GIST-дескриптором по базе данных из 10 тыс. изображений крайне нас разочаровали. Тем не менее при увеличении размера набора данных до 2 млн единиц произошел качественный скачок… Независимо от нас Торралба и др. [2007] наблюдали похожий эффект с базой данных размером до 70 млн небольших (32×32) изображений… Для успеха нашего метода требуется большой объем данных. Мы наблюдали существенное улучшение, когда перешли от 10 тыс. к 2 млн изображений.
Размеры двух этих наборов данных различаются слишком сильно, а «качественный скачок» — это не то же самое, что порог (буквально фазовый переход).
Читать дальшеИнтервал:
Закладка: