Эксперт Эксперт - Эксперт № 19 (2013)

Тут можно читать онлайн Эксперт Эксперт - Эксперт № 19 (2013) - бесплатно полную версию книги (целиком) без сокращений. Жанр: Публицистика. Здесь Вы можете читать полную версию (весь текст) онлайн без регистрации и SMS на сайте лучшей интернет библиотеки ЛибКинг или прочесть краткое содержание (суть), предисловие и аннотацию. Так же сможете купить и скачать торрент в электронном формате fb2, найти и слушать аудиокнигу на русском языке или узнать сколько частей в серии и всего страниц в публикации. Читателям доступно смотреть обложку, картинки, описание и отзывы (комментарии) о произведении.

Эксперт Эксперт - Эксперт № 19 (2013) краткое содержание

Эксперт № 19 (2013) - описание и краткое содержание, автор Эксперт Эксперт, читайте бесплатно онлайн на сайте электронной библиотеки LibKing.Ru

Эксперт № 19 (2013) - читать онлайн бесплатно полную версию (весь текст целиком)

Эксперт № 19 (2013) - читать книгу онлайн бесплатно, автор Эксперт Эксперт
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

«Научные задачи, которые data science ставит перед математикой, лежат скорее в инженерной сфере. Это связано с тем, что при работе с большими данными мы вынуждены отказываться от большого числа методов, которые перестают удовлетворять нас по скорости работы. Например, приходится отказываться от квадратичных методов, от линейного поиска. Взамен приходится идти на различного рода ухищрения и компромиссы. Изобретаются приближенные методы, которые не дают абсолютно точных результатов с научной точки зрения, но достаточные по качеству с точки зрения бизнеса», — считает Юрий Чехович. И это приносит свои плоды: например, после внедрения на «Балтике» решения по оптимизации управления цепочками поставок, позволяющего обрабатывать по 90 тыс. прогнозов в час, один человек стал справляться с объемом работ, который раньше выполнялся 30 сотрудниками, при этом точность прогнозирования возросла на 18,6%.

В работе с большими данными используется кластеризация — выделение однородных групп элементов, например потребительских сегментов или клиентов банков с нетипичным поведением, что сигнализирует о повышенном риске мошенничества. Оценки корреляций позволяют вычленить взаимосвязи между различными процессами — скажем, спросом на подгузники и сейсмической активностью. Экстраполяция и регрессионные методы используют для формирования прогнозов. Контент-анализ для вычленения интересов объектов наблюдения: например, при росте числа поисковых запросов на определенную марку автомобиля можно скорректировать производственные планы, а в ответ на поиск рецепта сборки бомбы в скороварке рекомендовать ассортимент подходящей посуды.

Работа с большими данными востребована в бизнесе для анализа поведения клиентов, автоматизации принятия решений в режиме реального времени, оптимизации запасов, оценки рисков, построения прогнозов рынка.

Если проблемы скорости и объема данных решаются прежде всего техническими методами, то анализ неструктурированных данных и их применение в бизнес-практике — задача уже интеллектуальная. Прежде компаниям приходилось иметь дело лишь с четко структурированными данными своей финансовой отчетности и такими же сведениями о клиентах и поставщиках. Теперь значительная часть представлена в форматах, мало соответствующих привычным форматам корпоративных баз данных, — это страницы в социальных сетях, видеозаписи, веб-журналы, логи многочисленных устройств, геолокационные данные. Но именно из них можно извлечь дополнительную информацию для принятия решений: если анкета заемщика кажется идеальной, но контент-анализ его поведения в интернете установил, что он с вероятностью 95% является неимущим, — это повод пересмотреть риски.

Подобные технологии намного эффективнее, чем может показаться на первый взгляд. В марте были опубликованы результаты работы алгоритма, характеризующего пользователей Facebook по оставляемым ими лайкам. Расовая принадлежность была угадана в 95% случаев, пол — в 93%, политические взгляды (демократ или республиканец) — в 85%, гомосексуальность — в 88%, религиозные убеждения — в 82%, наличие отношений — в 67%. При этом анализ ведется не по очевидным лайкам-маркерам, а по большим объемам менее информативных, но более популярных лайков. Например, гомосексуальность коррелирует с лайками Бритни Спирс и сериалу «Отчаянные домохозяйки», высокий IQ — с фильмом «Властелин колец» и музыкой Моцарта, а одиночество — с Марией Шараповой.

Data science требует видеть в данных отображение реальных процессов и уметь вычленять закономерности. Например, при панике, связанной с птичьим гриппом, карту его распространения построила компания Google, весьма далекая от медицины. Она обработала данные запросов о симптомах на разных стадиях развития болезни, что помогло ответить на вопросы, когда, где и в каком количестве люди заболеют.

Рентабельные головоломки

Пока анализ больших массивов данных стал неотъемлемой частью операционной деятельности в немногих отраслях, таких как телекоммуникации, интернет-реклама, социальные сети, страхование. «На наших технологиях моделируется геном человека, на них же работают, например, Skype, NYSE, NASDAQ, Euronext, T-Mobile, Fox Interactive Media. Но это все уникальные клиенты, тиражными пока стали лишь решения для работы с большими данными для сотовых операторов и банков. И те и другие работают на массовых рынках в условиях очень жесткой конкуренции, что вынуждает постоянно искать новые решения для сохранения доходности. Например, на основе данных об абонентах, их звонках, местоположении можно легко построить профиль каждого клиента, его реальную социальную сеть. Это помогает формировать программы лояльности, защиты от оттока клиентов, подбора оптимальных продуктов», — объясняет Сергей Золотарев, руководитель направления «Большие данные» в «EMC Россия и СНГ».

По оценке IDC, в 2012 году объем рынка систем хранения данных составил 8,6 млрд долларов, при этом за год в мире было сгенерировано 2,43 зеттабайта информации, что в два раза больше, чем в 2010 году (1,2 Зб). И перспективы у рынка заманчивые: «В корпоративной практике пока используется лишь 15–20 процентов доступных данных, прежде всего те, что имеются в табличной форме. Остальное — неструктурированные данные, но именно они растут в мире опережающими темпами. Среди них много информационного мусора: фото, видео, не применимые в бизнес-практике. Но важную часть неструктурированных данных составляют цифровые следы деятельности электронных устройств. Каждое из них имеет свой протокол работы и формат log-файла, что затрудняет их анализ. Но из них можно извлечь рациональное зерно», — считает Сергей Золотарев.

Действительно, устройства, незаметно окружившие нас, способны рассказать намного больше, чем может представить себе незадачливый обыватель. Например, многое можно вычислить, имея лишь доступ к показателям обычных квартирных счетчиков электричества и воды. Этого достаточно не только для того, чтобы узнать, сколько людей живет в квартире и когда их не бывает дома (уже одно это может заинтересовать многих — от воров до проповедников). По данным этих двух счетчиков можно диагностировать диарею и запоры, уровень дохода, бессонницу и телевизионные пристрастия.

Но пока рано ждать от жэков событийно обусловленной доставки слабительных и свежей прессы по технологии «точно в срок». Хотя технических проблем с использованием больших данных нынче нет даже в среднем бизнесе. Стопором является нехватка кадров и непонимание руководством компаний возможностей их применения. На большинстве российских рынков еще не настолько сильна конкуренция, чтобы data science стала фактором выживания для многих. Но ситуация быстро меняется. «Когда два года назад я рассказывал о больших данных, то видел серьезный скепсис. Российские компании считали это уделом западных интернет-гигантов. Сейчас уже вся тройка сотовых операторов, крупнейшие банки и телеком-компании либо уже внедрили, либо внедряют подобные решения. Это как с визитом к стоматологу: пугает, но, как ни откладывай, жизнь заставит, — убежден Сергей Золотарев. — Рынок больших данных начинался с закрытых решений — “черных ящиков” для клиента, включающих в себя как железо, так и софт. На наш взгляд, будущее за открытыми платформами, которые могут быть развернуты на любом стандартном сервере. Кроме того, меняется сама парадигма работы с данными. Прежде в фокусе внимания были приложения, выполняющие какую-то одну законченную функцию, но из-за этого компания оказывалась вооружена рядом несовместимых программ, а передача данных из одной в другую, например чтобы сопоставить геолокационные данные клиента с историей его покупок, оказывалась затруднительной. В ближайшее время стоит ожидать серьезного прорыва по мере перехода к парадигме, ориентированной на хранение и организацию данных. Подбор конкретного специализированного приложения становится вторичным».

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Эксперт Эксперт читать все книги автора по порядку

Эксперт Эксперт - все книги автора в одном месте читать по порядку полные версии на сайте онлайн библиотеки LibKing.




Эксперт № 19 (2013) отзывы


Отзывы читателей о книге Эксперт № 19 (2013), автор: Эксперт Эксперт. Читайте комментарии и мнения людей о произведении.


Понравилась книга? Поделитесь впечатлениями - оставьте Ваш отзыв или расскажите друзьям

Напишите свой комментарий
x