Джон Келлехер - Наука о данных. Базовый курс
- Название:Наука о данных. Базовый курс
- Автор:
- Жанр:
- Издательство:Альпина Паблишер
- Год:2020
- Город:Москва
- ISBN:978-5-9614-3378-4
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Джон Келлехер - Наука о данных. Базовый курс краткое содержание
Книга знакомит с основами науки о данных. В ней охватываются все ключевые аспекты, начиная с истории развития сбора и анализа данных и заканчивая этическими проблемами, связанными с конфиденциальностью информации. Авторы объясняют, как работают нейронные сети и машинное обучение, приводят примеры анализа бизнес-проблем и того, как их можно решить, рассказывают о сферах, на которые наука о данных окажет наибольшее влияние в будущем.
«Наука о данных» уже переведена на японский, корейский и китайский языки.
Наука о данных. Базовый курс - читать онлайн бесплатно ознакомительный отрывок
Интервал:
Закладка:
19
Не существует единого мнения относительно минимального количества скрытых слоев, необходимых для того, чтобы сеть считалась глубокой. Некоторые полагают, что для этого достаточно даже двух слоев. Однако большинство глубоких сетей имеют десятки слоев, а некоторые — сотни и даже тысячи.
20
Доступное введение в РНС, а также об их использовании при обработке естественного языка см. {2} по адресу: https://tinyurl.com/RecurrentNeuralNetworks.
21
Технически это известно как проблема исчезающего градиента, поскольку градиент стремится к нулю при реализации алгоритма обратного распространения.
22
Существует два особых случая, которые также завершают алгоритм: ветвь сворачивается в отсутствие объектов после разделения набора данных или все входные атрибуты уже были использованы в узлах между корнем и ветвью. В обоих случаях добавляется завершающий узел, который помечается доминирующим значением целевого атрибута в родительском узле ветви.
23
Для ознакомления с энтропией и ее использованием в алгоритмах дерева решений см. {4} по адресу: http://www.machinelearningbook.com.
24
Подробное тематическое исследование на тему оттока клиентов (Kelleher, Mac Namee, D’Arcy 2015) можно найти по адресу: http://www.machinelearningbook.com.
25
При проведении сетевого маркетинга рекламная кампания распространяется на широкий спектр веб-сайтов без узкого таргетинга на пользователей.
26
В поведенческом таргетинге используются данные об онлайн-активности пользователей — посещении страниц, кликах, времени, проведенном на сайте, и т. д. — и прогнозное моделирование для выбора рекламных объявлений, показываемых пользователю.
27
Директива ЕС о конфиденциальности и электронных коммуникациях [2002/58/EC].
28
Некоторые женщины, впрочем, открыто сообщают ритейлерам, что они беременны, регистрируясь в программах лояльности для будущих мам.
29
http://www.predpol.com/.
30
Паноптикум — проект, разработанный в XVIII в. юристом Джереми Бентамом для тюрем и психиатрических больниц. Отличительная особенность паноптикума состоит в том, что персонал может постоянно вести наблюдение без ведома заключенных. Основная идея этого проекта в том, чтобы заставить заключенных вести себя так, будто они находятся под постоянным наблюдением.
31
EMEA (European, the Middle East and Africa) — Европа, Средний Восток и Африка.
32
http://smartsantander.eu/.
33
http://www.tepco.co.jp/en/press/corp-com/release/2015/1254972_6844.html.
34
Роман Льва Толстого «Анна Каренина» начинается фразой: «Все счастливые семьи похожи друг на друга, каждая несчастливая семья несчастлива по-своему». Идея Толстого заключается в том, что для достижения счастья семья должна быть успешной по ряду критериев (любовь, финансы, здоровье, родственники), но неудача в любом из этих аспектов ведет к несчастью семьи. Таким образом, все счастливые семьи одинаковы, поскольку успешны по всем критериям, а несчастливые могут стать таковыми по разным причинам.
Интервал:
Закладка: