Роман Зыков - Роман с Data Science. Как монетизировать большие данные [litres]
- Название:Роман с Data Science. Как монетизировать большие данные [litres]
- Автор:
- Жанр:
- Издательство:Издательство Питер
- Год:2021
- Город:Санкт-Петербург
- ISBN:978-5-4461-1879-3
- Рейтинг:
- Избранное:Добавить в избранное
-
Отзывы:
-
Ваша оценка:
Роман Зыков - Роман с Data Science. Как монетизировать большие данные [litres] краткое содержание
Эта книга предназначена для думающих читателей, которые хотят попробовать свои силы в области анализа данных и создавать сервисы на их основе. Она будет вам полезна, если вы менеджер, который хочет ставить задачи аналитике и управлять ею. Если вы инвестор, с ней вам будет легче понять потенциал стартапа. Те, кто «пилит» свой стартап, найдут здесь рекомендации, как выбрать подходящие технологии и набрать команду. А начинающим специалистам книга поможет расширить кругозор и начать применять практики, о которых они раньше не задумывались, и это выделит их среди профессионалов такой непростой и изменчивой области. Книга не содержит примеров программного кода, в ней почти нет математики.
В формате PDF A4 сохранен издательский макет.
Роман с Data Science. Как монетизировать большие данные [litres] - читать онлайн бесплатно ознакомительный отрывок
Интервал:
Закладка:
Вот что сказал Ричард Хэмминг о том, как строить карьеру [21]:
«Примерно каждые семь лет значительно, если не полностью, меняйте область своей работы. К примеру, я переключался с вычислительной математики на аппаратное обеспечение, оттуда на программное обеспечение, и так далее, потому что есть тенденция к расходованию своих идей…
Вы должны меняться. Вы со временем устаете; вы расходуете свою оригинальность в одной области. Вам надо найти что-то рядом. Я не говорю, чтобы вы переключались с музыки на теоретическую физику, а там на английскую литературу; я подразумеваю, что в своем поле вам следует переключаться между областями, чтобы не застаиваться».
Хэмминг говорил об исследовательских работах, но я бы применил их и к области анализа данных. Никто не мешает вам перемещаться между «доменами» от веб-аналитики в машинное обучение, от аналитики к программированию и наоборот.
Если вы уже давно чувствуете, что вам неинтересно и нечего делать на работе, поговорите со своим менеджером. Если во время или после разговора станет понятно, что ничего не изменится, то лучше уходить. Впоследствии вас не будет мучить совесть, что вы засиделись и потеряли драгоценное время. К сожалению, оно не бесконечно.
Нужно ли все знать?
Однажды уже известному нам ученому Ричарду Хэммингу задали вопрос: «Сколько сил должно уходить на работу в библиотеке?» И вот что он ответил [21]:
«Это зависит от области. Я вот что скажу об этом. Был парень в Bell Labs. Очень-очень умный парень. Он всегда был в библиотеке, он читал все. Если вы хотели ссылок, вы шли к нему и он давал вам всякие разные ссылки. Но в процессе формирования этих теорий я сформулировал утверждение: его именем в долгосрочной перспективе не будет названо ни одного эффекта. Он уже ушел из Bell Labs и является адъюнкт-профессором. Он был очень ценен; это несомненно. Он написал некоторые очень хорошие статьи в Physical Review; но его именем не было названо ни одного эффекта, потому что он читал слишком много».
Все знать невозможно, чтение отнимает очень много времени. Я очень люблю читать, но на это у меня мало времени. Книга ждет своего часа, иногда десять лет, пока я не возьму ее с полки. Когда у меня стоит выбор между пассивными (теория) и активными (практика) действиями, я выбираю активное. В пассивное включаются чтение, просмотр видео с конференций, занятия на онлайн-курсах. При этом я не могу назвать себя неучем – у меня с десяток сертификатов Coursera. Под активным действием я подразумеваю решение какой-либо задачи, доведение какого-то проекта (пусть даже личного) до конца. Особенно меня интересуют рабочие задачи, а не учебные. Важно обладать эрудицией и знаниями, но гораздо важнее их умелое применение. А чтобы применить знание, не нужно разбираться в каком-то предмете на 100 %, бывает достаточно всего 20 % (правило Парето!). Помните, в главе про машинное обучение я ссылался на Шавье Аматриана, который предлагал просто прочитать введение книги по ML, открыть нужный алгоритм и закодировать его. Именно практика покажет, что важно, а что нет. Невозможно играть хорошую музыку, лишь зная ее теорию.
Какой сотрудник лучше: тот, кто прошел штук 20 разных курсов и сделал очень много учебных заданий, или тот, кто пару несложных проектов довел до конца, от идеи до реализации? В 95 % случаев я выберу второго. Моя личная практика показала, что есть люди-теоретики, а есть практики. Я нанимал теоретика на одну из наших задач, думая, что если человек хорошо разбирается в теории, то он разберется и в практике. Ничего хорошего из этого не получилось.
Хорошо, можно много не читать, но как тогда получать информацию? Вот что написал Хэмминг:
«Если вы все время читаете, что сделали другие люди, вы будете думать, как думали они. Если вы хотите думать новые мысли, отличающиеся мысли, тогда делайте то, что делают многие креативные люди: сформулируйте задачу достаточно ясно и отказывайтесь смотреть какие-либо ответы, пока основательно не продумаете задачу – как вы будете решать ее, как вы можете немного изменить ее, чтобы формулировать ее правильно. Поэтому да, вам надо быть в курсе. Вам надо быть в курсе больше, чтобы узнавать, какие есть задачи, чем читать, чтобы находить решения. Чтение, чтобы находить решения, не кажется путем к значимым исследованиям. Поэтому я дам два ответа. Вы читайте; но имеет значение не сколько, а как вы читаете».
В свое время меня критиковал мой преподаватель физики: «Зачем ты изобретаешь велосипед и выводишь эту формулу?» Я никогда не любил учить наизусть, просто ненавидел это. Мне было проще знать базовые принципы и несколько формул, все остальное выводится через них – пускай это и дольше, чем пользоваться готовыми. Вы знаете, что на письменном экзамене по физике на Физтехе можно пользоваться любой литературой? Хоть целый рюкзак учебников приноси. Как вы думаете, это сильно помогало? Нет, потому что без понимания базовых принципов сложнейшие физические задачи не решить. Принципы решения задач отрабатываются на задачах, а не на чтении решений и заучивании формул. Невозможно все знать, и бывает проще найти свой подход, чем копать горы литературы в поисках очередных «кейсов». Кейсы сейчас воспринимаются как рецепты – применишь, и все получится. Но чего-то нестандартного из кейсов уже не сочинишь.
Еще Хэмминг заметил, что ученые в Bell Labs, у которых была приоткрыта дверь в кабинет, добились большего, чем ученые, дверь которых была закрыта. И это тоже альтернатива чтению. Открытость ума и широта взглядов помогают добиться успеха. Что мы можем для этого сделать? Как минимум не отмахиваться от коллег, как от назойливых мух, и не запираться от них в своих кабинетах с магнитными замками. Да, они могут отвлекать своими вопросами и просьбами, но они также и опускают вас с небес ваших мыслей на земную твердь реальности. Коллеги – источник информации, которую вы нигде больше не получите. Заодно они могут участвовать в брейншторме ваших идей – в информационном вакууме заточить их невозможно. Будучи сооснователем и директором по аналитике Retail Rocket, я иногда садился со своим ноутбуком в других отделах, просто сидел, слушал в фоновом режиме, что там происходит, и именно так узнавал о проблемах, о которых не подозревал и никогда бы не узнал, если бы задавал вопросы в лоб. И это давало мне полезную информацию, которую я мог воплотить в своих решениях.
Эпилог
Цель этой книги – дать практические советы. И если у вас получится применить в работе хотя бы несколько моих идей, для меня, как для автора, это будет успехом.
Напоследок еще один совет: постоянно задавайте себе вопрос «все ли я выжимаю из данных?» Где-то аналитику я организовывал сам (Ozon.ru, Wikimart.ru, Retail Rocket), где-то консультировал («Технониколь», «Иннова», «Купивип», Fastlane Ventures) и понял, что дело не только в цифрах. Чтобы использовать данные максимально эффективно, нужно, во-первых, следить за качеством самих данных, а во-вторых, правильно организовать взаимодействие людей внутри компании, приоритизацию гипотез и использование технологий. Все эти направления я постарался подробно разобрать в главах этой книги.
Читать дальшеИнтервал:
Закладка: