Добрый день, пытливый Backend-разработчик!
Меня зовут Алексей Зиновьев и я пишу приложения имеющие дело с обработкой данных с 2008 года. Позволь мне рассказать тебе, как решить несколько задач, характерных для современной Big Data разработки, а также попутно построить несколько незамысловатых, но добротных архитектур.
Все примеры кода, используемые в этой книге будут доступны по адресу https://github.com/zaleslaw/Spark-Tutorial
Пожелания по развитию книги и примеров кода приветствуются!
Я буду постепенно вводить персонажей, задавать тебе вопросы, иногда давать на них ответы, тем самым, укрепляя твой дух и решимость на пути великой битвы с "большими данными".
Также, я надеюсь, ты читал некоторые известные книги или смотрел доклады на конференциях об обработке данных
о работе с Hadoop или
о выходе Spark 2
Если нет, то потрать 1-2 часа на это и двигайся дальше.