1. Отфильтруйте сообщения, соотвествующие некоторому условию.
  2. Запишите все отфильтрованные сообщения в базу данных (например в MySQL).
  3. Отсортируйте сообщения по offset в убывающем порядке.
  4. Обогатите стриминговые данные статическим датасетом (небольшой коллекции, превращенной в rdd будет достаточно).
  5. Попробуйте, оставаясь в рамках парадигмы DStreams переехать на Dataset API из Spark 1.6

results matching ""

    No results matching ""