8000 GitHub - bntranduc/spark-streaming-project
[go: up one dir, main page]

Skip to content

bntranduc/spark-streaming-project

Repository files navigation

Bien sûr ! Voici une version plus claire, structurée et professionnelle de ton README pour ton projet Spark Streaming :


Spark Streaming - Guide d'installation et de test

Prérequis

  • Git
  • Docker & Docker Compose
  • SBT (Scala Build Tool)
  • Java JDK 11

Installation

  1. Cloner le dépôt
git clone git@github.com:bntranduc/spark-streaming-project.git &&
cd spark-streaming-project
  1. Préparer les données

Dézippez le dataset dans le répertoire principal du projet :

unzip yelp_dataset.zip
  1. Configurer les variables d'environnement

Copiez le fichier d'exemple .env.exemple en .env :

mv .env.exemple .env
  1. Compiler les modules Scala

Consumer

cd Consumer
sbt clean assembly

Producer

cd ../Producer
sbt clean assembly
  1. Lancer les services avec Docker

Assurez-vous d’être dans le répertoire principal du projet, puis exécutez :

docker compose up --build

Accès aux interfaces de monitoring

Service URL Description
Dashboard Streamlit localhost:8501 Visualisation des flux en temps réel
Spark UI - Producer localhost:4040 Interface Spark du Producer
Spark UI - Consumer localhost:4041 Interface Spark du Consumer

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 3

  •  
  •  
  •  
0