Data Science 2023

Let's Dine - Recommandation de restaurants par géolocalisation

Sotis AI

Let's Dine - Recommandation de restaurants par géolocalisation
🔍 Cliquer pour agrandir

Description

Application de recommandation gastronomique calculant la distance entre l'utilisateur et les restaurants à proximité via la formule de Haversine. Le projet inclut deux versions : une optimisée Pandas pour les petits volumes (~6 300 restaurants parisiens) et une version Apache Spark capable de traiter 15 millions d'établissements en temps réel. Cette double implémentation permet de comparer les performances et de démontrer les avantages du traitement distribué sur de grands volumes de données.

Points clés

Trouver des restaurants à proximité en utilisant les coordonnées GPS. Comparaison des performances Pandas vs PySpark.

Outils & Technologies

Python Streamlit BigQuery Spark Docker Google Firebase Google Analytics AWS S3 GitHub

Approche & Méthodes

Formule de Haversine pour le calcul de distance. Benchmark Pandas vs PySpark sur grands volumes.

Statut

Open source