NLP · Python · Web Scraping · Recommender Systems
Système de recommandation de films construit en Python — scraping IMDB avec Selenium, moteur de recherche par similarité TF-IDF, et système de filtrage collaboratif basé sur les préférences d'utilisateurs similaires, avec interface graphique Tkinter.
Les plateformes de streaming comme Netflix ou Prime Video utilisent des systèmes de recommandation sophistiqués pour suggérer des contenus adaptés à chaque utilisateur. Ces systèmes combinent généralement deux approches : le filtrage basé sur le contenu (similarité entre films) et le filtrage collaboratif (préférences d'utilisateurs similaires).
L'objectif de ce projet : construire de zéro un système de recommandation de films en deux parties — un moteur de recherche par similarité textuelle via TF-IDF, et un système de filtrage collaboratif basé sur les notes et préférences d'utilisateurs similaires, le tout avec une interface desktop Tkinter.
Collecte automatisée des données de films depuis IMDB avec Selenium (navigation dynamique) et BeautifulSoup (parsing HTML) — titres, genres, descriptions, notes, acteurs.
Vectorisation des descriptions et métadonnées des films via TF-IDF (Term Frequency-Inverse Document Frequency) pour mesurer la similarité textuelle entre films.
Calcul de la similarité cosinus entre le film recherché et tous les films de la base — retourne les N films les plus similaires.
Identification des utilisateurs ayant des préférences similaires via un score combiné (MRS/MRA) — recommande les films bien notés par des utilisateurs proches du profil cible.
Interface graphique desktop permettant de saisir un titre, visualiser les recommandations et naviguer entre les deux modes (recherche par similarité / filtrage collaboratif).