Skip to content

Latest commit

 

History

History
26 lines (18 loc) · 945 Bytes

File metadata and controls

26 lines (18 loc) · 945 Bytes

🧠 Analyse de site web en Python

Ce projet a pour objectif d'analyser automatiquement le contenu d’un site web à partir d’une URL donnée, dans le cadre d'un exercice issu d’un cahier des charges de veille technologique ou d’analyse web.

📄 Cahier des charges

Ce projet répond aux spécifications suivantes :

  • Collecter les données textuelles d’un site web (balises HTML ciblées)
  • Extraire certaines informations (titres, liens, métadonnées…)
  • Nettoyer et afficher les données dans un format lisible (texte ou tableau)

👉 L’objectif est de proposer un outil simple d’extraction et d’analyse du contenu d’un site, dans un cadre pédagogique ou exploratoire.

🧰 Technologies utilisées

  • Python 3.10
  • requests
  • BeautifulSoup 4
  • pandas

⚙️ Installation

git clone https://github.com/steven91-ar/Python_analyse_site.git
cd Python_analyse_site
pip install -r requirements.txt