Data science et transformation digitale
- Online
- 4500€
- 03/02/2025
- 5 Mois
Les nouveaux enjeux de la donnée : data science, cybersécurité et transformation digitale
Dans la peau d’un consultant en agence de conseil en Data Science, vous réalisez plusieurs missions pour accompagner et conseiller vos clients sur la collecte et l’analyse de données dans des contextes de transformation digitale.
La formation certifiante "Data science et transformation digitale", en partenariat avec l'IAE Paris-Sorbonne, s'adresse aux consultants, auditeurs, analystes, chargés d’étude, chefs de projets ainsi que toutes personnes souhaitant maitriser les enjeux de la collecte de l’analyse de données..
Objectifs de la formation
Ce programme vous préparera, conformément au bloc de compétence RNCP34803BC02 « Réaliser une collecte d’informations et mettre en place une veille stratégique » à :
- Créer un plan de recherche
Construire une base de données d’informations sur un thème déterminé, qualifiée par des critères pertinents tels que la crédibilité de la source, la date de mise en ligne des données…) - Collecter de l’information en sources ouvertes (Osint – Open Source Intelligence)
Mener des investigations sur Internet (sites, blogs, forums, réseaux sociaux, bases de données…) afin de collecter des informations utiles à une problématique à analyser - Mettre en place une veille
Surveiller les sources d’informations en paramétrant une plateforme de veille (concurrentielle, scientifique, commerciale juridique, normative…) et produire des rapports de veille - Collecter de l’information auprès de sources humaines (Humint - Human intelligence)
- Réaliser une interview auprès d’un expert d’un domaine d’activités (expert pays, expert d’une discipline…)
- Collecter des informations auprès d’une population cible
- Collecter des informations lors d’un événement professionnel
Points forts de la formation
• Une approche innovante articulée autour d’une immersion dans la peau d’un consultant
• Des cas pratiques et des contenus variés : vidéos, activités, podcasts, articles...
• Une pédagogie online flexible qui s’adapte à votre rythme : Formez-vous 100% en ligne, à votre rythme, où vous voulez : 12 à 15h d’apprentissage pour chaque module
• Des sessions lives pour échanger et partager avec nos experts et les participants
• La mise à disposition d’outils et logiciels pour réaliser les différents modules d'enseignement
• Un accompagnement de proximité par nos équipes pédagogiques et d’experts
• La délivrance d’un double certificat IAE Paris-Sorbonne et de l'Ecole de Guerre Economique
Public visé
Consultants
auditeurs
analystes
chargés d’étude
chefs de projets
ainsi que toutes personnes souhaitant maitriser les enjeux de la collecte de l’analyse de données.
Les débouchés métiers
Data analyst
Responsable CRM Analytics Consumer & Market Knowledge Analyst
Chef de produit digital
Digital analyst / web analytics
Chef de projet big data
Consultant marketing analytics
Data mining manager
Data planner
Responsable brand réputation
Responsable Community et social intelligence…
Programme des cours - 2025/2026
La formation certifiante "Data science et transformation digitale" se compose de 5 modules et se déroule sur 70 heures.
Modalités d’évaluation :
Pour l’obtention de ce Bloc de compétence RNCP34803BC02 « Réaliser une collecte d’informations et mettre en place une veille stratégique », les stagiaires de cette formation seront évalués de la façon suivante :
Exercice individuel d’identification de sources sur un sujet imposé, avec enrichissement d’un certain nombre de données en fonction des critères choisis :
Module 1 : « Collecte d’informations-OSINT »
Rédaction d’un rapport de synthèse :
Module 1 : « Collecte d’informations et OSINT »
Evaluation sur un exercice d’interview et le rendu d’une note de synthèse :
Module 1 : « Collecte d’informations et OSINT »
Exercice d’étude de marché (collecte d'information sur plusieurs acteurs d'une même activité sur une zone géographique donnée) :
Module 2 : « Data, code et transformation digitale »
Exercice de collecte d’information sur un salon professionnel :
Module 1 : « Collecte d’informations et OSINT »
Evaluations individuelles complémentaires :
Module 1 : identification de sources sur un sujet imposé, avec enrichissement d’un certain nombre de données en fonction des critères choisis.
Module 2 : Les participants développent un petit projet web afin de mieux appréhender la logique de développement, pour le code R ou le scraping via Python
Module 3 : Les participants livrent un petit projet de scraping web, ce qui peut constituer un premier jeu de données à analyser au cours des modules suivants.
Module 4 : Les participants livrent une première analyse du jeu de données produit dans le module précédent. Ils sont évalués par un QCM.
Module 5 : Les participants livrent une analyse approfondie de deux jeux de données, l’un constitué de données structurées, l’autre de données non structurées. L’analyse va produire pour le module 3 faits également partie de ce livrable et est évaluée dans ce cadre. Un système de correction croisée est organisé (chaque étudiant corrige 3 copies) à partir d’une grille de critères prédéfinis.
D’une façon plus générale, au début de la formation, les stagiaires peuvent s’exprimer lors d’un tour de table sur ce qu’ils attendent de la formation en termes d’enjeux, de contenus, d’apports.
L’évaluation de la satisfaction à chaud est mise place par l’équipe pédagogique en fin de formation et permettra de mesurer la satisfaction des bénéficiaires quant à la qualité des apports pédagogiques et de s’assurer que la formation a bien répondu aux attentes de départ..
Délivrance d’attestation :
A l’issue de cette formation (après les 5 Masterclass), le participant reçoit une Attestation de suivi de formation et un Certificat de réussite de formation se référant au Bloc de compétence RNCP 34803B02 « Réaliser une collecte d’informations et mettre en place une veille stratégique ».
Chaque Module est noté sur 20. Le certificat est délivré si le total obtenu est supérieur à 50/100.
En cas d’échec à la suite de l’évaluation, le participant reçoit seulement une Attestation de suivi de formation.
Objectifs pédagogiques :
A l’issue des 5 modules avec la certification et conformément au bloc de compétence RNCP34803BC02 les stagiaires seront capables de :
Créer un plan de recherche - Module 1 : « Collecte d’informations et OSINT » :
Construire une base de données d’informations sur un thème déterminé, qualifiée par des critères pertinents tels que la crédibilité de la source, la date de mise en ligne des données …)
Collecter de l’information en sources ouvertes - Module 2 : « Data, code et transformation digitale » :
Mener des investigations sur Internet (sites, blogs, forums, réseaux sociaux, bases de données…) afin de collecter des informations utiles à une problématique à analyser
Mettre en place d’une veille - Module 1 : « Collecte d’informations et OSINT » :
Surveiller les sources d’informations en paramétrant une plateforme de veille (concurrentielle, scientifique, commerciale juridique, normative…) et produire des rapports de veille
Collecter de l’information auprès de sources humaines - Module 1 : « Collecte d’informations et OSINT » :
- Réaliser une interview auprès d’un expert d’un domaine d’activités (expert pays, expert d’une discipline…)
- Collecter des informations auprès d’une population cible
- Collecter des informations lors d’un événement professionnel
Dans ce module introductif, les participants se familiarisent avec les concepts de collecte d’informations. La collecte d’information est aujourd’hui un savoir-faire indispensable à la gestion de projet, pour comprendre un environnement ou un marché, comme pour mieux percevoir un acteur économique ou même le profil d’un individu.
Objectif du module :
- Méthodologie de recherche d’information sur Internet
- Les moteurs de recherche
- Investigations techniques
- Les bases de données
Activités : Les participants réalisent une collecte d’information avec un rendu de chaque étape du projet, mindmapping du questionnement, plan de recherche, dossier de favoris et fiche méthodologique.
Objectif du module :
- Comprendre les nouveaux enjeux des données pour la transformation digitale
- Connaître comment les données sont gérées, traitées et agrégées dans un système d’information
- Appréhender les fondations des technologies web (structure des données)
Semaine 1 : Les fondamentaux
• Créer, capturer et délivrer de la valeur grâce aux données
• La donnée au cœur de la transformation digitale
Semaine 2 : Evolution des données et des usages
• Les technologies et le futur des usages
• Nouveaux usages des données et enjeux réglementaires
Semaine 3 : Décrire, structurer, échanger et afficher les données (langages XML/HTML et intro à la programmation)
• Les outils nécessaires à la programmation
• Technologies web : XML/HTML et CSS – des prérequis au scraping
Semaine 4 : L’habillage de la donnée sur le web (CSS) : Code, technologies web et projet
• Technologies web (continued) : focus sur CSS
• Mini projet de conception web
Activité : Les participants développent un petit projet web afin de mieux appréhender la logique de développement, pour le code R ou le scraping via Python
Objectif du module :
- Maîtriser un logiciel de scraping pour réaliser une collecte de données massive web
- Savoir trier, filtrer, agréger et analyser des données issues du scraping
- Comprendre les problématiques éthiques et les risques liées à la collecte de données massive et la construction de big data
Semaine 1 : Les enjeux éthiques et de sécurité liés à la collecte massive de données
• Gouvernance et maîtrise des risques liés aux données – une mise en perspective des ‘big data breaches’
• Bonnes pratiques de cybersécurité
Semaine 2 : Collecte et analyse de données massive – en théorie
• Data mining et big data
• Le web scraping : cas d’usage et approches (R & Python)
Semaine 3 : Collecte et analyse de données massive – en pratique
• Web scraping – requêtes et XML/HTML, un exemple avec l’extraction visuelle
• Vérifier et comprendre les données extraites
Semaine 4 : Projet de scraping
• Filtrage et tri pour exploiter les données issues d’une collecte massive
• Mini projet d’extraction web
Activités : Les participants livrent un petit projet de scraping web, ce qui peut constituer un premier jeu de données à analyser au cours des modules suivants.
Ce module est centré sur les fondations de la data science (analyse et fouille de données massive pour créer de la valeur). Plus précisément, il aborde les techniques les plus basiques d’analyse et de visualisation de données.
Objectif du module :
- Maîtriser un logiciel de statistiques
- Savoir réaliser des analyses descriptives
- Maîtriser la notion d’inférence statistique
- Savoir réaliser des modèles de régression
Semaine 1 : Les fondamentaux
• Différents niveaux d'utilisation des données
• Différents types de variables
• Les logiciels utilisés
• Statistiques univariées
Semaine 2 : Statistiques bivariées et construction d'indicateurs
• Les différents types d'indicateurs
• Différentes combinaisons de variables
• L'importance des représentations graphiques
Semaine 3 : les tests statistiques
• Définition d’un test statistique
• Le test du chi2
• Le test Anova
• Le test de corrélation
Semaine 4 : Les techniques de régression
• Le raisonnement « toutes choses égales par ailleurs »
• La régression linéaire multiple
• La régression logistique multiple
Activités : Les participants livrent une première analyse du jeu de données produit dans le module précédent. Ils sont évalués par un QCM.
Ce module porte sur les techniques de fouille de données structurées et non structurées. Nous abordons la distinction entre analyse supervisée et non supervisée. Nous utilisons également le logiciel R avec l’interface RStudio.
Objectif du module :
- Maîtriser des techniques de fouille de données structurées (analyses factorielles et typologiques)
- Maîtriser des techniques de fouille de données non structurées (analyse textuelle)
Semaine 1 : L’analyse exploratoire non supervisée
• L’analyse factorielle
• L’analyse en composantes principales
Semaine 2 : L’analyse typologique
• Les grands principes
• Les différentes méthodes d’analyse typologique
Semaine 3 : Le text mining
• L’analyse lexicométrique
• L’analyse sémantique
Semaine 4 : Quelle méthode choisir pour quel objectif ?
• Rappel de toutes les méthodes vues dans les modules 4 et 5
• Mise en correspondance entre les méthodes et les objectifs poursuivis
Activités : Les participants livrent une analyse approfondie de deux jeux de données, l’un constitué de données structurées, l’autre de données non structurées. L’analyse produite pour le module 3 fait également partie de ce livrable et est évaluée dans ce cadre. Un système de correction croisée est organisé (chaque étudiant corrige 3 copies) à partir d’une grille de critères prédéfinie.