Variante de projet d'entreprise et de design
Étude de cas : Variante de projet d'entreprise et de design. Recherche parmi 301 000+ dissertationsPar dissertation • 5 Juin 2014 • Étude de cas • 4 426 Mots (18 Pages) • 1 453 Vues
EPF - 4ème année - IAP - Cours de Data mining –1 : Introduction - page 1/19- Bertrand LIAUDET
COURS DE DATA MINING
1 : INTRODUCTION
EPF – 4/ 5ème année - Option Ingénierie d’Affaires et de Projets
Bertrand LIAUDET
introduction 2
Qu’est-ce que le data mining...........................................................................................2
5 difficultés techniques du data mining ..........................................................................6
Applications du data mining...........................................................................................8
Présentation schématique des relations entre statistiques et data mining ..................10
Le processus standard d’une étude de data mining .....................................................12
Les logiciels de data mining ..........................................................................................15
En guise de conclusion : quelques idées fausses sur le data-mining ............................16
Aspects pédagogiques ....................................................................................................18
1ère édition : mai-juin 2006.
2ème édition, revue et corrigée, mai-juin 2007.
3ème édition, revue et corrigée, septembre 2008.
EPF - 4ème année - IAP - Cours de Data mining –1 : Introduction - page 2/19- Bertrand LIAUDET
INTRODUCTION
Qu’est-ce que le data mining
Traduction littérale
· Data mining = fouille de données.
· Data mining = forage de données.
Définitions
· Le data mining est un procédé d’exploration et d’analyse de grands volumes de données
en vue d’une part de les rendre plus compréhensibles et d’autre part de découvrir des
corrélations significatives, c’est-à-dire des règles de classement et de prédiction dont la
finalité ultime la plus courante est l’aide à la décision.
· Le data mining est un procédé de production de connaissance. En terme de logique
philosophique traditionnelle1, le data mining consiste à produire des jugements (toutes
les personnes sont x, la moyenne des y des personnes vaut tant, etc. : c’est l’étape de
description et de compréhension des données) et des règles de raisonnements (si toutes
les personnes sont « a » alors elles seront « b » : c’est l’étape modélisation qui permet la
prédiction).
Formules et métaphores
· Le data mining est un procédé qui permet de passer des données à la connaissance.
· Le data mining est un procédé qui permet de découvrir des « pépites » d’informations
cachées dans la gangue des données.
Pourquoi la naissance du data mining ?
· Augmentation des capacités de stockage des données (disques durs de giga octets).
· Augmentation des capacités de traitements des données (facilité d’accès aux données : il
n’y a plus de bandes magnétiques ; accélération des traitements).
· Maturation des principes des bases de données (maturation des bases de données
relationnelles).
· Croissance exponentielle de la collecte des données (scanners de supermarché, internet,
etc.)
1 THIRY Philippe, Notions de logique, De Boeck Université, 1996.
RUYER Bernard, Llogique formelle, PUF, 1998.
HOTTOIS Gilbert, Penser la logique, De Boeck Université, 1989.
Les ouvrages s'adressent aux étudiants ainsi qu'aux linguistes, philosophes, informaticiens, scientifiques
intéressés par la logique et le langage.
EPF - 4ème année - IAP - Cours de Data mining –1 : Introduction - page 3/19- Bertrand LIAUDET
· Croissance exponentielle des bases de données : capacités atteignant le terabits (1012 bits)
et émergence des entrepôts de données : data warehouse, rendant impossible
l’exploitation manuelle des données.
· Plus grande disponibilité des données grâce aux réseaux (intranet et internet).
· Développement de logiciels de data mining.
Intérêt du data mining
Les entreprises sont inondées de données (scanners des supermarchés, internet, bases de
données, etc.).
Ces données languissent dans des entrepôts de données (ou référentiels, ou data warehouse).
· Le data mining permet d’exploiter ces données pour améliorer la rentabilité d’une activité.
· Le data mining permet ainsi d’augmenter le retour sur investissement des systèmes
d’information.
Finalités : comprendre et décider, savoir et prévoir (la raison et la volonté)
Le data mining est un outil qui permet de produire de la connaissance :
· dans le but de comprendre
...