LaDissertation.com - Dissertations, fiches de lectures, exemples du BAC
Recherche

Variante de projet d'entreprise et de design

Étude de cas : Variante de projet d'entreprise et de design. Recherche parmi 300 000+ dissertations

Par   •  5 Juin 2014  •  Étude de cas  •  4 426 Mots (18 Pages)  •  1 440 Vues

Page 1 sur 18

EPF - 4ème année - IAP - Cours de Data mining –1 : Introduction - page 1/19- Bertrand LIAUDET

COURS DE DATA MINING

1 : INTRODUCTION

EPF – 4/ 5ème année - Option Ingénierie d’Affaires et de Projets

Bertrand LIAUDET

introduction 2

Qu’est-ce que le data mining...........................................................................................2

5 difficultés techniques du data mining ..........................................................................6

Applications du data mining...........................................................................................8

Présentation schématique des relations entre statistiques et data mining ..................10

Le processus standard d’une étude de data mining .....................................................12

Les logiciels de data mining ..........................................................................................15

En guise de conclusion : quelques idées fausses sur le data-mining ............................16

Aspects pédagogiques ....................................................................................................18

1ère édition : mai-juin 2006.

2ème édition, revue et corrigée, mai-juin 2007.

3ème édition, revue et corrigée, septembre 2008.

EPF - 4ème année - IAP - Cours de Data mining –1 : Introduction - page 2/19- Bertrand LIAUDET

INTRODUCTION

Qu’est-ce que le data mining

Traduction littérale

· Data mining = fouille de données.

· Data mining = forage de données.

Définitions

· Le data mining est un procédé d’exploration et d’analyse de grands volumes de données

en vue d’une part de les rendre plus compréhensibles et d’autre part de découvrir des

corrélations significatives, c’est-à-dire des règles de classement et de prédiction dont la

finalité ultime la plus courante est l’aide à la décision.

· Le data mining est un procédé de production de connaissance. En terme de logique

philosophique traditionnelle1, le data mining consiste à produire des jugements (toutes

les personnes sont x, la moyenne des y des personnes vaut tant, etc. : c’est l’étape de

description et de compréhension des données) et des règles de raisonnements (si toutes

les personnes sont « a » alors elles seront « b » : c’est l’étape modélisation qui permet la

prédiction).

Formules et métaphores

· Le data mining est un procédé qui permet de passer des données à la connaissance.

· Le data mining est un procédé qui permet de découvrir des « pépites » d’informations

cachées dans la gangue des données.

Pourquoi la naissance du data mining ?

· Augmentation des capacités de stockage des données (disques durs de giga octets).

· Augmentation des capacités de traitements des données (facilité d’accès aux données : il

n’y a plus de bandes magnétiques ; accélération des traitements).

· Maturation des principes des bases de données (maturation des bases de données

relationnelles).

· Croissance exponentielle de la collecte des données (scanners de supermarché, internet,

etc.)

1 THIRY Philippe, Notions de logique, De Boeck Université, 1996.

RUYER Bernard, Llogique formelle, PUF, 1998.

HOTTOIS Gilbert, Penser la logique, De Boeck Université, 1989.

Les ouvrages s'adressent aux étudiants ainsi qu'aux linguistes, philosophes, informaticiens, scientifiques

intéressés par la logique et le langage.

EPF - 4ème année - IAP - Cours de Data mining –1 : Introduction - page 3/19- Bertrand LIAUDET

· Croissance exponentielle des bases de données : capacités atteignant le terabits (1012 bits)

et émergence des entrepôts de données : data warehouse, rendant impossible

l’exploitation manuelle des données.

· Plus grande disponibilité des données grâce aux réseaux (intranet et internet).

· Développement de logiciels de data mining.

Intérêt du data mining

Les entreprises sont inondées de données (scanners des supermarchés, internet, bases de

données, etc.).

Ces données languissent dans des entrepôts de données (ou référentiels, ou data warehouse).

· Le data mining permet d’exploiter ces données pour améliorer la rentabilité d’une activité.

· Le data mining permet ainsi d’augmenter le retour sur investissement des systèmes

d’information.

Finalités : comprendre et décider, savoir et prévoir (la raison et la volonté)

Le data mining est un outil qui permet de produire de la connaissance :

· dans le but de comprendre

...

Télécharger au format  txt (32.1 Kb)   pdf (338.9 Kb)   docx (23.7 Kb)  
Voir 17 pages de plus »
Uniquement disponible sur LaDissertation.com