Data mining
Commentaire de texte : Data mining. Recherche parmi 300 000+ dissertationsPar fativa • 4 Janvier 2015 • Commentaire de texte • 643 Mots (3 Pages) • 666 Vues
Data mining
Data mining, connue aussi sous l'expression de fouille de données, forage de données, prospection de données, ou encore extraction de connaissances à partir de données, a pour objet l’extraction d'un savoir ou d'une connaissance à partir de grandes quantités de données, par des méthodes automatiques ou semi-automatiques.
Elle se propose d'utiliser un ensemble d'algorithmes issus de disciplines scientifiques diverses telles que les statistiques, l'intelligence artificielle ou l'informatique, pour construire des modèles à partir des données, c'est-à-dire trouver des structures intéressantes ou des motifs selon des critères fixés au préalable, et d'en extraire un maximum de connaissances utiles à l'entreprise.
L'utilisation industrielle ou opérationnelle de ce savoir dans le monde professionnel permet de résoudre des problèmes très divers, allant de la gestion de la relation client à la maintenance préventive, en passant par la détection de fraudes ou encore l'optimisation de sites web. C'est aussi le mode de travail du journalisme de données1.
L'exploration de données2 fait suite, dans l'escalade de l'exploitation des données de l'entreprise, à l'informatique décisionnelle. Celle-ci permet de constater un fait, tel que lechiffre d'affaires, et de l'expliquer comme le chiffre d'affaires décliné par produits, tandis que l'exploration de données permet de classer les faits et de les prévoir dans une certaine mesure notes 2 ou encore de les éclairer en révélant par exemple les variables ou paramètres qui pourraient faire comprendre pourquoi le chiffre d'affaires de tel point de vente est supérieur à celui de tel autre.
Pourquoi le Data mining :
De plus en plus de données qu’il faut « fouiller »
– Accumulation de données due à la maturité des technologies de bases de données et à l’automatisation de collecte de données
– Exemples de sources de données :
Celles générées par le commerce électronique : ex. Transactions
Entrepôts du Web : ex. Google
Réseaux sociaux et hébergement de documents : ex. Facebook, gmail…
Générées par des capteurs : ex. Images de télédétection
Surveillance, Logs de tout genre, simulations, …
Pourquoi maintenant ?
– L’utilisation dans l’industrie du data mining est récente
– Les données sont produites électroniquement
– Le contexte est ultra-concurrentiel
– Les données sont archivées
– Plateformes de calculs disponibles à bas prix
– Des solutions et des compétences data mining disponibles
Un nouveau marché
– Nouveau concept : Information as a product
– Toute société ou organisme qui collecte des données valorisables est potentiellement un broker d’information, qu’il peut vendre ou en exploiter commercialement les modèles pour des utilisations essentiellement marketing. Ex: Mots-clés pour
...