Données massives
Cours : Données massives. Recherche parmi 300 000+ dissertationsPar Mahaboub Abakar • 18 Mars 2019 • Cours • 399 Mots (2 Pages) • 486 Vues
Données massives
Lien TD : datacrunch.sh
Lien CM : sur le bv
Programme : RStudio
X<- 🡪 affecter une variable
Ex : x<- 3 🡪x=3
Donc 3x = 9
C(12,12,32,56,13) 🡪 Concaténation – assemblage
« x(crochet) chiffre (crochet) » permet de prendre une valeur du vecteur
Length(x) 🡪 nombre dans un vecteur
Si x = 12 12 32 56 13
Alors x+2 = 14 14 34 58 15
Mean(x) 🡪 moyenne
Sum(x) 🡪 somme
X<- c(12,12,32,56,13)
Y<- x*x
Alors
Sample(c(‘’Femme’’ , ‘’Homme’’), 5, replace=TRUE) 🡪 pioche au hasard
ou
Sexe<- c(‘’Homme’’, ‘’Femme’’)
Sample(sexe,1)
Sample(sexe,5) 🡪 erreur
Sample(sexe,5, replace=TRUE) 🡪 good
Tableau de données :
Tableau <- data.frame(Pointure=x, QI=y, Sexe=z)
Entrer
Taper tableau
Summary(tableau) 🡪 résumé statistique
Str(tableau) 🡪 analyse variable par variable
Accéder aux éléments d’un tableau 🡪 tableau (4,2) CROCHETS, pas paranthèses
Tableau (4, ) Toute la ligne
Tableau ( ,2) toute la colonne
Tableau$QI 🡪trouver colonne
With(tableau)
Tableau(tableau$QI>1000, ) CROCHETS 🡪 trouver les valeurs de QI >1000
[
CM4
Les variables représentent l’observation de caractères des individus (objet d’étude)
Exemple :
- Individus : des personnes issues d’une population
- Variables : représentation de caractères morphologiques
Poids | Taille | |
Individus | - | - |
Individus | - | - |
Individus | - | - |
Exemple :
- Individus : véhicules
- Variables : représentations de caractéristiques qui nous intéressent
Prix | Cylindrée | Couleur | Vitesse max | |
Véhicule | - | - | - | - |
Véhicule | - | - | - | - |
Véhicule | - | - | - | - |
Typologie des variables 🡪 2 types :
- Quantitatives 🡪 valeur :
🡪 Notion discrète
🡪 Notion continue
- Qualitatives (notion d’ordre) 🡪 modalités
Est-ce-que l’écart à du sens ?
1 variable d’intérêt (définie dans le problème posé) :
- Apprentissage supervisé : est-elle disponible (et renseignée) dans le tableau de données ?
- Apprentissage non supervisé : ou non ?
Apprentissage supervisé :
- Explication (apprentissage du modèle)
- Prédiction (utilisation du modèle appris)
- Expliquer la variable d’intérêt en fonction des années
- Prédire la variable d’intérêt sur des individus « nouveaux »
...