Cours de sciences économiques - Licence 3: Les méthodes statistiques
Recherche de Documents : Cours de sciences économiques - Licence 3: Les méthodes statistiques. Recherche parmi 300 000+ dissertationsPar mariam • 27 Novembre 2013 • 5 410 Mots (22 Pages) • 1 259 Vues
ANALYSE DE DONNEES 2011 2012
ANALYSE DE DONNEES Page 1
LICENCE 3 – SCIENCES ECONOMIQUES
COURS DE M. THIERRY BLAYAC
Analyse de données
[Tapez le sous-titre du document]
2011 2012
H34VEN
Cours pour Licence 3, Semestre 6 Année 2011-2012
ANALYSE DE DONNEES 2011 2012
ANALYSE DE DONNEES Page 2
LICENCE 3 – SCIENCES ECONOMIQUES
COURS DE M THIERRY BLAYAC
Cours magistral d’Analyse de données
Ecrit pour les étudiants de troisième année de licence en sciences économiques
Pour toutes incompréhensions, imperfections ou erreurs éventuelles,
Merci de les signaler sur le forum de la faculté de sciences économiques de l'UM1, à cette adresse :
http://www.forum-sceco.fr (Connexion à partir de http://gide-éco.fr/forum ), à défaut de ne pouvoir me contacter directement...
PRISE DE NOTE PAR : PLASMAN SYLVAIN
ANNEE 2011 – 2012
ANALYSE DE DONNEES 2011 2012
ANALYSE DE DONNEES Page 3
Introduction
Les méthodes statistiques sont maintenant utilisé dans la plupart des domaines scientifiques, il est donc incontournable de savoir les maitriser.
Ces techniques sont utilisé dans la conception et l’estimation de modèle économétrique, les sondages, les enquêtes ou encore les études de marché. A l’issue de la phase de recueil de données, la démarche statistique consiste à traiter et interpréter les informations recueillies. Elle comporte donc 2 grands aspects, l’aspect descriptif ou exploratoire, et l’aspect référentiel.
La statistique exploratoire a pour but de synthétiser, de résumer et de structurer l’information contenue dans les données, et utilise pour cela une représentation des données sous forme de tableau, sous forme de graphique ou d’indicateur numérique. Depuis plus de 40 ans, les méthodes d’analyse de données ont largement démontré leur efficacité dans l’étude des gros volumes de données grâce aux développements de l’informatique. Les méthodes dites multidimensionnelles, telles que l’analyse en composante principale (ACP) et l’analyse factorielle de correspondance (AFC), permettent la mise en relation de nombreuses variables entre elles.
Ces méthodes multidimensionnelles permettent d’obtenir des représentations graphiques qui constituent le meilleur résumé possible de l’information contenu dans de gros tableaux de données. Pour cela, le statisticien consent à une perte d’information afin de gagner en lisibilité ; il est alors en mesure de faire apparaître les principaux phénomènes qu’il cherche à analyser.
Il est possible de diviser les principales méthodes d’analyse de données en principaux groupes : d’une part les méthodes de classification, visant à réduire la taille de l’ensemble des individus en groupes homogènes, et d’autres parts, les méthodes factorielles, qui cherchent à réduire le nombre de variables en les résumant par un petit nombre de composantes synthétiques, et, selon que l’on travaille avec un tableaux de variables qualitatives ou quantitatives, on utilisera l’analyse en composante principale (variables quantitatives) ou factorielle de correspondance (voire multiples) (variables qualitatives)
Par conséquent le choix d’une méthode statistique dépend de l’objectif que l’on se fixe mais également de la nature des variables, ainsi que du nombre de variables.
ANALYSE DE DONNEES 2011 2012
ANALYSE DE DONNEES Page 4
I. Les différents types de variables
Une variable statistique décrit une caractéristique pour les différents individus pour lesquels elle les définit. L’ensemble de ces individus constituent une population. On distingue 2 types de variables, d’une part les variables qualitatives, d’autre part les variables qualitatives. Les variables quantitatives décrivent des quantités tandis que les variables qualitatives décrivent … vous ne devinerez jamais …. Si, si, c’est bien des qualités … *faceplam*.
Par ailleurs des variables quantitatives peuvent être discrètes ou continues.
II. Description d’une variable quantitative
Une variable quantitative est décrite par les valeurs qu’elle prend pour les individus. Afin de synthétiser l’information donnée par une variable quantitative, les deux indicateurs les plus utilisés sont la moyenne et la variance Σ ( ) Σ( )
La moyenne est un indicateur de tendance centrale, reflétant l’ordre de grandeur de la variable centrale, alors que la variance est un indicateur de dispersion, reflétant l’importance des fluctuations de la série autour de la moyenne. Par définition, une variable est centrée si sa moyenne est nulle, et réduite sa variance est égale à 1.
III. Description d’une variable qualitative
A. Le tableau disjonctif complet
Considérons la variable qualitative « couleur des yeux » à trois modalités : bleu, vert, marron.
ANALYSE DE DONNEES 2011 2012
ANALYSE DE DONNEES Page 5
Individu
Couleur des yeux
1
Bleu
2
Vert
3
Marron
4
Vert
5
Bleu
6
Bleu
Pour chaque modalité, on peut calculer l’effectif ainsi que la fréquence relative. La présentation d’une variable qualitative sous sa forme disjonctive complète est celle qui se prête le mieux à des
...