DataSet - HairEyeColor

HairEyeColor: es una matriz tridimensional resultante de la tabulación cruzada de 592 observaciones en 3 variables. Viene de una encuesta de estudiantes de la Universidad de Delaware reportada por Snee (1974). La división por Sexo fue agregada por Friendly (1992a) para propósitos didácticos.Este conjunto de datos es útil para ilustrar diversas técnicas para el análisis de tablas de contingencia, como la prueba de chi-cuadrado estándar o, más generalmente, el modelado log-lineal y los métodos gráficos como diagramas de mosaico, diagramas de tamiz o diagramas de asociación. https://www.rdocumentation.org/packages/datasets/versions/3.6.0/topics/HairEyeColor

#Visualizando
HairEyeColor#Conjunto de datos(DataSet)
## , , Sex = Male
## 
##        Eye
## Hair    Brown Blue Hazel Green
##   Black    32   11    10     3
##   Brown    53   50    25    15
##   Red      10   10     7     7
##   Blond     3   30     5     8
## 
## , , Sex = Female
## 
##        Eye
## Hair    Brown Blue Hazel Green
##   Black    36    9     5     2
##   Brown    66   34    29    14
##   Red      16    7     7     7
##   Blond     4   64     5     8
plot(HairEyeColor,col="lightblue",main="Diagrama de Mosaico")

Filtrado por género

male <- HairEyeColor[,,"Male"]#Filtrado por sexo = hombre
female <- HairEyeColor[,,"Female"]#Filtrado por sexo = mujer
data <- as.table(male+female)#Junto la información en una sola tabla
male #hombres
##        Eye
## Hair    Brown Blue Hazel Green
##   Black    32   11    10     3
##   Brown    53   50    25    15
##   Red      10   10     7     7
##   Blond     3   30     5     8
female #mujeres
##        Eye
## Hair    Brown Blue Hazel Green
##   Black    36    9     5     2
##   Brown    66   34    29    14
##   Red      16    7     7     7
##   Blond     4   64     5     8
data# (hombres + mujeres)
##        Eye
## Hair    Brown Blue Hazel Green
##   Black    68   20    15     5
##   Brown   119   84    54    29
##   Red      26   17    14    14
##   Blond     7   94    10    16

Manipulando datos

dimnames(data)=list(
  Cabello = c("Negro", "Marron", "Rojo", "Rubio"),
  Ojos = c("Marrón", "Azul", "Pardo", "Verde")
)
data
##         Ojos
## Cabello  Marrón Azul Pardo Verde
##   Negro      68   20    15     5
##   Marron    119   84    54    29
##   Rojo       26   17    14    14
##   Rubio       7   94    10    16

Diagrama 2

plot(data,col="lightblue",main="Diagrama de Mosaico")

Datos Numéricos

data#Tabla bidimensional
##         Ojos
## Cabello  Marrón Azul Pardo Verde
##   Negro      68   20    15     5
##   Marron    119   84    54    29
##   Rojo       26   17    14    14
##   Rubio       7   94    10    16
sum(data)#Cantidad de personas en la encuesta.
## [1] 592
colSums(data)#Frecuencia absoluta por columnas.
## Marrón   Azul  Pardo  Verde 
##    220    215     93     64
rowSums(data)#Frecuencia absoluta por filas.
##  Negro Marron   Rojo  Rubio 
##    108    286     71    127
round(prop.table(colSums(data)),3)#Frecuencia relativa por columnas.
## Marrón   Azul  Pardo  Verde 
##  0.372  0.363  0.157  0.108
round(prop.table(rowSums(data)),3)#Frecuencia relativa por filas.
##  Negro Marron   Rojo  Rubio 
##  0.182  0.483  0.120  0.215

Diagrama de barras

barplot(prop.table(colSums(data)),ylim=c(0,0.4),col=c("burlywood4","lightblue","orange3","lightgreen"),main="Frecuencia relativa de color de ojos")

barplot(prop.table(rowSums(data)),ylim=c(0,0.5),col=c("black","burlywood4","red","yellow"),main="Frecuencia relativa de color de cabello")

Frecuencias Relativas Globales y Marginales

round(prop.table(data),3)#Frecuencia relativa global
##         Ojos
## Cabello  Marrón  Azul Pardo Verde
##   Negro   0.115 0.034 0.025 0.008
##   Marron  0.201 0.142 0.091 0.049
##   Rojo    0.044 0.029 0.024 0.024
##   Rubio   0.012 0.159 0.017 0.027
round(prop.table(data,margin=1),3)#Frecuencia marginal por filas.
##         Ojos
## Cabello  Marrón  Azul Pardo Verde
##   Negro   0.630 0.185 0.139 0.046
##   Marron  0.416 0.294 0.189 0.101
##   Rojo    0.366 0.239 0.197 0.197
##   Rubio   0.055 0.740 0.079 0.126
round(prop.table(data,margin=2),3)#Frecuencia marginal por columnas.
##         Ojos
## Cabello  Marrón  Azul Pardo Verde
##   Negro   0.309 0.093 0.161 0.078
##   Marron  0.541 0.391 0.581 0.453
##   Rojo    0.118 0.079 0.151 0.219
##   Rubio   0.032 0.437 0.108 0.250
barplot(prop.table(data,margin = 1),beside=TRUE,legend.text=TRUE,ylim=c(0,0.8),col=c("black","burlywood4","red","yellow"),main="Frecuencia relativa marginal de color de cabello \n para cada color de ojos")
En el siguiente gráfico se aprecia que las personas que tienen ojos azules, tienden a ser rubias.

En el siguiente gráfico se aprecia que las personas que tienen ojos azules, tienden a ser rubias.

barplot (t(prop.table(data,margin = 2)),beside=TRUE,legend.text=TRUE,ylim=c(0,0.7),col=c("burlywood4","lightblue","orange3","lightgreen"),main="Frecuencia relativa marginal de color de ojos \n para cada color de cabello")
En el siguiente gráfico se aprecia que las personas que tienen cabello marrón, tienden a tener ojos pardos.

En el siguiente gráfico se aprecia que las personas que tienen cabello marrón, tienden a tener ojos pardos.