Práctica: Creando DataFrame, visualizaciones y comparaciones de estadísticos básicos con Python.
Objetivo: Análisis de estadisticos básicos y evaluación de afirmaciones.
Recurso: El siguiente ejercicio fue tomado de Khan academy para la práctica. https://es.khanacademy.org/
Descargar: https://github.com/Azhura/python
Autor: Carlos Prado | Córdoba Argentina
Licencia: Libre.
Problema: Los miembros de una clase de música estaban discutiendo sobre qué instrumentos tocan los mejores estudiantes. Se hizo una encuesta, y aquí están los resultados:
Los 13 flautistas tenían un promedio de entre 3.84 y 3.88.
Solo había 3 precusionistas. Uno tenía un promedio de 2.4, otro 2.8, y otro 3.2.
4 de los saxofonistas tenían un promedio de 3.9 y los otros 5 tenían un promedio de 4.0.
Formulas a utilizar:
Media Aritmética
$ \bar{x} = \frac {\sum_{i = 1}^{n} * \ x_i}{n}$
Mediana
$P(X \leq m) = 0.5$
Varianza
$s^2 \ = \ \frac {\sum_{i=1}^{n} \ \cdot \ (x_i-\bar{x})^2}{n-1} $
Desviación típica
$s=+\sqrt{s^2}$
Afirmar:
import pandas as pd
import numpy as np
categoria = ["Flautista"] * 13 + ["Percusionista"] * 3 + ["Saxofonista"] * 9
valores = [0.3,0.3,0.3,0.3,0.3,0.3,0.3,0.3,0.3,0.3,0.3,0.3,0.3] + [2.4,2.8,3.2] + [3.9,3.9,3.9,3.9,4.0,4.0,4.0,4.0,4.0]
df = pd.DataFrame({"Estudiante": categoria, "Promedio": valores})
dfsum = pd.DataFrame({"Suma": valores})
dfc = pd.DataFrame({"Estudiante": categoria})
df.head()
df.describe()
dfc.describe()
#grupo_flautistas = df['Estudiante']
#grupo_flautistas[grupo_flautistas == "Flautista"]
grupo1 = df['Promedio'].groupby(df['Estudiante'])
grupo1.describe()
grupo1.median()
import matplotlib as plt
%matplotlib inline
plt.pyplot.hist(df['Promedio'])
flautistas = df.loc[0:12, ['Estudiante','Promedio']]
flautistas.head()
flautistas.describe()
std = flautistas.std(ddof=0)
var = flautistas.var(ddof=0)
print("Desviación tipica:",std,"Varianza:",var)
percusionistas = df.loc[13:15, ['Estudiante','Promedio']]
percusionistas
percusionistas.describe()
std = percusionistas.std(ddof=0)
var = percusionistas.var(ddof=0)
media = percusionistas.median()
print("Desviación tipica:",std,"Varianza:",var,"media",media)
saxofonistas = df.loc[16:24, ['Estudiante','Promedio']]
saxofonistas
saxofonistas.describe()
std = saxofonistas.std(ddof=0)
var = saxofonistas.var(ddof=0)
mediana = saxofonistas.median()
print("Desviación tipica:",std,"Varianza:",var,"Mediana:",mediana)
Respuesta