Kernel Densidad estimaciones Estimación forma de una función de densidad . Una función de densidad muestra la frecuencia con la que aparece una variable en un muestreo aleatorio de una población. Estimación de la densidad del núcleo se considera un método no paramétrico . En las estadísticas , hay métodos paramétricos y no paramétricos . Métodos paramétricos hacen más supuestos que los no - paramétricos . No se necesitan supuestos sobre la distribución , medios o desviaciones estándar en las estadísticas no paramétricas . Por ejemplo , si usted quiere saber si el examen del décimo en un aula tendrá una puntuación más alta que la primera de nueve , en el razonamiento paramétrica usted tendría que saber la media y la desviación estándar para obtener una respuesta. En el razonamiento no paramétrico , simplemente sabiendo el número de prueba es suficiente para conocer la última prueba tiene una probabilidad del 10 por ciento de estar por encima de las puntuaciones anteriores .
Kernel
la densidad de estimación kernel tiene dos componentes fundamentales: el núcleo y el ancho de banda . El Kernel es la función de densidad . Hay seis tipos comunes de funciones de densidad en las estadísticas no paramétricas : normal, uniforme , triangular , Epanechnikov , cuártica , triweight y coseno. Cada una de estas funciones se utiliza para estimar la frecuencia de una variable aleatoria de una población.
Ancho de banda
El segundo componente , el ancho de banda , suaviza la los datos resultantes de la función de densidad de kernel. El ancho de banda , por lo tanto , tiene impactos fuertemente la representación visual de los datos . Una línea dentada puede llegar a ser suavizada progresivamente hasta que los datos han sido tan parafraseado que ya no es útil . En la fórmula de estimación de densidad de kernel , el ancho de banda está representada por la letra h. Debe ser positivo y dar lugar a una distribución que resume a uno.
Ventajas
Kernel Densidad Estimación tiene ventajas a otros métodos de estimación no paramétricos , especialmente histogramas . Los histogramas representan la distribución de una variable en los contenedores a lo largo de un rango horizontal . Contenedores apilados representan una mayor densidad de la variable en el sector de los datos. Debido histogramas simbolizan datos a través de los contenedores , la variable es compartimentado y diferentes distribuciones son irregulares y discreta , tergiversando la distribución de fluidos de una variable que realmente existe en una población . Kernel Densidad Estimación mejor representa esta fluidez de líneas uniformes , cuya suavidad se determina por el ancho de banda elegido en la fórmula de densidad kernel .