ESTADISTICA DESCRIPTIVA: enero 2023

martes, 31 de enero de 2023

RECOLECCIÓN DE LOS DATOS

2. FUENTES Y TÉCNICA PARA LA RECOLECCIÓN DE LA INFORMACIÓN.

En el presente capitulo es la aplicación del primer proceso de la estadística Descriptiva que corresponde la recolección de los datos, de identificar las clases de fuente y la técnica que se emplean para la realización del trabajo o proyecto estadístico con estudio de caso cuyo fin es diseñar la encuesta, con sus respectivas preguntas abiertas y cerradas.

Con variable discreta y continua; además el estudiante o usuario o investigador debe tener presente los pasos de métodos científicos para plantear el proyecto estadístico, o definir el titulo o tema de su estudio de caso.

2.1. .DEFINICIÓN DE FUENTES Y TÉCNICAS.

Las fuentes son hechos o documentos a las que acude el investigador y que le permite obtener la información.

Las técnicas son los medios empleados para recolectar la información.

2.1.1 Clases de Fuentes.

Las Fuentes Primarias :es la información oral o escrita que es recopilada directamente por el investigador a través de relatos o escritos transmitidos por los participantes en un suceso o acontecimiento.

Las Fuentes Secundarias es la Información escrita que ha sido recopilada y transcrita por personas que han recibido tal información a través de otras fuentes escritas o por un participante en un suceso o acontecimiento.

Técnicas para Recolectar Las fuentes primarias mas utilizadas como método científico son: observación, entrevista, encuestas,cuestionarios y sondeo.

Las Técnicas para Recolectar Las Fuentes Secundarias mas se utilizan son : Internet, textos,revistas,documentos,prensa y otros.

lunes, 30 de enero de 2023

LA FUENTE PRIMARIA : TÉCNICA DE LA ENCUESTA

LA FUENTE PRIMARIA : Cuando la información es oral o escrita que es recopilada directamente por el investigador a través de relatos o escritos transmitidos por los participantes en un suceso o acontecimiento .En nuestro trabajo de investigación el medio empleado para recolectar la información es la encuesta .

1 .LA ENCUESTA

Es el instrumento de recolección de información, se registra a través de formularios que recogen cantidad de datos, pretende describir con profundidad aspectos sobre temas concretos; se basa en la recolección de datos ya existentes. Ejemplo: Encuesta Estudio de la Economía Familiar, Ingreso y Egresos en el Hogar.

La Encuesta es un instrumento que releva, a partir de cierto númro de individuos, las relaciones generales entre las caracteristicas de un gran número de variables,mediante un procedimiento estimulo-respuesta homogéneo.

La encuesta suministra estimaciones sobre la distribución y comportamiento de las características de una población, con base en los datos de una muestra, genera información oportuna y confiable sobre aspectos.

La encuesta es un instrumento de recolección de información.Se registra a través de formulario que recogen cantidad de datos de manera completa y eficiente.El diseño de la Encuesta existen dos clases que son: La Encuesta Descriptiva y La Encuesta Explicativa las diferencias fundamentales entre los dos son:

1.1. LA ENCUESTA DESCRIPTIVA .

Es un instrumento que releva a partir de cierto número de individuos,las relaciones generales entre las caracteristicas de un gran numero de variables,no plantea hipotesis,explora un gran numero de factores,población lo más grande posible y heterogenea .Ejemplos : "Encuesta sobre el nivel de accidentalidad entre los obreros en una empresa siderúrgica", "Encuesta acerca de las actividades que desarrolla la población adulta urbana de colombia en sus horas libres".

1.2.LA ENCUESTA EXPLICATIVA.

Es un instrumento que busca verificar una o varias hipótesis, restringe la población o universo estudiado para excluir otras fuentes de variación, , relación entre dos variables y población muy homogenea. Ejemplos:

Encuesta a Empresarios Colombianos del sector metalmecánico para examinar la capacidad de producción de tecnología autóctona en sus fábricas"."Encuesta efectuada a familias de espinal, guamo, flandes, girardot para determinar los efectos de la inflación sobre el nivel de vida familiar. "Encuesta a estudiantes universitarios sobre los efectos que producen los problemas psicosociales familiares sobre el bajo rendimiento académico.

2. INSTRUMENTOS DE LA RECOLECCIÓN

Básicamente es diseñar un formulario que permita la obtención de los datos de manera completa y eficiente. El formulario debe responder a los objetivos y propósitos del estudio de caso o investigación.

Todo formulario esta conformado por tres partes: la parte administrativa, el cuerpo o tema especifico, y las notas a pie de pagina.

Para la elaboración de formularios, no hay reglas estrictas es necesario tener en cuanta las siguientes recomendaciones:

· El formulario debe tener una extensión adecuada.

· La distribución de los temas deben hacerse de manera lógica y ordenada. El orden de los temas debe responder a la importancia en el estudio.

· Las preguntas deben ser formuladas evitando insistencias. El lenguaje debe ser sencillo y explícito.

Es necesario probar la funcionalidad del formulario aplicando un estudio piloto para detectar las fallas que pueden presentar, con el fin de realizar ajustes o correcciones necesarios.

ORGANIZACIÓN DE LA INFORMACIÓN SEGUNDO PROCESO DE LA ESTADISTICA DESCRIPTIVA

2. Organización de la información es el segundo proceso de la estadistica descriptiva,se utiliza el metodo de la distribucion de frecuencia,me permite ordenar los datos numericos en una forma ascedente o descendente especialmente en elaborar las tablas y graficas, depediendo si los datos numericos son de variables discreta o continua.Los datos tienen un valor que consisten en ordinal, nominal y escalar.

El valor Ordinal , es cuando los datos permiten un orden especifico, por ejemplo la categoria de evaluación, primero pesimo,segundo regular, tercero normal ,cuarto bueno y por ultimo excelente.

El valor nominal, los datos no permite un orden especifico, por ejemplo las marcas de tennis deportivo,el genero y las preguntas de opciones de si o no.

El valor escalar, es cuando los datos se agrupan por intermedio de intervalo de clase,especialmente datos de sueldos,ingresos, gastos,etc.

La elaboración de las tablas tienen cuatro distribuciones de frecuencias son: la absoluta,relativa,absoluta acumulada y relativa acumulada.

Organización De La Información

2.1 TAMAÑO DE LA MUESTRA

En el momento de tener el diseño de la encuesta para su aplicación, la pregunta a la la que se enfrenta un estudiante o investigador es ¿cuál debe de ser el tamaño de la muestra? Con el fin de determinar él numero de la encuesta.

Hay que tener en cuenta cuando las unidades que compone el universo son conocidas y tener igual probabilidad de ser seleccionados en la muestra, esta toma el nombre de MUESTREO, ALEATRIO SIMPLE (M.A.S)

El muestreo aleatorio simple es un método eficiente cuando la población no es grande, además, casi barato hallar las unidades.

Ejemplo: Es una institución universitaria hay 600 estudiantes cursando en las diferentes carreras que ofrecen; 200 son de contaduría, 250 de ingeniería de sistemas y 150 son de administración de empresas. Si queremos seleccionar una muestra aleatoria simple (de 100 personas por ejemplo), la posibilidad de selección de cada estudiante es:

P= n = 150 = 0.25 N 600

Y la distribución tendería a que los 150 de la muestra se distribuyen así:

50 contaduría 62 ingenieros de sistemas y 38 administración de empresas.

Una forma practica para seleccionar unidades es hacerlo de forma sistemática, escogiendo una unidad cada intervalo donde el intervalo se calcula así:

Para iniciar el proceso de selección sistemática escogemos al asar un numero entre uno y el 15 a partir del numero seleccionado y cada 15 viviendas se hace una escogencia hasta completar la muestra.

Este procedimiento se llama Muestra aleatoria sistemática.

La formula para determinar el tamaño de la muestra en el muestreo aleatorio simple, MAS, es:

Población finita, por el método de proporciones:

n = n₀ , siendo n₀ = Z²P.Q

1+ n₀ d3

N= Tamaño poblacional.

n= Tamaño de la muestra.

n₀= Tamaño muestral para poblaciones finitas primera aproximación.

d= Error del muestreo.

S= Varianza poblacional.

Z= niveles de confianza o riesgo, obtenido de las tablas.

P= Porcentaje que escoge el investigador de la elaboración de la encuesta diseñada favorablemente.

Q= Porcentaje de la elaboración de la encuesta desfavorablemente.

2.1.1 Cálculo del tamaño de la muestra

Para el calculo tamaño de la muestra se utilizó Dos métodos la de proporciones y el muestreo aleatorio simple. A continuación se realiza dos ejemplo apareciendo estos métodos.

Ejemplo 1. Nos muestra el calculo por método de proporciones así:

Para población finita.

n₀= (2)² . 0,60 . 0,40

(0,05)²

n₀= 4 * 0,24

0,0025

n₀= 0,96 .

0,0025

n₀= 384

N = 12.370 Familias Obtenidas Así:

N = Número de Habitantes .

N. de personas Promedio por Familia

N = 61.852 . = 12.370

n = 384 .

1 + 384 .

12.370

n = 384 .

1.031042846

n = 372

n= 372 / 26 Barrios = 14 Familias por Barrio

n = 14 * 3 Barrios = 42 Familias

En nuestro estudio de caso escogimos una probabilidad favorables el 60% y desfavorable 40%, se conoce la población de 12.370 familias, se tiene que Z-2 y el error d = 0.05 utilizando el M.A.S con proporciones.

Realizamos otro cálculo para determinar el tamaño de la muestra por el método azar así:

n = Tamaño de la muestra verdadera.

n0= Tamaño de la muestra de las primeras aproximaciones.

N = Tamaño poblacional.

S2= Varianza.

d = Error del muestreo.

Z = 2 niveles de confianza o riesgo, obtenido de las tablas.

Calculo de la X y S2 , se utiliza la siguiente formula.

X = Σ X_i

i =1 .

S² = Σ (X_i– X)²

i =1 .

La formula para determinar el tamaño de la muestra se utiliza el muestreo aleatorio simple M.A.S, por el método azar así:

n = n₀ , siendo n₀ = Z²P.Q

1+ n₀ d3

Ejemplo 2, se escoge al azar varios barrios de la cantidad aproximada de familias existentes en el Espinal comprende lo siguiente:

El barrio Santa Margarita Maria cuenta con 130 familias.

El barrio Centro cuenta con 160 familias.

El barrio Libertador cuenta con 120 familias.

El barrio Arkabal cuenta con 100 familia.

El barrio Betania Campestre cuenta con 130 familias.

El barrio Balkanes cuenta con 150 familias.

Se da la variable de los barrios escogidos el número de cantidad de familias así:

X1 = 130	X2 = 160
X3 = 120	X4 = 100
X5 = 130	X6 = 150

Se calcula la media aritmética, para hallar el promedio de familias existentes de los barrios escogidos.

X = Σ X_i

i =1 .

X = 130 + 160 + 120 + 100 + 130 + 150

X = 790

X = 131.66

X= 132

N° de Familia	X_i - X	(X_i - X)²
130	-2	4
160	28	784
120	-12	144
100	-32	1024
130	-2	4
150	18	324

S² = 2284 S² = 380.66

n₀= (2)² (380.66) n₀= (4)(380.66)

(6.6)2 (43.56)

n₀= 1522.64 n₀= 34.955

43.56

n = 34.955 . n = 34.955 .

1 + 34.955 1+ 0.002825788

12.370

n = 34.955 n = 34.85

1.002825788

n = 35 familias.

El tamaño de la muestra para este caso es de 35 familias, es decir tenemos que aplicar 35 encuestas para cada familia.

sábado, 28 de enero de 2023

ANÁLISIS DE DATOS

Los datos son números que se dividen en dos variables: ordinal y nominal.

Los datos de variable ordinal son números enteros finitos que tienen un orden especifico,son conjunto de variables categóricos tienen orden,como ejemplo las clases sociales:baja,media y alta ;como amaneció el estado de un paciente:grave,delicado,bueno, muy bueno y excelente.

Los datos de variable nominal son números enteros finitos que no tienen orden específico,por ejemplo el genero,marcas de objetos,razas,etc.

jueves, 26 de enero de 2023

ORGANIZACIÓN DE UNA VARIABLE CONTINUA

3.2 ORGANIZACIÓN DE UNA VARIABLE CONTINUA

La distribución de frecuencia es un método para organizar y resumir datos. Bajo este método los datos que componen una serie, se clasifica y ordenan, indicándose el número de veces en que se repite cada valor.

Las variables continuas son aquellos datos numéricos que admiten valores fraccionarios, decimales, infinitos y tienen una característica fundamental de medidas. Por ejemplo, la estatura de un estudiante que mide un metro con sesenta y dos centímetros, que pesa sesenta kilos y su edad es de veinte años, el sueldo mensual recibe un empleado, etc.

Con series de datos numéricos de una variable continua se ordena por medio de una tabla distribución de frecuencia utilizando los siguientes elementos:

EL RANGO: Se representa con la letra R, se define como la distancia que hay entre dos valores ó la diferencia que hay entre el dato superior con respecto al dato inferior, se aplica la siguiente formula:

R= DS – DI

LA CLASE: Se representa con la letra h, se define como él numero que indica el grupo de datos numéricos, se aplica con la siguiente formula:

h= 1+ 333 log n

TAMAÑO DE LA CLASE: Se representa con la letra C, se define un numero aparente, constante que indica la formación de cada grupo de datos numéricos entre un limite inferior con un limite inferior, aplicando la siguiente formula:

C = R/h

El tamaño de la clase (C) se define el cociente entre el rango y la clase.

4. ELABORACIÓN DE LA TABLA DE DISTRIBUCION DE FRECUENCIA :

Teniendo los cálculos del rango, la clase y el tamaño de clase se procede a ordenar los datos
con sus cuatros distribución: absoluta,relativa.absoluta acumulada y relativa acumulada.La tabla se ordena en forma ascendente o descendente.