2. FUENTES Y TÉCNICA PARA LA RECOLECCIÓN DE LA INFORMACIÓN.
En el presente capitulo es la aplicación del primer proceso de la estadística Descriptiva que corresponde la recolección de los datos, de identificar las clases de fuente y la técnica que se emplean para la realización del trabajo o proyecto estadístico con estudio de caso cuyo fin es diseñar la encuesta, con sus respectivas preguntas abiertas y cerradas.
Con variable discreta y continua; además el estudiante o usuario o investigador debe tener presente los pasos de métodos científicos para plantear el proyecto estadístico, o definir el titulo o tema de su estudio de caso.
2.1. .DEFINICIÓN DE FUENTES Y TÉCNICAS.
Las fuentes son hechos o documentos a las que acude el investigador y que le permite obtener la información.
Las técnicas son los medios empleados para recolectar la información.
2.1.1 Clases de Fuentes.
Las Fuentes Primarias :es la información oral o escrita que es recopilada directamente por el investigador a través de relatos o escritos transmitidos por los participantes en un suceso o acontecimiento.
Las Fuentes Secundarias es la Información escrita que ha sido recopilada y transcrita por personas que han recibido tal información a través de otras fuentes escritas o por un participante en un suceso o acontecimiento.
Técnicas para Recolectar Las fuentes primarias mas utilizadas como método científico son: observación, entrevista, encuestas,cuestionarios y sondeo.
Las Técnicas para Recolectar Las Fuentes Secundarias mas se utilizan son : Internet, textos,revistas,documentos,prensa y otros.
LA FUENTE PRIMARIA : Cuando la información es oral o escrita que es recopilada directamente por el investigador a través de relatos o escritos transmitidos por los participantes en un suceso o acontecimiento .En nuestro trabajo de investigación el medio empleado para recolectar la información es la encuesta .
1 .LA ENCUESTA
Es el instrumento de recolección de información, se registra a través de formularios que recogen cantidad de datos, pretende describir con profundidad aspectos sobre temas concretos; se basa en la recolección de datos ya existentes. Ejemplo: Encuesta Estudio de la Economía Familiar, Ingreso y Egresos en el Hogar.
La Encuesta es un instrumento que releva, a partir de cierto númro de individuos, las relaciones generales entre las caracteristicas de un gran número de variables,mediante un procedimiento estimulo-respuesta homogéneo.
La encuesta suministra estimaciones sobre la distribución y comportamiento de las características de una población, con base en los datos de una muestra, genera información oportuna y confiable sobre aspectos.
La encuesta es un instrumento de recolección de información.Se registra a través de formulario que recogen cantidad de datos de manera completa y eficiente.El diseño de la Encuesta existen dos clases que son: La Encuesta Descriptiva y La Encuesta Explicativa las diferencias fundamentales entre los dos son:
1.1. LA ENCUESTA DESCRIPTIVA .
Es un instrumento que releva a partir de cierto número de individuos,las relaciones generales entre las caracteristicas de un gran numero de variables,no plantea hipotesis,explora un gran numero de factores,población lo más grande posible y heterogenea .Ejemplos : "Encuesta sobre el nivel de accidentalidad entre los obreros en una empresa siderúrgica", "Encuesta acerca de las actividades que desarrolla la población adulta urbana de colombia en sus horas libres".
1.2.LA ENCUESTA EXPLICATIVA.
Es un instrumento que busca verificar una o varias hipótesis, restringe la población o universo estudiado para excluir otras fuentes de variación, , relación entre dos variables y población muy homogenea. Ejemplos:
Encuesta a Empresarios Colombianos del sector metalmecánico para examinar la capacidad de producción de tecnología autóctona en sus fábricas"."Encuesta efectuada a familias de espinal, guamo, flandes, girardot para determinar los efectos de la inflación sobre el nivel de vida familiar. "Encuesta a estudiantes universitarios sobre los efectos que producen los problemas psicosociales familiares sobre el bajo rendimiento académico.
2. INSTRUMENTOS DE LA RECOLECCIÓN
Básicamente es diseñar un formulario que permita la obtención de los datos de manera completa y eficiente. El formulario debe responder a los objetivos y propósitos del estudio de caso o investigación.
Todo formulario esta conformado por tres partes: la parte administrativa, el cuerpo o tema especifico, y las notas a pie de pagina.
Para la elaboración de formularios, no hay reglas estrictas es necesario tener en cuanta las siguientes recomendaciones:
· El formulario debe tener una extensión adecuada.
· La distribución de los temas deben hacerse de manera lógica y ordenada. El orden de los temas debe responder a la importancia en el estudio.
· Las preguntas deben ser formuladas evitando insistencias. El lenguaje debe ser sencillo y explícito.
Es necesario probar la funcionalidad del formulario aplicando un estudio piloto para detectar las fallas que pueden presentar, con el fin de realizar ajustes o correcciones necesarios.
2. Organización de la información es el segundo proceso de la estadistica descriptiva,se utiliza el metodo de la distribucion de frecuencia,me permite ordenar los datos numericos en una forma ascedente o descendente especialmente en elaborar las tablas y graficas, depediendo si los datos numericos son de variables discreta o continua.Los datos tienen un valor que consisten en ordinal, nominal y escalar.
El valor Ordinal , es cuando los datos permiten un orden especifico, por ejemplo la categoria de evaluación, primero pesimo,segundo regular, tercero normal ,cuarto bueno y por ultimo excelente.
El valor nominal, los datos no permite un orden especifico, por ejemplo las marcas de tennis deportivo,el genero y las preguntas de opciones de si o no.
El valor escalar, es cuando los datos se agrupan por intermedio de intervalo de clase,especialmente datos de sueldos,ingresos, gastos,etc.
La elaboración de las tablas tienen cuatro distribuciones de frecuencias son: la absoluta,relativa,absoluta acumulada y relativa acumulada.
En el momento de tener el diseño de la encuesta para su aplicación, la pregunta a la la que se enfrenta un estudiante o investigador es ¿cuál debe de ser el tamaño de la muestra? Con el fin de determinar él numero de la encuesta.
Hay que tener en cuenta cuando las unidades que compone el universo son conocidas y tener igual probabilidad de ser seleccionados en la muestra, esta toma el nombre de MUESTREO, ALEATRIO SIMPLE (M.A.S)
El muestreo aleatorio simple es un método eficiente cuando la población no es grande, además, casi barato hallar las unidades.
Ejemplo: Es una institución universitaria hay 600 estudiantes cursando en las diferentes carreras que ofrecen; 200 son de contaduría, 250 de ingeniería de sistemas y 150 son de administración de empresas. Si queremos seleccionar una muestra aleatoria simple (de 100 personas por ejemplo), la posibilidad de selección de cada estudiante es:
P= n = 150 = 0.25N 600
Y la distribución tendería a que los 150 de la muestra se
distribuyen así:
50 contaduría 62 ingenieros de sistemas y 38 administración
de empresas.
Una forma practica para seleccionar unidades es hacerlo de
forma sistemática, escogiendo una unidad cada intervalo donde el intervalo se
calcula así:
Para iniciar el proceso de selección sistemática escogemos
al asar un numero entre uno y el 15 a partir del numero seleccionado y cada 15
viviendas se hace una escogencia hasta completar la muestra.
Este procedimiento se llama Muestra aleatoria sistemática.
La formula para determinar el tamaño de la muestra en el
muestreo aleatorio simple, MAS, es:
Población finita, por el método de proporciones:
n = n0,
siendo n0= Z2P.Q
1+ n0 d3
N
N= Tamaño poblacional.
n= Tamaño de la muestra.
n0= Tamaño muestral
para poblaciones finitas primera aproximación.
d= Error del muestreo.
S= Varianza poblacional.
Z= niveles de confianza o riesgo,
obtenido de las tablas.
P= Porcentaje que escoge el
investigador de la elaboración de la encuesta diseñada favorablemente.
Q= Porcentaje de la
elaboración de la encuesta desfavorablemente.
2.1.1 Cálculo del tamaño de la muestra
Para el calculo tamaño de la
muestra se utilizó Dos métodos la de proporciones y el muestreo aleatorio
simple. A continuación se realiza dos ejemplo apareciendo estos métodos.
Ejemplo 1. Nos muestra el calculo por método de proporciones
así:
Para población finita.
n0=(2)2. 0,60 . 0,40
(0,05)2
n0=4 *
0,24
0,0025
n0= 0,96
.
0,0025
n0= 384
N = 12.370 Familias Obtenidas
Así:
N = Número
de Habitantes
.
N. de personas Promedio por Familia
N = 61.852
.= 12.370
5
n = 384
.
1 + 384 .
12.370
n = 384
.
1.031042846
n = 372
n= 372 / 26 Barrios = 14
Familias por Barrio
n = 14 * 3 Barrios = 42
Familias
En nuestro estudio de caso
escogimos una probabilidad favorables el 60% y desfavorable 40%, se conoce la
población de 12.370 familias, se tiene que Z-2 y el error d = 0.05
utilizando el M.A.S con proporciones.
Realizamos otro cálculo para
determinar el tamaño de la muestra por el método azar así:
n = Tamaño de la muestra
verdadera.
n0= Tamaño de la muestra de las
primeras aproximaciones.
N = Tamaño poblacional.
S2= Varianza.
d = Error del muestreo.
Z = 2 niveles de confianza o
riesgo, obtenido de las tablas.
Calculo de la X y S2 , se
utiliza la siguiente formula.
n
X =Σ Xi
i
=1 .
n
n
S2=Σ (Xi– X)2
i
=1
.
n
La formula para determinar el tamaño de la muestra se
utiliza el muestreo aleatorio simple M.A.S, por el método azar así:
n = n0,
siendo n0= Z2P.Q
1+ n0 d3
N
Ejemplo 2, se escoge al azar
varios barrios de la cantidad aproximada de familias existentes en el Espinal
comprende lo siguiente:
El barrio Santa Margarita Maria
cuenta con 130 familias.
El barrio Centro cuenta con 160
familias.
El barrio Libertador cuenta con
120 familias.
El barrio Arkabal cuenta con 100
familia.
El barrio Betania Campestre
cuenta con 130 familias.
El barrio Balkanes cuenta con 150
familias.
Se da la variable de los barrios
escogidos el número de cantidad de familias así:
X1 = 130
X2 = 160
X3 = 120
X4 = 100
X5 = 130
X6 = 150
Se calcula la media aritmética, para hallar el promedio de
familias existentes de los barrios escogidos.
n
X =Σ Xi
i
=1 .
n
X =130 + 160 + 120
+ 100 + 130 + 150
6
X =790
6
X = 131.66
X= 132
N° de Familia
Xi - X
(Xi - X)2
130
-2
4
160
28
784
120
-12
144
100
-32
1024
130
-2
4
150
18
324
S2=2284
S2= 380.66
6
n0=(2)2(380.66)
n0=(4)(380.66)
(6.6)2 (43.56)
n0=1522.64
n0= 34.955
43.56
n =34.955 .
n = 34.955 .
1 +34.955
1+ 0.002825788
12.370
n =34.955 n
= 34.85
1.002825788
n = 35 familias.
El tamaño de la muestra para este
caso es de 35 familias, es decir tenemos que aplicar 35 encuestas para cada
familia.
Los datos son números que se dividen en dos variables: ordinal y nominal.
Los datos de variable ordinal son números enteros finitos que tienen un orden especifico,son conjunto de variables categóricos tienen orden,como ejemplo las clases sociales:baja,media y alta ;como amaneció el estado de un paciente:grave,delicado,bueno, muy bueno y excelente.
Los datos de variable nominal son números enteros finitos que no tienen orden específico,por ejemplo el genero,marcas de objetos,razas,etc.
La distribución de
frecuencia es un método para organizar y resumir datos. Bajo este método los
datos que componen una serie, se clasifica y ordenan, indicándose el número de
veces en que se repite cada valor.
Las variables
continuas son aquellos datos numéricos que admiten valores fraccionarios,
decimales, infinitos y tienen una característica fundamental de medidas. Por
ejemplo, la estatura de un estudiante que mide un metro con sesenta y dos
centímetros, que pesa sesenta kilos y su edad es de veinte años, el sueldo mensual recibe un empleado, etc.
Con series de datos numéricos de una
variable continua se ordena por medio de una tabla distribución de frecuencia
utilizando los siguientes elementos:
EL RANGO: Se representa con la letra R,
se define como la distancia que hay entre dos valores ó la diferencia que
hay entre el dato superior con respecto al dato inferior, se aplica la
siguiente formula:
R=
DS – DI
LA CLASE: Se representa con la letra
h, se define como él numero que indica el grupo de datos numéricos, se
aplica con la siguiente formula:
h=
1+ 333 log n
TAMAÑO DE LA CLASE:Se representa con la letra C, se define un numero aparente,
constante que indica la formación de cada grupo de datos numéricos entre
un limite inferior con un limite inferior, aplicando la siguiente formula:
C =R/h
El tamaño de la clase (C) se define el
cociente entre el rango y la clase.
4. ELABORACIÓN DE LA TABLA DE DISTRIBUCION DE FRECUENCIA :
Teniendo los cálculos del rango, la clase y el tamaño de clase se procede a ordenar los datos con sus cuatros distribución: absoluta,relativa.absoluta acumulada y relativa acumulada.La tabla se ordena en forma ascendente o descendente.