Revisión 2-Preguntas

Autoras correspondientes al grupo 12:

  • Valeska Quijano, publicadora
  • Alison Rivera, revisora
  • Carmen Zambrano, responsable 

1.- ¿Cuáles son los días que presentan una humedad superior a la humedad media de la semana?

El promedio semanal de la humedad promedio diaria es aproximadamente 81,3%

Valores:
83.9, 94.3, 86.8, 90.4, 92.4, 68.0, 55.1

Días con humedad media superior a 81.3%                                                        

  • 4 de mayo (83.9%)                                                                                                  
  • 5 de mayo (94.3%)                                                                                     
  • 6 de mayo (86.8%)
  • 7 de mayo (90.4%)
  • 8 de mayo (92.4%)

2.- ¿Cuáles son los días con presión superior a la mediana de la presión de esa semana?

       La mediana semanal de la presión promedio diaria es aproximadamente 29.9 in

       Presiones promedio diarias:
       30.0, 30.0, 29.9, 29.8, 29.8, 29.9, 30.1

       Ordenadas de forma ascendente:                                                                                       
       29.8, 29.8, 29.9, 29.9, 30.0, 30.0, 30.1

        Mediana = 29.9


3.-  ¿Cuál de las categorías de la variable Condición es la menos frecuente, en esa semana?

Durante la semana analizada no se registraron lluvias, nieve ni otras condiciones climáticas extremas. Todos los días tuvieron precipitaciones iguales a cero, lo que indica que el clima se mantuvo estable y seco. Por lo tanto, podemos decir que las categorías menos frecuentes de la variable "Condición" son aquellas relacionadas con fenómenos meteorológicos activos, como la lluvia, la nieve o las tormentas, ya que no ocurrieron en ningún momento durante la semana.

4. ¿Cómo se distribuye la velocidad del viento en esa semana?

  • Máximo: 11.7 mph (día 5)
  • Mínimo: 4.7 mph (día 15) 
  • Rango Inter cuartil:
        Q1 (25%): 5.3 mph
         Q3 (75%): 10.3 mph
         IQR = 10.3 − 5.3 = 5.0 mph

La distribución nos muestra que la mayoría de los valores se ubican entre 5 y 11 mph, lo que muestra una distribución moderadamente dispersa, la media y la mediana son similares (Me=7.9mph y Media=7.85 mph) lo que sugiere una distribución aproximadamente simétrica y si representáramos los datos en un histograma, observaríamos una ligera concentración en los valores entre 7 y 11 mph, con una caída hacia los extremos bajos.
Durante la semana del 5 al 18 de mayo, la velocidad del viento presentó una distribución moderadamente uniforme y aproximadamente simétrica, con velocidades promedio diarias que oscilaron entre 4.7 y 11.7 mph. La mayoría de los días registraron velocidades entre 7 y 11 mph, lo que indica que el viento fue de intensidad moderada a alta en este periodo, sin variaciones extremas.

5.- Si se considera las categorías de la variable Viento, ¿Cuál categoría es la más frecuente en esa semana?

Tomando en cuenta las categorías como: Calmo (0–5 mph), Leve o ligero (6–10 mph), Moderado (11–15 mph), Fuerte (más de 15 mph), según la frecuencia basada en promedios los días más frecuentes son en la categoría leve ya que cuenta con 9 días, el calmo tiene 4 días, moderado tiene 1 día y fuerte no cuenta con ningún día.

Durante los días del 5 al 18 de mayo, la categoría de viento más frecuente fue “leve”, con una velocidad promedio entre 6 y 10 mph. Esta categoría se presentó en 9 de los 14 días, lo que representa aproximadamente el 64% de los días observados. Esto indica que los vientos fueron mayoritariamente suaves en esa semana.

6.- ¿Cómo se distribuye la variable Punto de rocío?

La variable Punto de rocío se distribuye en un rango moderadamente amplio (21.7 grados), con una media de 58.18 y una leve asimetría hacia valores bajos. No presenta valores atípicos extremos, aunque el 44.0 podría considerarse ligeramente bajo respecto al resto. Se puede decir que hay una distribución aproximadamente normal, pero algo sesgada a la izquierda.

  • Media: 58.18
  • Mediana: 61.4
  • Rango: 21.7
  • Varianza: 45.2
  • Desviación estándar: 6.71

7. ¿Cuál de las variables: Temperatura, Presión y Velocidad del viento, presenta menor dispersión? 

Tenemos los siguientes datos promedios de cada día de la temperatura de Buenos Aires en °F: 
68.3
63.6
68.8
67.7
65.2
64.4
64.7
Desviación estándar es 2,105 °F
Varianza = 4,433

Valores diarios promedio en in  de la presión durante la semana:
30.0
30.0
29.9
29.8
29.8
29.9
30.1
Desviación estándar = 0,111 in
Varianza = 0,012 

Velocidades del viento promedio diarias de Buenos Aires durante esa semana en mph:
5.2
11.7
8.6
10.3
7.4
4.8
5,3
Desviación estándar = 2,709 mph
Varianza = 7,338

De esta manera se puede concluir que la variable PRESIÓN es aquella que presenta la menor dispersión comparado con la temperatura y la velocidad del viento correspondiente a la ciudad de Buenos Aires.



8. ¿Cuáles son las medidas descriptivas de la variable Humedad? Interprete 

Variable: humedad 

Medidas centrales

Media aritmética: 81,875
Mediana: 86,975
Moda: 92,6

Analizando estos datos, se encuentra que Media<Mediana<Moda por lo que la distribución de los datos presenta un sesgo hacia la izquierda. 


Medidas de localización

Cuartiles:
Q1= 68,225
Q2= Me = 86,975
Q3= 93,537

Quintiles:
q1= 65,6
q2= 82,1
q3=89,6
q4= 94,85


Medidas de dispersión

Desviación estándar= 14,268
Varianza= 203,572
Rango= 77,6
RIQ= 25,312

Gracias al %Coeficiente de Variación=17,426 se conoce que es un conjunto de datos HOMOGÉNEO puesto que %CV<20


Medidas de forma:

Coeficiente de asimetría= -0,465 < 0, lo que indica que existe una asimetría a la izquierda.

Coeficiente de apuntamiento = -1,864 > 0, entonces sabemos que es tiene una forma platicúrtica.



9. ¿Cuáles son las medidas descriptivas de la variable Temperatural? Interprete

Medidas centrales y de localización

Media aritmética = 66,02 
Mediana = 65,88
Moda = 64,9

Cuartiles
Q1 = 64,74
Q2 = Me = 65,87
Q3 = 67,28

Quintiles
q1 = 64,51
q2 = 65,42
q3 = 66,37
q4 = 67,58

Ya que Moda < Mediana < Media aritmética, sabemos que la distribución de los datos es asimétrica hacia la derecha.


Medidas de dispersión 

Desviación estándar = 1,39
Varianza = 1,93 
Rango = 5,2
Rango Inter Cuartil = 2,54
%CV = 0,21%

Debido a que el % del Coeficiente de Variación es menor a 20, estamos ante datos homogéneos.


Medidas de forma 

Coeficiente de Asimetría = 0,22 > 0. La distribución de los datos tiene un sesgo positivo

Coeficiente de apuntamiento = -2,20 < 0. Es de forma platicúrtica.



10. ¿Existe una relación entre la variable Temperatura y Presión? (Consulte el tema: Regresión lineal)

La relación que existe entre la variable temperatura y la variable presión se puede definir mediante la siguiente expresión 
Presión=0.0380Temperatura+32.48
Presión: variable dependiente 
Temperatura: variable independiente 
Pendiente: -0.0380


Por cada grado Fahrenheit que aumenta la temperatura, la presión promedio disminuye 0.038 pulgadas de mercurio.
Coeficiente de correlación=-0,27
Esto indica una correlación moderada negativa entre temperatura y presión. 
p-valor = 0.035
Como es menor que 0.05, la relación sí es estadísticamente significativa


¿Qué es una regresión lineal?




 Para entender el significado de regresión lineal debemos tener en cuenta dos conceptos importantes:

  • Función: es una expresión matemática determinística porque ya está dado.
  • Regresión: también es una expresión matemática determinística, lo que le diferencia de la función es que aquí se agrega un componente aleatorio.

En estadística la regresión lineal es un modelo matemático usado para aproximar la relación de dependencia entre una variable dependiente "y", las variables independientes "x"

  • y= f(x) es una función
  • y= bo   + b1 x2 + error es una regresión lineal. Donde:
                 bo   + b1 x2   es el componente determinístico.
                 Mientras que el error es el componente aleatorio. 

Las variables betas definen el impacto que tiene una variable respecto a otra, por ejemplo, si queremos medir cuanto aumenta la presión a medida que aumenta la temperatura debemos de estimar el parámetro beta.

¿Cómo estimamos beta?

Para estimar beta debemos recolectar un conjunto de datos diferentes, estos datos nos darán una idea de la relación que hay entre las dos variables. Esa relación vendría a ser la función, usualmente es una línea recta con una pendiente. Esta recta será nuestra guía estimada para diferir los márgenes de error.

Una vez obtenida la relación estimada de las variables, observamos como difieren los datos verdaderos de esta relación, en cada dato vamos a observar un error. Lo que esperamos es que nuestra relación estimada sea similar a nuestra relación observada, ya que la finalidad es que en promedio se cancelen los errores.

  • Que los errores se cancelen se expresa como que la esperanza matemática de los errores sea igual a 0.
  • Mientras mas grande el error entonces la estimación no fue tan buena.
  • Mientras menos sea el error nuestra estimación será mejor. 

¿Qué significa p-valor?

Es una medida que nos dice cuán probable es obtener los resultados observados (o más extremos), si la hipótesis nula fuera cierta.

El p-valor nos dice si hay evidencia estadística suficiente para rechazar esa hipótesis.



















Comentarios

Entradas populares