Ir al contenido principal

Diagrama de temas

    • Identificación de Valores Faltantes

      Identificación de valores faltantes

      En un conjunto relacional de datos, los datos que faltan, también llamados datos nulos, normalmente se refieren a cualquier valor de datos que no exista para una intersección determinada entre una fila y una columna. Por ejemplo:

      ID del estudiante Apellido Nombre Resultado de la prueba
      0001 Ferard Catherine 98.5
      0002 Murphy Jeremy
      0003 Haverson Maria 75.5

      Falta el resultado de la prueba de Jeremy Murphy en el conjunto de datos. Si tuviera que intentar tomar la media de Test Score, puede producir un error debido a ese valor faltante. Cada herramienta de análisis de datos y de lenguaje de programación controla los valores faltantes de manera diferente, pero muchos de ellos al menos le indicarán que faltan valores y dónde se produce la faltante. Sin embargo, tenga en cuenta que algunos valores considerados "faltantes" en realidad se completarán y no será tan fácil detectarlos. Si hubiera un signo de interrogación en la celda de puntuación de la prueba de Jeremy Murphy en lugar de estar completamente vacía, entonces tendría que buscar específicamente signos de interrogación en lugar de valores sin completar. Por lo tanto, debe prestar atención a cómo las fuentes de datos indican que faltan datos, ya que pueden hacerlo de maneras inusuales o no estándares.

      Nota: Las filas y columnas enteras que faltan no se pueden identificar fácilmente mediante una herramienta automatizada y, en su lugar, requieren más análisis e investigación.