EL PROCESO DE ANÁLISIS DE DATOS
- preguntar:
- Definir el problema: observas el estado actual e identificas cómo difiere del estado ideal
- Obstaculo que eliminar o error que corregir
- Definir expectativas de los interesados
- Quienes son los interesados
- Definir el problema: observas el estado actual e identificas cómo difiere del estado ideal
- preparar: recopilan y almacenan datos
- procesar: encuentran y eliminan cualquier error e inexactitud que puedan interferir con los resultados. el propósito es que los detalles sean correctos
- limpieza de los datos
- su conversión a un formato más útil
- combinar dos o más conjuntos de datos para lograr que la información sea más completa
- eliminar los valores atípicos, que son puntos de datos que podrían sesgar la información
- analizar
- compartir
- actuar.
CICLO DE VIDA DE LOS DATOS
- planificar : qué tipo de datos necesita, cómo se gestionarán a lo largo de su ciclo de vida, quién será responsable de ellos y cuáles son los resultados óptimos.
- capturar: se recopilan datos de diversas fuentes y se incorporan en la organización.
- gestionar: cómo cuidamos nuestros datos, cómo y dónde los almacenamos, qué herramientas usamos para protegerlos y mantenerlos seguros, y qué medidas adoptamos para asegurarnos de que se conserven correctamente. Esta fase es muy importante para la limpieza de los datos,
- analizar: los datos se usan para resolver problemas, tomar decisiones importantes y respaldar los objetivos empresariales.
- archivar: almacenar datos en un lugar donde todavía están disponibles, pero es poco probable que se vuelvan a usar.
- destruir.
HOJAS DE CÁLCULO
- Un atributo es una característica o calidad de los datos que se utilizan para etiquetar una columna en una tabla.
- Una fila también se llama observación. Una observación incluye todos los atributos de algo contenido en una fila de una tabla de datos.
- Una fórmula es un conjunto de instrucciones que realiza una acción específica utilizando los datos de una hoja de cálculo.
SQL en acción
Una consulta es una solicitud de datos o información proveniente de una base de datos.
Esta es la estructura de una consulta básica:

- SELECT
- FROM
- WHERE
El poder de los datos en la empresa
Es posible que hayas notado un tema recurrente en todos los ejemplos. Todos tienen inconvenientes que explorar, preguntas que responder o problemas que resolver. Es fácil que estos elementos se mezclen. Aquí hay una manera de aclararlos cuando hablamos de ellos en el análisis de datos.
- Un problema (issue) es un asunto o tema para investigar.
- Una pregunta está diseñada para descubrir información
- Un problema es un obstáculo o complicación que es necesario resolver.
Una tarea empresarial es la pregunta o el problema que el análisis de datos responde para las empresas.
La observación y la intuición son herramientas poderosas para la toma de decisiones, pero solo pueden llevarnos tan lejos cuando tomamos decisiones basadas solo en la observación y en las percepciones viscerales, solo vemos una parte del panorama. Los datos nos ayudan a ver todo el panorama. Con los datos tenemos un panorama completo del problema y sus causas, lo que nos permite encontrar nuevas y sorprendentes soluciones que nunca antes hubiéramos podido ver. El análisis de datos ayuda a las empresas a tomar mejores decisiones. Todo empieza con una tarea empresarial y la pregunta que intenta responder.
Comprender los datos y la equidad
Equidad: significa asegurarse de que tu análisis no introduzca ni refuerce sesgos. En otras palabras, como analista de datos, deseas ayudar a crear sistemas que sean equitativos e inclusivos para todos.