El análisis de datos es el proceso de evaluación de datos utilizando herramientas analíticas y estadísticas para descubrir información útil y ayudar en la toma de decisiones comerciales. Hay varios métodos de análisis de datos que incluyen extracción de datos, análisis de texto, inteligencia comercial y visualización de datos.
¿Cómo se realiza el análisis de datos?
El análisis de datos es parte de un proceso más amplio de obtención de inteligencia empresarial. El proceso incluye uno o más de los siguientes pasos:
- Definición de objetivos: cualquier estudio debe comenzar con un conjunto de objetivos comerciales claramente definidos. Gran parte de las decisiones tomadas en el resto del proceso depende de cuán claramente se hayan establecido los objetivos del estudio.
- Plantear preguntas: se intenta hacer una pregunta en el dominio del problema. Por ejemplo, ¿los autos deportivos rojos se involucran en accidentes más a menudo que otros?
- Recopilación de datos: los datos relevantes para la pregunta deben recopilarse de las fuentes apropiadas. En el ejemplo anterior, los datos pueden recopilarse de una variedad de fuentes que incluyen: informes de accidentes del DMV o de la policía, reclamos de seguros y detalles de hospitalización. Cuando se recopilan datos mediante surverys, se necesita un cuestionario para ser presentado a los sujetos. Las preguntas deben ser modeladas apropiadamente para el método estadístico que se usa.
- Regateo de datos: los datos brutos se pueden recopilar en varios formatos diferentes. Los datos recopilados se deben limpiar y convertir para que las herramientas de análisis de datos puedan importarlo. Para nuestro ejemplo, podemos recibir informes de accidentes del DMV como archivos de texto, reclamos de seguros de una base de datos relacional y detalles de hospitalización como API. El analista de datos debe agregar estas diferentes formas de datos y convertirlos en una forma adecuada para las herramientas de análisis.
- Análisis de datos: este es el paso donde los datos limpios y agregados se importan a las herramientas de análisis. Estas herramientas le permiten explorar los datos, encontrar patrones en él, y preguntar y responder preguntas que suponen. Este es el proceso mediante el cual se toman los datos recopilados en la investigación mediante la aplicación adecuada de métodos estadísticos.
- Dibujar conclusiones y hacer predicciones: este es el paso donde, después de un análisis suficiente, se pueden sacar conclusiones de los datos y se pueden hacer predicciones apropiadas. Estas conclusiones y predicciones se pueden resumir en un informe entregado a los usuarios finales.
Veamos ahora con cierto detalle los métodos de análisis de datos en particular.
Minería de datos
Data mining es un método de análisis de datos para descubrir patrones en grandes conjuntos de datos usando los métodos Cómo convertirse en un científico de datos Cómo convertirse en un científico de datos La ciencia de los datos ha pasado de ser un término nuevo en 2007 a ser uno de los más codiciados disciplinas hoy. Pero, ¿qué hace un científico de datos? ¿Y cómo puedes irrumpir en el campo? Lea más sobre estadísticas, inteligencia artificial, aprendizaje automático y bases de datos. El objetivo es transformar los datos sin procesar en información empresarial comprensible. Estos pueden incluir la identificación de grupos de registros de datos (también conocidos como análisis de conglomerados) o la identificación de anomalías y dependencias entre grupos de datos.
Aplicaciones de minería de datos:
- La detección anomoly puede procesar grandes cantidades de datos ("big data") e identificar automáticamente casos atípicos, posiblemente para la exclusión de la toma de decisiones o la detección de fraudes (por ejemplo, fraude bancario).
- Aprender los hábitos de compra de los clientes. Las técnicas de aprendizaje automático se pueden usar para modelar los hábitos de compra de los clientes y determinar los artículos que se compran con frecuencia.
- La agrupación puede identificar grupos previamente desconocidos dentro de los datos.
- La clasificación se usa para clasificar automáticamente las entradas de datos en contenedores preespecificados. Un ejemplo común es clasificar los mensajes de correo electrónico como "spam" o "no spam" y hacer que el sistema aprenda del usuario.
Text Analytics
El análisis de texto es el proceso de derivar información útil del texto. Se logra procesando información textual no estructurada, extrayendo tiempo de ahorro numérico significativo con operaciones de texto en Excel Ahorrando tiempo con operaciones de texto en Excel Excel puede hacer magia con los números y puede manejar los caracteres igualmente bien. Este manual muestra cómo analizar, convertir, reemplazar y editar texto dentro de hojas de cálculo. Estos conceptos básicos le permitirán realizar transformaciones complejas. Lea más índices de la información y haga que la información esté disponible para algoritmos estadísticos y de aprendizaje automático para su posterior procesamiento.
El proceso de minería de textos incluye uno o más de los siguientes pasos:
- Recopilación de información de diversas fuentes, incluidas la web, el sistema de archivos, la base de datos, etc.
- Análisis lingüístico que incluye el procesamiento del lenguaje natural.
- Reconocimiento de patrones (por ejemplo, reconocimiento de números de teléfono, direcciones de correo electrónico, etc.)
- Extracción de información resumida del texto, como frecuencias relativas de las palabras, determinación de similitudes entre documentos, etc.
Ejemplos de aplicaciones de análisis de texto:
- Analizando las respuestas abiertas de la encuesta. Estas encuestas son de naturaleza exploratoria e incluyen preguntas abiertas relacionadas con el tema en cuestión. Los encuestados pueden expresar sus opiniones sin estar limitados a un formato de respuesta particular.
- Análisis de correos electrónicos, documentos, etc. para filtrar "basura". Esto también incluye la clasificación automática de los mensajes en contenedores predefinidos para el enrutamiento a diferentes departamentos.
- Investigue a los competidores rastreando sus sitios web. Esto podría usarse para derivar información sobre las actividades de los competidores.
- Aplicaciones de seguridad que pueden procesar archivos de registro para la detección de intrusiones.
Inteligencia de Negocio
Inteligencia empresarial Cómo usar Cortana para analizar datos con Power BI Cómo usar Cortana para analizar datos con Power BI ¿Desea simplificar su análisis de datos? Obtén respuestas rápidas de Cortana con esta guía. Leer más transforma los datos en inteligencia procesable para fines comerciales y puede usarse en la toma de decisiones estratégicas y tácticas de una organización. Ofrece una manera para que las personas examinen las tendencias a partir de los datos recopilados y obtengan conocimientos de la misma.
Algunos ejemplos de inteligencia empresarial en el uso actual:
- Decisiones operativas de una organización, como colocación de productos y fijación de precios.
- Identificar nuevos mercados, evaluar la demanda y la idoneidad de los productos para diferentes segmentos del mercado.
- Presupuestación y pronósticos progresivos.
- Uso de herramientas visuales como mapas de calor, tablas pivote y mapeo geográfico.
Visualización de datos
Visualización de datos Visualice datos e información al instante con Google Fusion Tables Visualice datos e información al instante con tablas de Google Fusion Ya sea que prepare un informe para el trabajo o solo quiere representar la información en su blog de una manera gráfica, Google Fusion Tables puede ayuda. Google Fusion es en realidad una característica incorporada en ... Leer más se refiere de manera muy simple a la representación visual de los datos. En el contexto del análisis de datos, significa usar las herramientas de estadísticas, probabilidad, tablas dinámicas y otros artefactos para presentar los datos visualmente. Hace que los datos complejos sean más comprensibles y utilizables.
Se están generando cantidades crecientes de datos por parte de varios sensores en el entorno (denominados "Internet of Things" o "IOT"). Estos datos (conocidos como "Big Data") presentan desafíos para comprender lo que se puede aliviar mediante el uso de herramientas de visualización de datos. La visualización de datos se usa en las siguientes aplicaciones.
- Extracción de datos de resumen de los datos sin procesar de IOT.
- Usar un gráfico de barras para representar el rendimiento de ventas durante varios trimestres.
- Un histograma muestra la distribución de una variable como el ingreso dividiendo el rango en compartimientos.
Análisis de datos en revisión
El análisis de datos se usa para evaluar datos con herramientas estadísticas para descubrir información útil. Una variedad de métodos se utilizan para este fin, incluida la extracción de datos, análisis de texto, inteligencia comercial y visualización de datos.
¿Ha utilizado el análisis de datos en su organización para modelar algo? ¿Cómo fue tu experiencia? ¿Tiene algún conocimiento útil para ofrecer? Por favor háznoslo saber en los comentarios más abajo.