Libro

Analytics y Big Data:
Ciencia de los Datos aplicada al mundo de los negocios

Lanzamiento – Abril 2022

Analytics y Big Data: Ciencia de los Datos aplicada al mundo de los negocios

Es la primera guía en español que estudia las competencias claves para crear valor en base a datos de empresas. Este libro no solo presenta una perspectiva general de las técnicas y aplicaciones asociadas a la analítica de negocios, sino que también incluye laboratorios y tutoriales paso a paso para la implementación de estas herramientas. Los códigos se desarrollan en Python, que es hoy en día la principal plataforma gratuita para la construcción de modelos analíticos.

Autores: Autores Sebastián Maldonado y Carla Vairetti

ISBN: 978-84-18982-63-7

Idioma: Español.

Páginas: 404 páginas

Ver muestra
(PDF)

Dirigido a

 

Este libro se encuentra dirigido a analistas o consultores que deseen profundizar en técnicas avanzadas de analítica de negocios. A su vez, puede resultar muy interesante para estadísticos e ingenieros con conocimientos previos en técnicas analíticas que deseen aprender cómo éstas son útiles en el mundo de los negocios. En otras palabras, este libro combina de forma óptima la teoría con ejemplos aplicados y la experiencia de los autores.
Si bien este libro puede parecer avanzado, no requiere conocimientos previos más que experiencia básica de análisis de datos y herramientas computacionales. Además, su diseño amigable y a color facilita enormemente el aprendizaje.

Contenidos

 

Los autores ofrecen cobertura esencial a los principales temas actuales:

 

    • Big Data (Hadoop, Spark, MapReduce y otros)
    • Aprendizaje de Máquinas y Redes Neuronales
    • Aprendizaje profundo (deep learning)
    • Perfilamiento de Clientes y Marketing basado en datos
    • Financial Analytics y modelación predictiva de riesgo
    • Reconocimiento de patrones en datos avanzados (textos e imágenes).

Prefacio

Las empresas enfrentan importantes desafíos para monetizar su información. El fenómeno mundial del Big Data, caracterizado por un aumento sin precedentes en la cantidad de información dis­ponible, que estima alcanzar unos 17 5 zettabytes en 2025 (Reinsel, Gantz & Rydning, 2018), viene acompañado con un mayor nivel de complejidad debido a las diferentes fuentes de información, tales como sensores de dispositivos móviles, imágenes, texto, etcétera. El mundo de los negocios no ha estado ajeno a esta tendencia, siendo las empresas las principales beneficiadas gracias a las nuevas oportunidades que ofrece la analítica de negocios (business analytics) en la toma de decisiones. Una muestra de la relevancia que tiene la analítica de negocios es el estudio de la consultora McKinsey que plantea que «aquellas organizaciones que adoptan analítica de ne­gocios como cultura tienen 23 veces más probabilidades de adquirir clientes, seis veces más probabilidades de retener a esos clientes y 19 veces más probabilidades de ser rentables» (Bokman et al., 2018).

Este libro tiene por foco enseñar técnicas analíticas mediante ejemplos aplicados a negocios. La teoría se presenta en capítulos destacados en azul, que buscan entregar al profesional de negocios una caja de herramientas lo suficientemente amplia como para cubrir el espectro de desafíos de la analítica de negocios. Este libro se dife­rencia de otros sobre Big Data empresarial que solo buscan contar historias interesantes y atractivas para motivar, convenciendo sobre la necesidad de estudiarla. A la vez, se diferencia de aquellos libros que presentan métodos y teoría de forma genérica y con un elevado tecnicismo. Nuestro libro se encuentra en un lugar intermedio, pues está escrito de forma concisa y solo incluye aquellas fórmulas que son imprescindibles para la comprensión de las técnicas. (…)

Ver muestra
(PDF)

Laboratorios

 

En este sitio se encuentran disponibles los cuatro laboratorios de Python presentados en el libro «Analytics y Big Data: Ciencia de los Datos aplicada al mundo de los negocios». Los laboratorios están disponibles para ser ejecutados en un navegador web mediante Google Colab. Es importante notar que algunos códigos pueden diferir con la versión del libro ya que las librerías de Python van evolucionando.

Es nuestra intención mantener los códigos funcionales, por lo que por favor contactarnos si encuentran un error.

INSTRUCCIONES

  • Para la correcta ejecución de los Laboratorios es imprescindible tener una cuenta de Google. Si no tienes, debes crearte una antes de seguir.
  • La aplicación se ejecuta a través de Google Drive, por lo que requiere conocimientos muy básicos de esta aplicación. Para ello recomendamos comenzar con el tutorial de google colab en https://colab.research.google.com/, y ver el video introductorio que se incluye en ese link.
  • Hacer click en el link del Laboratorio 1 y usar «abrir en google colaboratory».
  • En vez de trabajar directamente en el archivo del Laboratorio (01 Laboratorio pre-procesamiento Libro.ipynb), iremos a Archivo -> Guardar una copia en Drive. Esto generará un archivo Copia de 01 Laboratorio pre-procesamiento Libro.ipynb en la carpeta /My Drive/Colab Notebooks/ (o «Mi Unidad», dependiendo del idioma).
  • Importante: si tienes varias cuentas de Google abiertas, el archivo se creará en la primera de ellas. Es importante identificar bien la cuenta en la cual trabajarás para evitar confusiones posteriores.
  • Ahora debes ir a tu Google Drive y subir el archivo creditSIM.xlsx a la carpeta /My Drive/Colab Notebooks/. Esto debes hacerlo antes de ejecutar los códigos. En esa misma carpeta debería estar el archivo Copia de 01 Laboratorio pre-procesamiento Libro.ipynb. Si no lo encuentras, es porque quedó en otra de tus cuentas de Google.
  • Ahora estamos listos para correr los códigos. Vuelve a tu navegador y ya puedes ir ejecutando línea por línea. Importante:

* Los Laboratorios comienzan con !pip -q install, que realizan la instalación de las librerías de Python que utilizaremos. Esto se debe ejecutar la primera vez que se corre un código, y no es necesario volver a correrlo. El segundo bloque de código contiene los imports, que llaman a las librerías para su uso. Este bloque si debe ejecutarse cada vez que se abre un Laboratorio.

* El tercer bloque de código corresponde a montar el sistema para que reconozca los datos en Excel. Una vez que ejecuten la línea, deben hacer click en el link que se genera, identificar la cuenta de Google correcta, autorizar y ver que aparezca el ticket verde en la pestaña de códigos.

Acerca de los autores

Carla Vairetti

Carla Vairetti es Profesora Asociada de la Facultad de Ingeniería y Ciencias Aplicadas, Universidad de los Andes, Chile. Es Ingeniera Civil en Computación, Doctora en Informática y Telecomunicaciones de la Universidad de Trento, Italia, y Doctora en Ciencias de la Ingeniería de la Pontificia Universidad Católica de Chile. Es directora y profesora del Diplomado en Business Analytics & Data Science (UAndes) y miembro del Grupo de Evaluación Interdisciplinario y Transdisciplinario de ANID (Agencia Nacional de Investigación), encargada de entregar los principales fondos de investigación públicos en Chile.

LÍNEAS DE INVESTIGACIÓN

Clasificación en ambientes de Big Data
Clasificación Desbalanceada
Máquinas de Soporte Vectorial
Analítica Textual
Medidas de Utilidad para Clasificación
Clasificación Causal
IA aplicada a seguridad pública
AI aplicada a juridicción

Sebastián Maldonado

Sebastián Maldonado es Profesor Titular del Departamento de Control de Gestión y Sistemas de Información, Universidad de Chile. Es Ingeniero Civil Industrial y Doctor en Sistemas de Ingeniería de la Universidad de Chile. Se destaca por ser autor de más de 70 publicaciones indexadas en el área de Analytics, además de contar con importantes proyectos de investigación y presidir importantes sociedades científicas. Sebastián Maldonado tiene más de diez años de experiencia en proyectos de consultoría en ciencia de los datos, principalmente en los sectores de Banca y Telecomunicaciones.

LÍNEAS DE INVESTIGACIÓN

Clasificación en ambientes de Big Data
Clasificación Desbalanceada
Máquinas de Soporte Vectorial
Analítica Textual
Medidas de Utilidad para Clasificación
Clasificación Causal
IA aplicada a seguridad pública
AI aplicada a medicina