preloder
aumentar disminuir

¿QUÉ HACEMOS?

Intro a Python + Manejo de Datos

Del 9 de enero al 4 de febrero

martes y jueves (18 a 21 hrs.)
descargar ver

Introducción

Python es el lenguaje más popular para hacer ciencia de datos. Sus múltiples librerías permiten llevar a cabo todo el proceso de obtención, limpieza, análisis y visualización de datos de una manera muy eficiente. Además, es gratis y muy fácil e intuitivo de aprender.

En este curso vamos a conocer Python y a empezar a programar desde cero en este lenguaje que puede abrir muchas oportunidades en tu carrera. Específicamente aprenderemos a usar las librerías más populares para las tareas de manejo de datos.

Objetivo

El objetivo del curso es aprender a usar Python para el manejo y visualización de datos. Específicamente, los objetivos del curso son aprender a:

  • Hacer operaciones básicas de manejo de bases de datos.
  • Hacer el pre procesamiento y limpieza de variables.
  • Hacer procesamiento básico de texto para su análisis.
  • Realizar operaciones básicas de manejo de datos geoespaciales.

 

Dirigido a

Cualquier profesional interesado en ciencia de datos.

Conocimientos previos

Preferiblemente con experiencia en análisis de datos y algún software para manejo de bases de datos (R, Stata, Excel, etc).

Temario

1.      Introducción básica a Python:

En esta sesión veremos lo fundamental para empezar a programar en Python desde cero.

  • ¿Qué es?
  • ¿qué se puede hacer en Python?
  • Ejemplos de aplicaciones
  • Cómo instalar Python y sus paquetes
  • Jupyter notebooks
  • Tipos de datos: str, int, float
  • Funciones built-in básicas: print(), type(), len(), range(),
    • Estructuras de datos en Python: Tuplas, Listas, Diccionarios, Conjuntos, Arrays, DataFrames

 

2.      Introducción intermedia a Python:

En esta sesión seguiremos aprendiendo a programar en Python utilizando las estructuras de control -que nos permiten automatizar y controlar procesos repetitivos- y también veremos cómo crear nuestras propias funciones y comandos.

  • Estructuras de control en Python: for, while, if, else, elif, whit
  • Listas y diccionarios por comprensión
  • Funciones
  • Clases y métodos

 

3.      Manejo de datos en Pandas I

Pandas es la librería más popular de Python para el manejo datos. Es sencilla y muy completa. En esta sesión aprenderemos desde cómo leer los archivos con datos, pasando por cómo crear y transformar variables, reestructurar la base de datos, resumir la información y finalmente exportar a otros formatos los datos.

  • DataFrames y Series
  • Leer datos de diferentes fuentes (csv, Excel, stata, spss, internet)
  • Filtro de variables y valores
  • Consultas
  • Crear variables
  • Renombrar variables
  • Reemplazar valores
  • Reestructurar (pivot, melt)
  • Transformación de variables
  • Resumir información (summary)
  • Exportar los datos.

4.      Manejo de datos en Pandas II

En esta sesión veremos algunas funcionalidades más avanzadas de Pandas.

  • Unir bases de datos.
  • Agrupar y agregar datos
  • Multindex
  • Missing Values
  • Duplicados
  • Aplicar funciones
  • Variables categóricas

5.      Manejo de texto

En esta sesión aprenderemos los fundamentos del procesamiento de texto para su análisis. Veremos cómo pre procesar y limpiar el texto, cómo usar expresiones regulares y algunos análisis básicos de analítica de texto.

  • Funciones built-in de los strings
  • Expresiones regulares
  • Métodos para variables string en Pandas
  • Conteo de frecuencias
  • Variables categóricas

6.      Manejo de fechas y series de tiempo

Veremos cómo usar funciones especiales para declarar variables temporales

  • Librerías para manejar fechas y tiempo.
  • Métodos y atributos de variables de tiempo en Pandas.

7.      Manejo de datos espaciales con GeoPandas

GeoPandas hace muy fácil el manejo y la visualización de datos geográficos. En esta sesión aprenderemos cómo usar la información geográfica para enriquecer el análisis de datos.

  • Instalación
  • Estructuras de datos de GeoPandas
  • Lectura de datos espaciales
  • Operaciones geométricas
  • Uniones de bases datos
  • Uniones espaciales

Bibliografía

 

  1. McKinney, W. (2012). Python for data analysis: Data wrangling with Pandas, NumPy, and IPython. ” O’Reilly Media, Inc.”.
  2. Automate the Boring Stuff with Python. Libro en línea disponible en: https://automatetheboringstuff.com/

 

Profesor

Juan Javier Santos Ochoa

 

Sede: Instituto Mora

 

Sala: por definir (PlazaPoussin)

 

Para inscribirte:

  1. Realiza un pago de $6,500.00.
  2. Descarga y envía este formato de inscripción https://tinyurl.com/snprnj5
  3. Envía foto o scanner del depósito, INE y formato de inscripción a garcía@cide.edu
  4. Posteriormente recibirás una confirmación vía correo electrónico.

 

¡Inscríbete antes del 16 de diciembre de 2019 y obtén un 15% de descuento!

Pregunta por las becas a comunidad CIDE

SUBIR
COMENTARIOS.png