Course: Analizando datos del censo con pandas
Feb 14, 2021Details
- Date: 2021-02-15
- Place: Gumroad!
- Event Website: gum.co/tdd-censo
Description
Aprende a leer, transformar y analizar tus datos, a trabajar con datos ponderados y a desarrollar un flujo de trabajo de análisis de datos reproducible para proyectos futuros.
Este curso es una aplicación práctica de python “en el mundo real”. Analizaremos datos de más de 15 países latinoaméricanos para extraer 3 cifras: la tasa de alfabetización, de empleo y de escolarización, por edad, por sexo, por área geográfica.
En el proceso, vas a aprender a organizar tu proyecto - de archivos y carpetas a las bibliotecas que utilizas - para que sea transparente, reproducible y eficiente.
En este curso vas a:
- Trabajar con archivos de datos de comprimidos.
- Aprender a producir estadísticas descriptivas de tus datos.
- Aprender a eliminar columnas.
- Aprender a eliminar filas (indexación booleana).
- Trabajar con datos categóricos.
- Trabajar con datos ponderados.
- Usar herramientas de la biblioteca estándard de python (como pathlib para que tu código sea más reproducible en todas las plataformas).
- Desarrollar un flujo de trabajo de preparación de datos reproducible para proyectos futuros.
- Combinar conjuntos de datos.
- Aprender sobre .groupby()
- Aprender sobre las secciones transversales .xs()
- Aprender sobre tablas pivote (pivot_table) y tablas cruzadas (crosstabs)
- Desarrollar un flujo de trabajo de análisis de datos reproducible para proyectos futuros.
- Aprender a integrar otras bibliotecas del ecosistema para manejar datos de python (como sidetable y pyjanitor) para facilitar tu flujo de trabajo.
Contact
Project owners:
- Sergio Sánchez Zavala (https://github.com/chekos)
Licence
GNU General Public License v3.0
# pandas # jupyter # python # tutorial # course