Métodos de Big Data para Ciencias Sociales y Políticas Públicas


Presentación

El Centro de Estadística e Informática Aplicada (CEIA) de la FLACSO Argentina ofrece cursos de iniciación y de actualización, entre ellos el curso Métodos de Big Data para Ciencias Sociales y Políticas Públicas.

Dirección y cuerpo docente

Coordinador: Joon Hee Bang.
Comité Ejecutivo CEIA: Luis Acosta, Natalia Apel, Joon Hee Bang, María Ferraro, Mirta Judengloben.
Docente: Luciano Casiraghi.

La Ciencia de Datos va expandiendo su contribución a las ciencias sociales y a las políticas públicas. Si bien hay muchas preguntas prácticas, técnicas y éticas asociadas con esta tendencia, este curso se centra en la aplicación práctica de los métodos, herramientas, técnicas y habilidades de la Ciencia de Datos, aplicados al campo de las ciencias sociales y las políticas públicas.

Los participantes del curso podrán incorporar conocimientos sobre: cómo obtener, trabajar, desarrollar y transformar nuevas fuentes de datos (como sensores móviles; datos de ubicación y comportamiento; redes sociales; mapas satelitales; minería de textos, entre otros); cómo construir nuevos modelos de análisis incluyendo y estructurando no sólo nuevas fuentes de datos, sino también algoritmos; cómo integrar los métodos y técnicas tradicionales y aplicarlos al desarrollo de modelos de aprendizaje automático.

El público objetivo de este curso será diverso, lo que permitirá el surgimiento de preguntas interesantes y estrategias compartidas como ser los desafíos de la recopilación y análisis que involucran conjuntos de datos grandes y “nuevos”; almacenamiento, acceso y publicación de grandes conjuntos de datos; generación de nuevas hipótesis y nuevas formas de datos; nuevas habilidades que se requieren de los investigadores para crear nuevos conocimientos y aplicaciones con ciencia de datos y participación con los responsables políticos.

Las preguntas de investigación que se pueden abordar a partir de la aplicación de métodos, técnicas, herramientas y habilidades de Ciencia de Datos, demuestran la gran variedad de desafíos que se pueden plantear tanto en investigación como en políticas públicas: ¿La policía en la calle hace una diferencia? ¿Se pueden usar los datos de envío para detectar la piratería y las importaciones de drogas ilegales? ¿Se puede identificar el robo de energía en los países en desarrollo? ¿Podemos inferir cambios en el estado de ánimo a partir de la forma en que las personas se mueven? ¿La tecnología en el lugar de trabajo significará el fin del trabajo? ¿Cuáles son los niveles de corrupción en la contratación pública? ¿Se pueden pronosticar usos y costumbres socioculturales? ¿Cuánto será el nivel de gasto de una política pública determinando posibles escenarios de sensibilidad? ¿Es posible encontrar un punto georreferenciado óptimo para un servicio público?

Los datos a menudo están fragmentados, por lo que los investigadores pasan tiempo tratando de localizar y acceder a diversos conjuntos de datos. Los grandes volúmenes de datos a menudo son datos ricos, que ofrecen puntos refinados y observaciones de alta calidad que abarcan diferentes niveles de análisis, por ejemplo, pasando de lo individual a lo colectivo. Los datos requieren traducción – entre idiomas, y también entre disciplinas. Es posible que falten datos que causen preocupación para los investigadores, o “puntos ciegos” en los datos donde se ignoran fuentes significativas en la investigación porque no están representados en los conjuntos de datos. Y los investigadores de las ciencias sociales que se conectan con la política pública y la toma de decisiones son conscientes del problema de que medir no es un acto pasivo.  En este sentido, la Ciencia de Datos permite encarar todos estos desafíos para los investigadores de ciencias sociales y los funcionarios públicos, no solo por el tamaño de los conjuntos de datos que se generan, sino también en la naturaleza cambiante de los datos y su capacidad de respuesta que ofrece poder contar con resultados en tiempo real. Todo esto sin restar importancia a que la aplicación de la Ciencia de Datos, también puede representar desafíos éticos y prácticos significativos, entre los que destaca el creciente predominio de la política basada en datos y el efecto de la medición sobre el comportamiento en la esfera pública.


Objetivos

Partiendo del concepto general de Ciencia de Datos, su evolución y alternativas, se buscará:

  • Conocer el estado del arte de la Ciencia de Datos en las Ciencias Sociales y en las Políticas Públicas.
  • Entender los diferentes abordajes, ejes temáticos y capacidad para la generación y/o captación de información en Ciencias Sociales y Políticas Públicas
  • Dar a conocer las herramientas existentes y aplicarlas en casos prácticos.
  • Desarrollar habilidades para aplicar tecnologías como Python aplicadas al análisis de casos prácticos.

Contenidos

Contenidos por unidad

Unidad 1: El concepto de Ciencia de Datos: antecedentes y actualidad.

  • Evolución histórica del concepto.
  • Diferencias entre los diferentes conceptos de Data Mining, Business Intelligence, Data Lake, Big Data.
  • Debates actuales.
  • Introducción de la utilización de la Ciencia de Datos en las Ciencias Sociales


Unidad 2: Ejes Temáticos

  • Gente y lugar – Ubicación y datos geoespaciales
  • Las redes sociales en las ciencias sociales y políticas
  • Datos Abiertos, Datos Públicos. Enlace, búsqueda y análisis


Unidad 3: Nuevas herramientas y métodos a partir de Ciencia de Datos. La importancia del modelado de datos

  • Introducción al modelado de datos y programación
  • Cómo y dónde encontrar DATA
  • Herramientas básicas para explotar DATA
  • Software y Herramientas Analíticas
  • Introduciendo R, Python, Power BI y otras herramientas.


Unidad 4: Aplicación a Casos de Estudio

  • Salud
  • Cambio Climático
  • Género
  • Otros

Bibliografía

Autor Título Editorial Año
Becerra, Gastón Big data como objeto de estudio y método para la investigación empírica en sociología y psicología social STS,  Simposio Argentino sobre Tecnología y Sociedad 2018
Birkin, Mark Big Data for Social Science Research Ubiquity Symposium 2018
Del Tell Escolar, Luis Límite(s) de los estudios Big Data Universidad Complutense de Madrid 2016
Downey, Allen Think Python – How to Think Like a Computer Scientist Green Tea Press Needham, Massachusetts 2012
Fazekas, Mihaly The Use of ‘Big Data’ for Social Sciences Research: An Application to Corruption Research University of Cambridge and Corruption Research Center Budapest 2014
Gutierrez-Puebla, Javier Big (Geo)Data en Ciencias Sociales: Retos y Oportunidades Revista de Estudios Andaluces 2016
Hernández-Leal,  Duque-Méndez, Moreno-Cadavid Big Data: una exploración de  investigaciones, tecnologías y casos de aplicación TecnoLógicas, vol. 20, no. 39, mayo – agosto, 2017 2017
Leek, Jeff TheElementsofData AnalyticStyle Leanpub 2015
Liou, Tao, Lin THE DATA ANALYTICS – handbook DATA ANALYSTS + DATA SCIENTISTS 2018
Paliotta , Achille Pierre NUEVAS PROFESIONES Y TÉCNICAS DE WEB DATA MINING EN ARGENTINA: EL CASO DEL DATA SCIENTIST Revista del Centro de Estudios de Sociología del Trabajo, Nº 1O, pp 97-113 2018
Patil & Mason Data Driven – Creating a Data Culture O`Reilly Media 2015
Patil, Dj Building Data Science Teams O`Reilly Media 2011
Peng, Roger R Programming for Data Science Leanpub 2018
Shashua, Amnon Introduction to Machine Learning School of Computer Science and Engineering The Hebrew University of Jerusalem Jerusalem, Israel 2008
Stanton, Jeffrey Introduction to Data Science Syracuse University 2013
Steele, Julie Understanding the Chief Data Officer O`Reilly Media 2015
Stuetzer, Welker, Egger Computational  Social Science in the  Age of Big Data neue schriften zur online-forschung 2018


CASOS

Autor Título Editorial Año
Faghmous & Kumar A BIG DATA GUIDE TO UNDERSTANDING CLIMATE CHANGE Department of Computer Science and Engineering, The University of Minnesota–Twin Cities 2014
Natsumi S. Shokida La desigualdad de género se puede medir FLACSO 2018
Racine, Valerie Big Data Case Study: Big Data & Conservation Biology Onlineethics.org 2017
Racine, Valerie Big Data & Neuroscience Onlineethics.org 2017
Racine, Valerie Big Data & Public Health Onlineethics.org 2017
Racine, Valerie Big Data & Genetic Privacy: Re-identification of Anonymized Data Onlineethics.org 2017

Cursada

Modalidad virtual sincrónica.
Fecha de inicio: viernes 25 de marzo de 2022
Día y hora: viernes de 15.30 a 18.30
Cantidad de clases: 10 (29 hs).

Modalidad de cursada y carga horaria
El curso se encuentra organizado en base a una modalidad teórico-práctica.
Para la consideración de temas conceptuales/teóricos, se adoptará la modalidad de organizar discusiones conceptuales sobre la base de la lectura previa de textos seleccionados.
En el abordaje de los temas prácticos se desarrollarán las herramientas metodológicas y de producción de información específica.

Modalidad de evaluación
La evaluación final consistirá en un trabajo final integrador individual a ser realizado en el hogar. En esta instancia se evaluará tanto la lectura y comprensión de la bibliografía obligatoria como así también las capacidades de aplicación de los contenidos, herramientas y metodologías del curso.

Certificación otorgada
Se otorgará un certificado de asistencia y aprobación del curso una vez aprobada la evaluación del trabajo final. Se prevé un certificado de asistencia para aquellos que cumplan el requisito del 75% de asistencia y que aprueben la evaluación.


Inscripción

INSCRIPCIÓN CERRADA

Los alumnos se considerarán inscriptos en el curso sólo cuando hayan cumplido los siguientes requisitos antes de la fecha de cierre de inscripción:

  • Completar en línea el formulario de preinscripción.
  • Entregar fotocopia del DNI (1º y 2º hoja)
  • Abonar cuota

Aranceles

Residentes en Argentina:

  1. Curso completo: $ 19.800.
  2. Pago único, 10 % desc: $ 17.820
  3. Pago en cuotas:
    – Matrícula + 1 cuota de $ 7.920.
    – Cuota 2: $5.940
    – Cuota 3: $5.940


Residentes en el exterior:

  1. Curso completo: U$S 435.
  2. Pago único, 10 % desc: U$S 391.10.
  3. Pago en cuotas:
    – Matrícula + 1 cuota de U$S 174
    – Cuota 2: U$S 130.50.
    – Cuota 3: U$S 130.5


Ver modalidades de pago https://www.flacso.org.ar/pagos


Informes

FLACSO Argentina
Tucumán 1966, CABA, Argentina.

Centro de Estadística e Informática Aplicada
Asistente técnica: Marcela López.
Teléfono: (54-11) 5238-9300 interno 475.
Horario de atención: lunes, miércoles y viernes de 15:30 a 19:30 hs.
E-mail: ceia@flacso.org.ar
Atención por Whatsapp: +54 9 11-3258-2856.