Want to create interactive content? It’s easy in Genially!

Get started free

Machine Learning - s4.1

CSTI

Created on October 8, 2024

Start designing with a free template

Discover more than 1500 professional designs like these:

Geniaflix Presentation

Vintage Mosaic Presentation

Shadow Presentation

Newspaper Presentation

Zen Presentation

Audio tutorial

Pechakucha Presentation

Transcript

7. Ética y Consideraciones en el Machine Learning

7.1 Sesgo y Equidad en los Modelos

Sesgo en Machine Learning

El sesgo en Machine Learning se refiere a la tendencia de un modelo a favorecer ciertos resultados o grupos en detrimento de otros debido a las características inherentes de los datos o del propio algoritmo. Este sesgo puede surgir de diversas fuentes, incluyendo datos de entrenamiento desequilibrados, características del modelo, o incluso las decisiones tomadas durante la fase de preprocesamiento de datos.

Tipos de Sesgo

Sesgo de Selección

+ Info

Sesgo de Medición

+ Info

Sesgo de Confirmación

+ Info

Equidad en los Modelos

Algunas estrategias para promover la equidad incluyen:

Auditoría de Datos

La equidad en Machine Learning busca asegurar que los modelos sean justos y no discriminatorios. Para evaluar la equidad, se utilizan métricas y técnicas para verificar que el rendimiento del modelo sea consistente a través de diferentes subgrupos de datos.

+ Info

Técnicas de Rebalanceo

+ Info

Modelos Explicativos

+ Info

7.2 Privacidad y Seguridad de los Datos

Privacidad de los Datos

La privacidad de los datos en Machine Learning se centra en proteger la información personal y sensible de los usuarios durante la recolección, almacenamiento y procesamiento.

Las prácticas para asegurar la privacidad incluyen:

Consentimiento Informado

Anonimización de Datos

Cifrado de Datos

Asegurar que los usuarios otorguen su consentimiento explícito para la recolección y uso de sus datos, informándoles de manera clara y comprensible.

Si vas a presentar en directo, te recomendamos que entrenes tu voz y ensayes: ¡la mejor improvisación siempre es la más trabajada!.

Eliminar o modificar datos personales para que no se pueda identificar a los individuos a partir de los datos.

Las estrategias para asegurar la seguridad de los datos incluyen:

Controles de Acceso

Seguridad de los Datos

+ Info

Monitorización y Auditoría

La seguridad de los datos en Machine Learning abarca medidas para proteger los datos contra accesos no autorizados, alteraciones o pérdidas.

+ Info

Resiliencia ante Ataques

+ Info

Las prácticas para asegurar la responsabilidad incluyen:

7.3 Responsabilidad y Transparencia en el Desarrollo de Modelos

Documentación Completa

+ Info

Responsabilidad en Machine Learning

Revisión por Pares

La responsabilidad en el desarrollo de modelos de Machine Learning implica la rendición de cuentas de los resultados del modelo y sus implicaciones.

+ Info

Mecanismos de Retroalimentación

+ Info

Transparencia en Machine Learning

La transparencia se refiere a la claridad con la que se comunica el funcionamiento del modelo y sus decisiones.

Las prácticas para promover la transparencia incluyen:

Modelos Interpretables

Comunicación Abierta

Informes Públicos

+ Info

+ Info

+ Info

Sesgo de Confirmación

Es el sesgo introducido por las expectativas o creencias del analista o del equipo de desarrollo del modelo, que puede llevar a interpretar los datos de manera que confirme esas expectativas, ignorando información que podría contradecirlas.

Sesgo de Selección

Ocurre cuando los datos de entrenamiento no son representativos del dominio general del problema. Por ejemplo, si un modelo de reconocimiento facial se entrena principalmente con imágenes de personas de una etnicidad específica, puede tener un rendimiento deficiente en personas de otras etnicidades.

Sesgo de Medición

Surge cuando las herramientas o métodos utilizados para recolectar datos introducen errores sistemáticos. Por ejemplo, los sensores defectuosos o los cuestionarios mal diseñados pueden causar sesgos en los datos.

Auditoría de Datos:

Realizar un análisis exhaustivo de los datos para identificar y mitigar cualquier sesgo antes de entrenar el modelo.

Técnicas de Rebalanceo

Aplicar métodos como el sobre-muestreo o el sub-muestreo para abordar los desequilibrios en los datos.

Modelos Explicativos:

Utilizar modelos interpretables para entender cómo las decisiones del modelo se ven influenciadas por diferentes características.

Controles de Acceso

Implementar sistemas que restrinjan el acceso a los datos solo a los usuarios y sistemas autorizados.

Resiliencia ante Ataques

Aplicar técnicas de protección contra ataques como inyecciones de datos maliciosos o adversariales que puedan comprometer la integridad del modelo.

Monitorización y Auditoría

Establecer mecanismos para supervisar el acceso y uso de los datos, detectando y respondiendo a cualquier actividad sospechosa.

Documentación Completa

Mantener un registro detallado de los procesos de desarrollo del modelo, decisiones tomadas, y cambios realizados en el mismo.

Mecanismos de Retroalimentación

Establecer canales para que los usuarios y partes interesadas puedan reportar problemas o preocupaciones sobre el rendimiento del modelo.

Revisión por Pares

Realizar revisiones externas e internas del modelo para asegurar que se hayan seguido las mejores prácticas y para identificar posibles problemas éticos.

Modelos Interpretables

Utilizar modelos y técnicas que proporcionen explicaciones claras sobre cómo se toman las decisiones, como los modelos de árboles de decisión o los métodos de importancia de características.

Informes Públicos

Publicar informes y documentación accesibles que describan el funcionamiento del modelo, los datos utilizados, y las metodologías aplicadas.

Comunicación Abierta

Facilitar el acceso a información sobre el modelo a las partes interesadas, incluyendo explicaciones sobre los resultados y cómo pueden ser interpretados.