Want to create interactive content? It’s easy in Genially!
Machine Learning - s4.1
CSTI
Created on October 8, 2024
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Geniaflix Presentation
View
Vintage Mosaic Presentation
View
Shadow Presentation
View
Newspaper Presentation
View
Zen Presentation
View
Audio tutorial
View
Pechakucha Presentation
Transcript
7. Ética y Consideraciones en el Machine Learning
7.1 Sesgo y Equidad en los Modelos
Sesgo en Machine Learning
El sesgo en Machine Learning se refiere a la tendencia de un modelo a favorecer ciertos resultados o grupos en detrimento de otros debido a las características inherentes de los datos o del propio algoritmo. Este sesgo puede surgir de diversas fuentes, incluyendo datos de entrenamiento desequilibrados, características del modelo, o incluso las decisiones tomadas durante la fase de preprocesamiento de datos.
Tipos de Sesgo
Sesgo de Selección
+ Info
Sesgo de Medición
+ Info
Sesgo de Confirmación
+ Info
Equidad en los Modelos
Algunas estrategias para promover la equidad incluyen:
Auditoría de Datos
La equidad en Machine Learning busca asegurar que los modelos sean justos y no discriminatorios. Para evaluar la equidad, se utilizan métricas y técnicas para verificar que el rendimiento del modelo sea consistente a través de diferentes subgrupos de datos.
+ Info
Técnicas de Rebalanceo
+ Info
Modelos Explicativos
+ Info
7.2 Privacidad y Seguridad de los Datos
Privacidad de los Datos
La privacidad de los datos en Machine Learning se centra en proteger la información personal y sensible de los usuarios durante la recolección, almacenamiento y procesamiento.
Las prácticas para asegurar la privacidad incluyen:
Consentimiento Informado
Anonimización de Datos
Cifrado de Datos
Asegurar que los usuarios otorguen su consentimiento explícito para la recolección y uso de sus datos, informándoles de manera clara y comprensible.
Si vas a presentar en directo, te recomendamos que entrenes tu voz y ensayes: ¡la mejor improvisación siempre es la más trabajada!.
Eliminar o modificar datos personales para que no se pueda identificar a los individuos a partir de los datos.
Las estrategias para asegurar la seguridad de los datos incluyen:
Controles de Acceso
Seguridad de los Datos
+ Info
Monitorización y Auditoría
La seguridad de los datos en Machine Learning abarca medidas para proteger los datos contra accesos no autorizados, alteraciones o pérdidas.
+ Info
Resiliencia ante Ataques
+ Info
Las prácticas para asegurar la responsabilidad incluyen:
7.3 Responsabilidad y Transparencia en el Desarrollo de Modelos
Documentación Completa
+ Info
Responsabilidad en Machine Learning
Revisión por Pares
La responsabilidad en el desarrollo de modelos de Machine Learning implica la rendición de cuentas de los resultados del modelo y sus implicaciones.
+ Info
Mecanismos de Retroalimentación
+ Info
Transparencia en Machine Learning
La transparencia se refiere a la claridad con la que se comunica el funcionamiento del modelo y sus decisiones.
Las prácticas para promover la transparencia incluyen:
Modelos Interpretables
Comunicación Abierta
Informes Públicos
+ Info
+ Info
+ Info
Sesgo de Confirmación
Es el sesgo introducido por las expectativas o creencias del analista o del equipo de desarrollo del modelo, que puede llevar a interpretar los datos de manera que confirme esas expectativas, ignorando información que podría contradecirlas.
Sesgo de Selección
Ocurre cuando los datos de entrenamiento no son representativos del dominio general del problema. Por ejemplo, si un modelo de reconocimiento facial se entrena principalmente con imágenes de personas de una etnicidad específica, puede tener un rendimiento deficiente en personas de otras etnicidades.
Sesgo de Medición
Surge cuando las herramientas o métodos utilizados para recolectar datos introducen errores sistemáticos. Por ejemplo, los sensores defectuosos o los cuestionarios mal diseñados pueden causar sesgos en los datos.
Auditoría de Datos:
Realizar un análisis exhaustivo de los datos para identificar y mitigar cualquier sesgo antes de entrenar el modelo.
Técnicas de Rebalanceo
Aplicar métodos como el sobre-muestreo o el sub-muestreo para abordar los desequilibrios en los datos.
Modelos Explicativos:
Utilizar modelos interpretables para entender cómo las decisiones del modelo se ven influenciadas por diferentes características.
Controles de Acceso
Implementar sistemas que restrinjan el acceso a los datos solo a los usuarios y sistemas autorizados.
Resiliencia ante Ataques
Aplicar técnicas de protección contra ataques como inyecciones de datos maliciosos o adversariales que puedan comprometer la integridad del modelo.
Monitorización y Auditoría
Establecer mecanismos para supervisar el acceso y uso de los datos, detectando y respondiendo a cualquier actividad sospechosa.
Documentación Completa
Mantener un registro detallado de los procesos de desarrollo del modelo, decisiones tomadas, y cambios realizados en el mismo.
Mecanismos de Retroalimentación
Establecer canales para que los usuarios y partes interesadas puedan reportar problemas o preocupaciones sobre el rendimiento del modelo.
Revisión por Pares
Realizar revisiones externas e internas del modelo para asegurar que se hayan seguido las mejores prácticas y para identificar posibles problemas éticos.
Modelos Interpretables
Utilizar modelos y técnicas que proporcionen explicaciones claras sobre cómo se toman las decisiones, como los modelos de árboles de decisión o los métodos de importancia de características.
Informes Públicos
Publicar informes y documentación accesibles que describan el funcionamiento del modelo, los datos utilizados, y las metodologías aplicadas.
Comunicación Abierta
Facilitar el acceso a información sobre el modelo a las partes interesadas, incluyendo explicaciones sobre los resultados y cómo pueden ser interpretados.