Detección y monitoreo de discurso de odio hacia la comunidad LGBT en Twitter, un acercamiento desde el aprendizaje computacional
Guillermo Gerardo Vazquez Ferrer
Asesora: Mtra. Karime González Zuccolotto
Co Asesor: Dr. Oscar Gerardo Sánchez Siordia
Sinodales: Dr. Gandhi Samuel Hernández Chan Dr. Hugo Carlos Martínez
Fuente: inkdrop/AdobeStock, Tomado de Tran D. (2021).
introducción
- El 40.7% de la población mexicana consideraba que es poco el respeto que existe a los derechos de las personas lesbianas, gays, bisexuales y transexuales
(ENDISEG, 2021).
- Analizar con datos a la comunidad LGBT en México.
- Correlación entre el discurso de odio y actos de violencia.
- Automatización con técnicas de Aprendizaje Computacional.
Fuente: https://www.pinterest.com.mx/pin/260997740893782512/
Diversidad sexo-genérica
Lesbiana: Mujer que se siente atraida sentimental y sexualmente por mujeres
Gay: Hombre que se siente atraido sentimental y sexualmente por hombres
Bisexual: Persona que se siente atraida sentimental y sexualmente por hombres y mujeres
Transexual: Persona que se identifica con el género opuesto al asignado al nacer y opta por una intervención hormonal y/o quirúrgica
Transgénero: Persona que se identifica y expresa con el género opuesto al asignado al nacer
Travesti: Persona que gusta de expresarse de manera transitoria con vestimenta y comportamientos considerados del género opuesto
Fuente: Elaboración propia con información de Prince Torres (2021)
Fuente: Modificado de Killermann (2011).
Medios masivos de comunicación
Discurso de odio contra la comunidad lgbt
- Sociedad mayormente heteronormativa.
- Binarios del género.
Muy probablemente experimentarán momentos o procesos de exclusión, segregación y/o violencia (da Silva Anes, 2021).
estigmas, prejuicios y segregación
- Segregación y discriminación histórica.
- Discursos y prácticas dominantes durantes el siglo XIX y XX (Discurso médico y estatal).
- Creencias sociales de lo aceptado en roles de género.
Fuente: https://savethechildren.org.co/modulo-4-herramientas-para-trabajar-diversidades-sexo-genericas/
Información sobre violencia y discriminación
- Invisibilización de la comunidad LGBT.
- Bases de datos oficiales sobre violencia.
- Recolección de información y generación de estadísticas como herramienta de reconocimiento impulsando el cumplimiento de los derechos de las personas LGBT (Comisión Internacional de los Derechos Humanos, 2018).
Fuente: https://www.gob.mx/911/articulos/que-es-el-911emergencias?idiom=es
CIG
- Datos sobre percepciones.
Fuente: https://www.ign.gob.ar/NuestrasActividades/InformacionGeoespacial/Introduccion
Fuente: Visible (2022)
Homicidios de personas LGBT 2015-2022
Veracruz
Chihuahua
Guerrero
Estado de México
Ciudad de México
95
58
52
38
32
letra ese
- Reportes en medios de prensa.
- Reportes ciudadanos dirigidos a Letra ese
Fuente: Elaboración propia con información de Visible (2022)
Agresiones contra personas Lgbt en el 2022
Ciudad de México
Jalisco
Estado de México
Guanajuato
Veracruz
332
200
188
121
69
visible
- Reportes ciudadanos.
- Trabajo colaborativo.
Fuente: Elaboración propia con información de Letra ese (2022)
Discurso de odio
- ¿Debe existir una incitación a realizar un acto de violencia? (López Ulla, 2018).
- Pretende incentivar la violencia.
- Pretende rechazar, denigrar, intimar, humillar, acosar y estigmatizar.
Fuente: https://www.sociolegalreview.com/post/balancing-away-free-speech-some-thoughts
El discurso de odio es toda expresión que incite a cualquier tipo de violencia y al odio, que menosprecie o denigre, y que promueva estereotipos de una colectividad en específico, incluso en formas sutiles como la ironía o el humor.
Discurso de odio
Intención de ejercer o incentivar
Violencia física
Discriminación
Violencia psicológica
Discursode odio
Discriminación
Conjunto de prácticas y acciones que nieguen el trato igualitario de una persona o grupo de personas, generando desigualdad social o privación de derechos (Solís, 2017).
Fuente: Elaboración propia con información de López de Loera (2019), Solís (2017), Miró Linares (2016) y Arcila, Blanco-Herrero y Valdez (2020).
Redes sociales
Fácil búsqueda y difusión
Gran alcance
Expresiones genuinas
Dificultad de monitoreo
Anonimato
Fuente: httphttps://www.rawpixel.com/image/647031/free-image-rawpixel
Redes sociales, fuente de información
Conjunto de información que carecen de organización, en donde, es necesario realizar un preprocesamiento con ayuda de aprendizaje automático o modelos estadísticos.(María Nancy y Maheswari, 2020).
Fuente: https://www.rawpixel.com/image/394493/free-illustration-vector-social-media-digital
- Rápida difusión
- Interacción entre usuarios
- Deseabilidad social
- Opiniones genuinas
- Twitter
Fuente: https://scionanalytics.com/what-is-unstructured-data/
Datos no estructurados
Aprendizaje computacional
- Proporcionar a las computadoras la capacidad de aprender sin la necesidad de ser programadas directamente.
- Manejo de grandes volúmenes de datos
- Clas ificación de información
- Fuentes de datos no estructurados
- Automatización
Procesamiento de lenguaje natural
Estudia el procesamiento computacional de los lenguajes naturales, es decir, que permite generar una comunicación entre los dispositivos computacionales y los humanos a través de la manipulación e interpretación de distintos idiomas.
- Es necesario utilizar técnicas de aprendizaje computacional.
Fuente: Elaboración propia con información de González K. (2021)
Antecedentes
Antecedentes
¿cuál es la importancia?
- Redes sociales como fuentes de datos no estructurados.
- Las CIG en el análisis de la comunidad LGBT.
- Espacializar información.
- Posible impacto del discurso de odio.
- Posible relación con la prevalencia de discurso de odio y la existencia de actos de violencia o conductas discriminatorias
Fuente: https://charismatics2.weebly.com/crime-vs-speech.html
preguntas guía de investigación
¿Cuál es la importancia de generar bases de datos relacionada al discurso de odio hacia la comunidad LGBT?
01
¿Cuál es el conjunto de palabras en idioma español utilizadas en Twitter que expresan discurso de odio hacia la comunidad LGBT en México ?
02
¿Cómo se distribuye el discurso de odio en Twitter hacia la comunidad LGBT en el territorio mexicano?
03
04
¿En qué estados de México hay mayor presencia de discurso de odio hacia la comunidad LGBT en Twitter?
objetivo general
Zonificar la presencia de discursos de odio en México hacia la comunidad LGBT en Twitter.
objetivos particualares
Explorar y documentar en Twitter las combinaciones de palabras en español utilizadas para referirse a la comunidad LGBT en México desde el discurso de odio.
Generar y estructurar una muestra de datos etiquetados, que permita identificar discurso de odio hacia la comunidad LGBT en Twitter a través de un clasificador.
Entrenar un algoritmo de clasificación usando procesamiento de lenguaje natural para la identificación de tuits asociados a discursos de odio contra la población LGBT.
Analizar la distribución espacio temporal de los tuits identificados como discurso de odio.
metodología
proceso de etiquetado
Una publicación en Twitter fue clasificada como discurso de odio si: • Incita a las personas a cometer actos de violencia hacia la comunidad LGBT o a algún miembro de esta por el hecho de ser parte de esta población. • Si incita a la discriminación hacia la comunidad LGBT o a algún miembro de esta por pertenecer a este grupo poblacional.
• Si expresa o promueve estereotipos de la comunidad LGBT.
• Si utiliza lenguaje vulgar y/o agresivo para insultar a la comunidad LGBT o a algún miembro de esta por el simple hecho de ser parte de esta comunidad.
• Si se refiere a la diversidad sexo-genérica o utiliza categorías de la misma como una forma de insultar o denigrar.
- Si utiliza palabras que coloquialmente son empleadas para referirse a algún grupo de la diversidad sexo-genérica de manera despectiva o denigrante para hablar de una persona o grupo de personas de forma negativa o como forma de insultar o denigrar.
- Si apoyan o enaltecen comportamientos o comunicaciones que han sido reconocidas como agresivas o violentas hacia la comunidad LGBT.
- Si invalida la lucha del movimiento LGBT.
validación del etiquetado
- Evitar un sesgo personal.
- Muestra de validación.
- 8,000 tuits etiquetados.
- Lotes de 500 tuits.
- Cada lote fue validado 2 personas diferentes.
- Verificar concordancia de clasificación.
- Identificar tuits, palabras o expresiones conflictivas.
- Evitar ruido en la clasificación.
diferentes usos de una palabra
- Palabras que históricamente han sido utilizadas de manera despectiva.
- Ofender
- Denigrar
- Estigmatizar
- Resignificación de la palabra.
- Apropiación de palabras negativas.
¿Todo puede ser discurso de odio?
Fuente: Martínez Marlene (2012) https://www.ladobe.com.mx/2012/10/2a-marcha-de-las-putas-puebla/
se consideró odio
- Cuando la palabra negativa se utiliza como un sinónimo de cobarde, tímido o que alguien carece de valor o validez.
- Eres un puto tóxico, y a mí eso me da hueva jajaja.
- No los veo depositando para unas guamas Indio, la light es para putitos
- Cuando se utiliza para referirse a un grupo de personas o institución de manera despectiva.
- Puto Monterrey valen verga
- Chinga tu madre pinche gobierno puto!!
- Si reproduce expresiones o se dirige a una persona con palabras que denigran, estigamatizan o son insultantes
- PUTO EL QUE LO LEA
- Fea, gorda, nerd, dientona, la que hablaba bien cagado (hasta la fecha) y marimacha que jugaba fútbol. Jiji.
conotaciones sexuales
- Twitter alberca una gran cantidad de contenido sexual.
- Palabras que esterotipan a la comunidad LGBT.
- Expresiones denigrantes aún cuando se expresan en primera persona.
- Que rica ensartada de verga le di a este putito.
- Soy tv de closet, 26 años y muy putito. Masaje tántrico 40 min
Reportes sobre discurso de odio
- En mi defensa, esa señora me dijo pinche joto y yo le grité fodonga 🤧
- Pinche señora pendeja me veía con cara de te voy a exterminar maldito homosexual.
Discurso de odio que puede no se expresa de forma evidente
- Existen expresiones que a simple vista podrían no parecer discurso de odio, sin embargo, sin expresiones que estereotipan, de nigran o insultan entre otros a la población LGBT
- Me saca de pedo como la comunidad LGBT se ofende por comentarios simples, damn bro, existe el mame y tú también lo haces. No quiere decir que todos estemos en su contra.
- Las mujeres trans son mujeres TRANS
- De entrada si es Americanista no es tu novio... Es solo una amiga marimacha
no se consideró odio
- Cuando la palabra negativa no se utiliza para referirse a una persona o grupo de personas.
- Pinche puto coraje.
- Que puto estrés.
- Pinche puto perro frío.
- QUE PINCHE PUTO ASCO LA CONTAMINACIÓN EN CDMX!!!
- Cuando se utiliza para enaltecer a una persona.
- Eres un puto CRACK.
- Eres un puto Dios.
- Cuando se utiliza para referirse al COVID-19
- Te Odio puto Coronavirus 😢
Fuente: https://www.linformaldesign.com/shop/producto/eres-el-puto-crack-2/
Reportes sobre violencia o discriminación
- Jueza niega amparo a Colectivo de Yucatán, les pide pruebas de que son personas LGBT
- Mis papás se están burlando de mujeres trans en un programa de televisión, ¿a dónde vamos a parar?
- Hace año y medio, mientras me golpeaba, el agresor decía: te voy a matar pinche puto. Es bien bonito defender esa palabra ojalá, a quien lo hace, se lo digan de la misma forma y sabrá.
Fuente: https://www.zuckermanlaw.com/lgbt-discrimination-lawyers/
rendimiento de los modelos
rendimiento de los modelos
overfiting
Fuente: https://www.section.io/engineering-education/regularization-to-prevent-overfitting/
overfiting
overfiting
Nube de palabras
Tuits identificados como discurso de odio
porcentajes
estados con mayor presencia de DO
estados con mayor presencia de DO
estados con mayor presencia de DO
estados con mayor presencia de DO
Referencias bibliográficas
- Aguilar Pirachicán, M. (2019). El discurso del odio (reseña). Desde el Jardín de Freud, [online] (1657-3986), pp.328–333. doi:10.15446/djf.n19.76731.
- Alain, G. and Bengio, Y. (2014). What Regularized Auto-Encoders Learn from the Data-Generating Distribution. Journal of Machine Learning Research, 15, pp.3743–3773.
- Arcila Calderón, C., Blanco-Herrero, D. and Valdez Apolo, M.B. (2020). Rechazo y discurso de odio en Twitter: análisis de contenido de los tuits sobre migrantes y refugiados en español / Rejection and Hate Speech in Twitter: Content Analysis of Tweets about Migrants and Refugees in Spanish. Revista Española de Investigaciones Sociológicas, [online] (172), pp.21–39. doi:10.5477/cis/reis.172.21.
- Bi, Q., Goodman, K.E., Kaminsky, J. and Lessler, J. (2019). What is Machine Learning? A Primer for the Epidemiologist. American Journal of Epidemiology, 188(12). doi:10.1093/aje/kwz189.
- Blanco Rojas, T., Archila Córdoba, D. and Ballesteros-Ricaurte, J. (2016). Gestión de datos obtenidos desde redes sociales aplicando Business Intelligence Engineering Process. Revista Virtual Universidad Católica del Norte, (0124-5821), pp.72–91.
- Bolaños Enríquez, T. and Charry Morales, A. (2018). PREJUICIOS Y HOMOSEXUALIDAD, EL LARGO CAMINO HACIA LA ADOPCIÓN HOMOPARENTAL. ESPECIAL ATENCIÓN AL CASO COLOMBIANO. Estudios constitucionales, [online] 16(1), pp.395–424. doi:10.4067/s0718-52002018000100395.
- Bosque González, I. del, Fernández Freire, C., Martín-Forero Morente, L. and Pérez Asensio, E. (2012). Los Sistemas de Información Geográfica y la Investigación en Ciencias Humanas y Sociales. [online] digital.csic.es. Confederación Española de Centros de Estudios Locales. Available at: http://hdl.handle.net/10261/64940 [Accessed 12 Jan. 2023].
- Clausen, R., Luengo-Oroz, M., B. Mello, M., Paz, J., Pantin, C. and Erkkola, T. (2017). Social Media Monitoring of Discrimination and HIV Testing in Brazil, 2014–2015. Springer, [online] pp.114–120. doi:10.1007/s10461-017-1753-2.
- Comisión Interamericana de Derechos Humanos (CIDH) (2018). Avances y Desafíos hacia el reconocimiento de los derechos de las personas LGBTI en las Américas. OEA Más derechos para más gente.
Referencias bibliográficas
- Comisión Nacional de los Derechos Humanos (CNDH) (2022). Derechos: Libertad de Expresión. [online] CNDH México defendamos al pueblo. Available at: https://www.cndh.org.mx/pagina/derechos-libertad-de-expresion [Accessed 6 Dec. 2022].
- Consejo Nacional de Población (2022). ¿Sabes qué es la diversidad sexual y de género? [Página web Gobierno de México] Consejo Nacional de Población, Documentos. Available at: https://www.gob.mx/conapo/documentos/sabes-que-es-la-diversidad-sexual-y-de-genero?idiom=es [Accessed 4 Dec. 2022].
- Consejo para Prevenir y Eliminar la Discriminación de la CDMX (COPRED) (2018). POBLACIÓN LGBTTTI. https://copred.cdmx.gob.mx/storage/app/uploads/public/5b1/ff9/f94/5b1ff9f945326665643161.pdf, pp.1–33.
- Consejo para Prevenir y Eliminar la Discriminación de la Ciudad de México (COPRED) (2021). Violencia, discriminación y resiliencia en personas jóvenes LGTBI+: antes y durante la pandemia por COVID-19 en la Ciudad de México. Ciudad de México: COPRED.
- CONSTITUCIÓN POLÍTICA DE LOS ESTADOS UNIDOS MEXICANOS.
- da Silva Anes, C. (2021). Os Discursos de Ódio Contra Pessoas LGBT em Contexto Online em. [Tesis de Maestría] pp.1–51. Available at: https://repositorio-aberto.up.pt/bitstream/10216/138040/3/517322.1.pdf [Accessed 28 Dec. 2022].
- da Silva, M.P. and da Silva, L.S. (2021). Disseminação de discursos de ódio em comentários de notícias: uma análise a partir de notícias sobre o universo LGBT em cibermeios sul-mato-grossenses no Facebook. Intercom: Revista Brasileira de Ciências da Comunicação, 44(2), pp.137–155. doi:10.1590/1809-5844202127.
- de Benito, E. (2018). La OMS saca la transexualidad de la lista de enfermedades mentales. El País. [online] 19 Jun. Available at: https://elpais.com/internacional/2018/06/18/actualidad/1529346704_000097.html [Accessed 6 Apr. 2021].
- De la Cruz, I. (2019). Redes Sociales como Fuentes de Información sobre Salud. Práctica Familiar Rural, 4(2). doi:10.23936/pfr.v4i2.95.
- Eberendu, A.C. (2016). Unstructured Data: an overview of the data of Big Data. International Journal of Computer Trends and Technology, 38(1), pp.46–50. doi:10.14445/22312803/ijctt-v38p109.
¡GRACIAS!
Datos utilizados
Considerar que a lo que se quiere llegar es a identificar discurso de odio por el impacto negativo en las personas que acceden, difunden y consumen este contendio, y aun cuando existen reportes de discriminación o violencia hacia la comunidad LGBT estos buscan justamente reportar comentaris o comportamiento adecuados, apoyando la lucha y el respeto de los derechos de las personas LGBT, por lo que se reconoce que no hay intenciones negativas,
Veracruz
Chihuahua
Guerrero
Estado de México
Ciudad de México
95
58
52
38
32
Ciudad de México
Jalisco
Estado de México
Guanajuato
Veracruz
332
200
188
121
69
Estado de México
489,594
Ciudad de México
310,788
Veracruz
307,858
Jalisco
298,270
Nuevo León
286,490
31-100
101-220
221-370
371-1140
>1140
Mayor densidad
Menor densidad
FP y FN
LR
FN:
- carbon ver viernes tanto triste aqui cdmx pinche covid putito.
- decir pendejo realidad puto genio disculpame viejito santo
- puto ascoo meter sexo argumento si libre expresion opinion pendeja contar
- maldito netero puto genio
FP:
- wey comunidad smash mexico cocinero basura normalizado acoso abuso cualquiera cosa pendejo argumento puto si mal culpable hacer si
- chupandoselir buen americanista levantar momento orgullo gay
- mujer tran trans jamas ir tener solo vivencia sexo femenino literalmente imposible vivir experiencia unico compartir todo mujer
- goeeey pedo toxico comunidad gay chile acomodo consiganse vida dejar demas tranquila
FP y FN
SVM
FN:
- carbon ver viernes tanto triste aqui cdmx pinche covid putito
- decir pendejo realidad puto genio disculpame viejito santo
- puto ascoo meter sexo argumento si libre expresion opinion pendeja contar
- maldito netero puto genio
FP:
- sacar onda algunxs integrante comunidad tran querer ser parte feminismo mismo tiempo complacer ver violentada mujer caber duda mujer tran machista
- correcto si mujer tran amab entonces obligatorio hagas cirugia genital ser lesbiano
- chupandoselir buen americanista levantar momento orgullo gay
- dar risa mexico comunidad lgbt todo mamada querer agregar pinch gordo aguanoso tres pelo pecho hacer llamar oso oso hombre grueso macizo chingo vello corporal gordo ir
FP y FN
CNN
FN:
- carbon ver viernes tanto triste aqui cdmx pinche covid putito
- puto crack jajajja buen aparicion tipo capitar americo cabron
- decir pendejo realidad puto genio disculpame viejito santo
- puto ascoo meter sexo argumento si libre expresion opinion pendeja contar
FP:
- exacto marico gobierno respetar libertad expresion due si pid pagar jalar correa calle ocico silencio adeudo habla exac
- correcto si mujer tran amab entonces obligatorio hagas cirugia genital ser lesbiano
- creia mariquita joto creia mujer tiir solo rio decir velo ridiculo saber si hombre mujer
- mujer poder tener amigo amigo amigo prepa mejor amigo amigo gay asi hombre amiga puto huilo querer coger
FP y FN
RNN
FN:
- carbon ver viernes tanto triste aqui cdmx pinche covid putito
- puto crack jajajja buen aparicion tipo capitar americo cabron
- decir pendejo realidad puto genio disculpame viejito santo
- maldito puto problema perro mundo infectado ser pinche persona mas celoso casi milmillon ser personar sentimiento tanto apegado
FP:
- marimacha anarquista disfrazado feminista copiar hombre
- joto color tejuino bloquees ser hombre bien delicado
- creia mariquita joto creia mujer tiir solo rio decir velo ridiculo saber si hombre mujer
- chupandoselir buen americanista levantar momento orgullo gay
DO_LGBT_Seminario6
Guillermo Gerardo Vázquez Ferrer
Created on May 16, 2023
Start designing with a free template
Discover more than 1500 professional designs like these:
View
Smart Presentation
View
Practical Presentation
View
Essential Presentation
View
Akihabara Presentation
View
Pastel Color Presentation
View
Winter Presentation
View
Hanukkah Presentation
Explore all templates
Transcript
Detección y monitoreo de discurso de odio hacia la comunidad LGBT en Twitter, un acercamiento desde el aprendizaje computacional
Guillermo Gerardo Vazquez Ferrer
Asesora: Mtra. Karime González Zuccolotto Co Asesor: Dr. Oscar Gerardo Sánchez Siordia Sinodales: Dr. Gandhi Samuel Hernández Chan Dr. Hugo Carlos Martínez
Fuente: inkdrop/AdobeStock, Tomado de Tran D. (2021).
introducción
- El 40.7% de la población mexicana consideraba que es poco el respeto que existe a los derechos de las personas lesbianas, gays, bisexuales y transexuales
(ENDISEG, 2021).Fuente: https://www.pinterest.com.mx/pin/260997740893782512/
Diversidad sexo-genérica
Lesbiana: Mujer que se siente atraida sentimental y sexualmente por mujeres
Gay: Hombre que se siente atraido sentimental y sexualmente por hombres
Bisexual: Persona que se siente atraida sentimental y sexualmente por hombres y mujeres
Transexual: Persona que se identifica con el género opuesto al asignado al nacer y opta por una intervención hormonal y/o quirúrgica
Transgénero: Persona que se identifica y expresa con el género opuesto al asignado al nacer
Travesti: Persona que gusta de expresarse de manera transitoria con vestimenta y comportamientos considerados del género opuesto
Fuente: Elaboración propia con información de Prince Torres (2021)
Fuente: Modificado de Killermann (2011).
Medios masivos de comunicación
Discurso de odio contra la comunidad lgbt
- Sociedad mayormente heteronormativa.
- Binarios del género.
Muy probablemente experimentarán momentos o procesos de exclusión, segregación y/o violencia (da Silva Anes, 2021).estigmas, prejuicios y segregación
Fuente: https://savethechildren.org.co/modulo-4-herramientas-para-trabajar-diversidades-sexo-genericas/
Información sobre violencia y discriminación
Fuente: https://www.gob.mx/911/articulos/que-es-el-911emergencias?idiom=es
CIG
Fuente: https://www.ign.gob.ar/NuestrasActividades/InformacionGeoespacial/Introduccion
Fuente: Visible (2022)
Homicidios de personas LGBT 2015-2022
Veracruz
Chihuahua
Guerrero
Estado de México
Ciudad de México
95
58
52
38
32
letra ese
Fuente: Elaboración propia con información de Visible (2022)
Agresiones contra personas Lgbt en el 2022
Ciudad de México
Jalisco
Estado de México
Guanajuato
Veracruz
332
200
188
121
69
visible
Fuente: Elaboración propia con información de Letra ese (2022)
Discurso de odio
Fuente: https://www.sociolegalreview.com/post/balancing-away-free-speech-some-thoughts
El discurso de odio es toda expresión que incite a cualquier tipo de violencia y al odio, que menosprecie o denigre, y que promueva estereotipos de una colectividad en específico, incluso en formas sutiles como la ironía o el humor.
Discurso de odio
Intención de ejercer o incentivar
Violencia física
Discriminación
Violencia psicológica
Discursode odio
Discriminación
Conjunto de prácticas y acciones que nieguen el trato igualitario de una persona o grupo de personas, generando desigualdad social o privación de derechos (Solís, 2017).
Fuente: Elaboración propia con información de López de Loera (2019), Solís (2017), Miró Linares (2016) y Arcila, Blanco-Herrero y Valdez (2020).
Redes sociales
Fácil búsqueda y difusión
Gran alcance
Expresiones genuinas
Dificultad de monitoreo
Anonimato
Fuente: httphttps://www.rawpixel.com/image/647031/free-image-rawpixel
Redes sociales, fuente de información
Conjunto de información que carecen de organización, en donde, es necesario realizar un preprocesamiento con ayuda de aprendizaje automático o modelos estadísticos.(María Nancy y Maheswari, 2020).
Fuente: https://www.rawpixel.com/image/394493/free-illustration-vector-social-media-digital
Fuente: https://scionanalytics.com/what-is-unstructured-data/
Datos no estructurados
Aprendizaje computacional
Procesamiento de lenguaje natural
Estudia el procesamiento computacional de los lenguajes naturales, es decir, que permite generar una comunicación entre los dispositivos computacionales y los humanos a través de la manipulación e interpretación de distintos idiomas.
Fuente: Elaboración propia con información de González K. (2021)
Antecedentes
Antecedentes
¿cuál es la importancia?
Fuente: https://charismatics2.weebly.com/crime-vs-speech.html
preguntas guía de investigación
¿Cuál es la importancia de generar bases de datos relacionada al discurso de odio hacia la comunidad LGBT?
01
¿Cuál es el conjunto de palabras en idioma español utilizadas en Twitter que expresan discurso de odio hacia la comunidad LGBT en México ?
02
¿Cómo se distribuye el discurso de odio en Twitter hacia la comunidad LGBT en el territorio mexicano?
03
04
¿En qué estados de México hay mayor presencia de discurso de odio hacia la comunidad LGBT en Twitter?
objetivo general
Zonificar la presencia de discursos de odio en México hacia la comunidad LGBT en Twitter.
objetivos particualares
Explorar y documentar en Twitter las combinaciones de palabras en español utilizadas para referirse a la comunidad LGBT en México desde el discurso de odio.
Generar y estructurar una muestra de datos etiquetados, que permita identificar discurso de odio hacia la comunidad LGBT en Twitter a través de un clasificador.
Entrenar un algoritmo de clasificación usando procesamiento de lenguaje natural para la identificación de tuits asociados a discursos de odio contra la población LGBT.
Analizar la distribución espacio temporal de los tuits identificados como discurso de odio.
metodología
proceso de etiquetado
Una publicación en Twitter fue clasificada como discurso de odio si: • Incita a las personas a cometer actos de violencia hacia la comunidad LGBT o a algún miembro de esta por el hecho de ser parte de esta población. • Si incita a la discriminación hacia la comunidad LGBT o a algún miembro de esta por pertenecer a este grupo poblacional. • Si expresa o promueve estereotipos de la comunidad LGBT. • Si utiliza lenguaje vulgar y/o agresivo para insultar a la comunidad LGBT o a algún miembro de esta por el simple hecho de ser parte de esta comunidad. • Si se refiere a la diversidad sexo-genérica o utiliza categorías de la misma como una forma de insultar o denigrar.
validación del etiquetado
diferentes usos de una palabra
¿Todo puede ser discurso de odio?
Fuente: Martínez Marlene (2012) https://www.ladobe.com.mx/2012/10/2a-marcha-de-las-putas-puebla/
se consideró odio
conotaciones sexuales
Reportes sobre discurso de odio
Discurso de odio que puede no se expresa de forma evidente
no se consideró odio
Fuente: https://www.linformaldesign.com/shop/producto/eres-el-puto-crack-2/
Reportes sobre violencia o discriminación
Fuente: https://www.zuckermanlaw.com/lgbt-discrimination-lawyers/
rendimiento de los modelos
rendimiento de los modelos
overfiting
Fuente: https://www.section.io/engineering-education/regularization-to-prevent-overfitting/
overfiting
overfiting
Nube de palabras
Tuits identificados como discurso de odio
porcentajes
estados con mayor presencia de DO
estados con mayor presencia de DO
estados con mayor presencia de DO
estados con mayor presencia de DO
Referencias bibliográficas
Referencias bibliográficas
¡GRACIAS!
Datos utilizados
Considerar que a lo que se quiere llegar es a identificar discurso de odio por el impacto negativo en las personas que acceden, difunden y consumen este contendio, y aun cuando existen reportes de discriminación o violencia hacia la comunidad LGBT estos buscan justamente reportar comentaris o comportamiento adecuados, apoyando la lucha y el respeto de los derechos de las personas LGBT, por lo que se reconoce que no hay intenciones negativas,
Veracruz
Chihuahua
Guerrero
Estado de México
Ciudad de México
95
58
52
38
32
Ciudad de México
Jalisco
Estado de México
Guanajuato
Veracruz
332
200
188
121
69
Estado de México
489,594
Ciudad de México
310,788
Veracruz
307,858
Jalisco
298,270
Nuevo León
286,490
31-100
101-220
221-370
371-1140
>1140
Mayor densidad
Menor densidad
FP y FN
LR
FN:
FP:
FP y FN
SVM
FN:
FP:
FP y FN
CNN
FN:
FP:
FP y FN
RNN
FN:
FP: