Chatbot Analysis with SimSimi - IBS Data Science Group

Analyzing Discourse Data on Chatbot “SimSimi”

AI + Art: “Beats of Hate” – Hyunho Song

November 23, 2021

우리는 혐오의 시대에 살고 있다. 혐오 표현/발언은 그 대상을 세대, 성별, 인종을 넘나들며, 꾸준히 증가해 왔다. 혐오 표현은 혐오의 대상이 되는 개인과 단체에 큰 위협이 되며, 집단 간 분쟁과 갈등을 유발하여 큰 사회 문제를 일으키지만, 혐오 표현 사용의 심각성에 대한 사람들의 인식은 여전히 낮다.

우리는 다수의 사용자가 24시간 동안에 챗봇에 가르친 문장에 포함된 욕설과 음란성, 모욕 표현 등 혐오 발언의 타입과 강도를 기계학습으로 판별하여 수치화하고, RGB 색채 값으로 변환한 후 14400개의 픽셀로 이루어진 한 장의 이미지로 시각화하였다. 또한, 시각화된 1년 치 365장의 이미지를 모션화하여, 시간의 흐름에 따른 혐오 발언의 타입과 양의 추이를 마치 음악의 Beat처럼 표현하였다.

This image visualizes the level of toxicity, sexual explicitness, and insult of the sentences that were taught to a chatbot as RGB pixels using Google Perspective API. Each cell represents a sentence, and each vertical bar represents a set of sentences taught in 10 minutes. We motioned 365 images of daily patterns of types and quantities of hate/explicit speech as a beat through our hearings.