Development of a sentiment dictionary to detect hate speech in internet comments
Im Jahr 2015 stieg die Anzahl von so genannten Hass-Kommentaren im Internet in Zusammenhang mit der Flüchtlingskrise massiv an. Ein Mittel zur Erkennung von verhetzenden Einträgen ist die automatisierte Emotionsanalyse der Inhalte. Dabei bilden Wörterbücher die Grundlage, da sie Texte für Computer verständlich machen. Im Rahmen dieser Arbeit werden verschiedene Möglichkeiten zur Erstellung solcher Wörterbücher zur Erkennung von Hasskommentaren in einem Textkorpus betrachtet. Dazu werden mit Hilfe eines Webcrawlers Kommentare von Internetseiten extrahiert und als Lern-Datenbasis für die Entwicklung eines Wörterbuch-Prototypen verwendet. Da es zurzeit nur wenige kontextbasierte Wörterbücher in deutscher Sprache gibt, versucht diese Arbeit die Machbarkeit der automatischen Erstellung von Wörterbüchern am Beispiel der Emotion Hass zu überprüfen. Ziel ist die Erstellung eines Wörterbuch mit der Hasskommentare – unter anderem in sozialen Netzwerken und in den Kommentaren auf Nachrichtenseiten – erkannt und gegebenenfalls entfernt werden.