Informations- und Telekommunikationstechnik Wort aus einer Liste, das bei einer Zählung von Wörtern in Texten oder bei der weiteren Verarbeitung von Texten ausgeschlossen wird, meist weil es besonders häufig vorkommt
Beispiele:
Weiterhin sollen typische Stoppworte wie
»der«, »die«, »das«, »ist«, die in allen Texten sehr häufig vorkommen und
keine eigentliche Bedeutung tragen, gefiltert werden. [Solr für Einsteiger, 09.08.2010, aufgerufen am 19.08.2020]
Die Anzahl an neuen Sätzen wächst linear mit der Anzahl an Texten.
[…] Dies zeigt sich sogar, wenn man die Sätze
durch Entnahme aller Substantive und Adjektive sowie allgemeiner
Stoppwörter (»der«, »die«, »das« etc.)
abstrahiert. [Natural Language Processing in der Medizin – Wie schwierig ist es
wirklich?, 07.02.2018, aufgerufen am 19.08.2020]
In diesem Zusammenhang entstand auch die oben abgebildete
[…]Grafik, in der die in Augsburg
gesprochenen Worte umso größer abgebildet sind, je häufiger Steinbrück sie
in seiner Rede verwandt hat. Dabei wurden, wie in solchen Verfahren üblich,
eine Reihe sogenannter Stoppworte, etwa: »und«,
»oder« und »mit«, ausgeklammert – die Personalpronomen »ich« und »wir« aber,
die normalerweise ebenfalls zu den Stoppworten
rechnen, haben wir selbstverständlich mitgezählt. [Der Spiegel, 03.05.2013 (online)]
Zunächst einmal wird eine [Web-]Site
als deutschsprachig eingestuft, wenn sie eine genügend große Anzahl
sogenannter Stoppwörter enthält, also Wörter, die in
der deutschen Sprache besonders häufig vorkommen, wie zum Beispiel »der,
die, das, und, mit, von« und so weiter. [C’t, 1999, Nr. 8]