Полезная штука, для тех кто делает более ли менее толковый скрипт поиска.
Более 350 русскоязычных мусорных слов, включая слова типа "мля", "нах", "мегалол"...
И еще 650 англоязычных.
В архиве запрятан класс для эвристического извлечение корня из русского слова, использование которого и сделает фразу "Более 350 русскоязычных мусорных слов" реальностью.
Искал в Яндексе по запросу "стоп слова". Все, что нашел, собрал в одну коллекцию, обработал специальным скриптом и предоставил Вашему вниманию.
Скачать все, что дают сейчас бесплатно.