Este foro (vB), creo que hay que hacerlo a pedal lo de seleccionar las palabras más frecuentes (una sencilla consulta), y eliminarlas. En otros foros como el phpBB, cada vez que se inserta una nueva palabra, se comprueba que el nº de apariciones no supere un determinado tope (se guarda la palabra y las repeticiones). Si lo supera, se elimina la palabra y sus referencias.
Son dos tablas, una con las palabras y un identificador único, y otra con esos identificadores, junto con identificadores a posts, con lo que es bastante sencillo y rápido sacar los resultados.
Sí, al postear un texto, éste se desmenuza en palabras, se eliminan las más frecuentes junto con el vbCode (o el que sea), y se inserta una a una en las tablas.
Puedes bajarte las fuentes de un foro como phpBB, y ver como se hace
, está bastante bien documentado.
Saludos