So ein LIKE kann man ja immer mal gebrauchen. Z.B. bin ich bei einer (zugegeben: hingerotzten) Gewinnspiel-Datenbank von einem Bot zugespammt worden. Ließ sich relativ leicht erkennen (Durchnummerierte Mail-Adressen mit gleicher Domain), allerdings ist es nicht einfach, so etwas zu entfernen, wenn man kein LIKE %domain.de zur Verfügung hat.
Als Workaround macht man halt ein volles SELECT auf die entsprechende Tabelle (bzw. das Objekt) und filtert mit JAVA. Ressourcensparen ist da eher nicht angesagt. Um ca. 130.000 Einträge zu identifizieren und zu löschen habe ich sage und schreibe fast 6 CPU-Stunden verbraten. Man denke nur an den CO2-Ausstoß. Und ich habe noch mal min. das doppelte davon in der Datenbank. Google, dass sollte besser gehen!
Andererseits sieht man, wie gut Google skaliert. Für das ganze Filtern habe ich nämlich nur ca. 30 min gebraucht, da ich durch eine weitere Eigenheit der App Engine nur Häppchenweise Daten entfernen konnte. Da haben also einige Maschinchen parallel gearbeitet.