John Mueller: Google verwendet die NLP API nicht 1:1 in der Suche

Bei der Entwicklung eine Textanalyse-Tools bin ich auf das Problem gestoßen, dass gekoppelte Begriffe nicht immer von Google als Entitäten erkannt werden.
John Mueller: Google verwendet die NLP API nicht 1:1 in der Suche

Im Webmaster Hangout vom 14. Dezember 2021 mit John Mueller stellte ich die Frage, warum die NLP API bei durchgekoppelten Begriffen oder Longtail Keywords die Entitäten schlecht oder teilweise gar nicht erkennt.

John erklärte, dass gekoppelte Begriffe ( z.B. „Formel-1-Fahrer” statt „Formel 1 Fahrer” oder „James-Bond-Filme” statt „James Bond Filme”) als separate Keywords von Google erkannt werden und auch separat im System vorhanden sind. Google würde im Laufe der Zeit die gekoppelten Begriffe als Synonyme zu dem entsprechenden Keyword ohne Kopplung erkennen.

Als Seitenbetreiber gibt es hier keine Handlungsanweisung von Google, damit die Suchmaschine die Synonyme besser oder schneller zuordnen kann. Im Umfeld der Kopplungen könne man aber zum Beispiel probieren, welche Varianten für den Benutzer am besten passen.

John findet die Idee, solche Analysen mit der NLP API durchzuführen gut, ebenso sie als Hilfsmittel zu verwenden, verweist aber darauf, dass die NLP API nicht 1:1 das ist, was Google in der Suche tatsächlich verwendet. In der Suche würden die Umliegenden Texte auch zum Verständnis mit verwendet werden.

Mit Verweis auf britisches und amerikanisches Englisch erklärt John außerdem, dass es kein linguistisches Modell gibt, dass unterschiedliche geschriebene Wörter mit gleicher Bedeutung miteinander verknüpft. Vielmehr würde versucht, so etwas über normale statistische Verfahren zu erkennen.

Bei Suchbegriffen, bei denen Google die Entitäten oder Longtail-Keywords nicht sauber erkennt, kann man versuchen, auch beide Schreibweisen (mit und ohne Bindestriche) zu verwenden, auch wenn das aus journalistischer Sicht auf die Schreibweise falsch ist.

Den Ansatz, Texte über die NLP API zu prüfen, begrüßt John aber als „super gut” und dass die wenigsten diesen Schritt gehen und versuchen würden.


Bock auf eine digitale Lösung?