Der SARS-CoV-2-Thread - Google Trends-Auskopplung

  • Ich habe natürlich "covid" als Suchbegriff vergessen. Was scheinbar nirgends auftaucht: "SARS-CoV-2". War schon lange meine Vermutung, dass man mit dem Begriff vorallem die professionelleren Informationen findet.


    --


    Stellt sich übrigens raus 冠状 ist nicht in den top 25 (von China) auch nicht 冠状病毒, sondern tatsächlich nur "coronavirus". Ich vermute das Googlesuchvolumen aus China könnte relativ zum Rest der Welt so gering sein, dass man eine Sichtbarkeit als Region nur über die chinesischen Begriffe herstellen kann, weil die im Rest der Welt sehr wenig gesucht werden. Es ist natürlich möglich, dass diese Begriffe nahe an Platz 25 noch auftauchen, aber das Volumen wird schon auch geringer sein.


    --


    Dafür kommt 口罩 (Maske) in den top 25 von Hongkong, Macau und Taiwan vor. 肺炎 (Lungenentzündung) in denen von Hongkong und Taiwan und dazu noch 武漢 肺炎 (Wuhan-Lungenentzündung) in denen von Taiwan. Aber diese Spezialfälle lasse ich mal raus.

  • So das wären die regulären Ausdrücke, die meines Erachtens auf ein Interesse, an CoViD-19 hinweisen. Hauptsächlich, weil sie irgendwas mit "corona/covid" drin haben oder im Fall der arabischen (eines davon ist wohl Farsi) und hebräischen Worte von Google Translate so übersetzt werden.


    Die ganzen Kombinationen sind dazugekommen, nachdem ich einmal kurz geprüft habe, ob sie auch wirklich in dem entsprechenden Land gesucht wurden. Das ist der Fall, ist ja auch naheliegend. Und "corona/coronavirus update" kommt nicht in Deutschland vor, daher habe ich das auch noch mitgenommen.


  • naja es kan einfach sein dass man aus china schwerer info finden stichwort die große firewall

  • wären Pandemie und Epidemie nicht eventuell auch noch Worte, welche mit zeitlichem Bezug mit Aufschluss geben könnten?

    Maßnahmen wäre eventuell auch noch was, was man dann dem gegenüberstellen könnte.

    So zwei kurze Gedanken.


    Pandemie, Epidemie: Könnte man denken, aber kommt in den top 25 nicht vor.


    "Maßnahme", "restriction", auch "lockdown"/"lock down", "quarantine", "isolation" kommt alles nicht vor.


    Also ich glaube Suchbegriffe zu SARS-CoV-2 werden sich vielleicht einfach dadurch auszeichnen, dass sie es überhaupt in die top 25 geschafft haben, denn die allermeisten Suchbegriffe da scheinen die Namen irgendwelcher Dienste oder Funktionssuchen wie Wetter, Zeit, Filme usw. zu sein.

  • naja es kan einfach sein dass man aus china schwerer info finden stichwort die große firewall


    Nun, Google hat in China nur einen sehr geringen Marktanteil. Ein witziges Detail, in den top 25 (bei dem Datensatz, den ich gezogen habe, muss man eigentlich immer dazu sagen) hat die Suche nach 谷歌, also Google, etwa das gleiche Suchvolumen wie 百度, also der Hauptkonkurrent Baidu. Wobei ich jetzt auch nicht weiß, warum man "google" in Google eingeben sollte.


    Ich könnte mir vorstellen, dass die Regierungszensur vielleicht dafür gesorgt hat, dass diese Suchanfragen nur mit offiziellen Informationen beantwortet werden und nicht mit irgendwelchen Suchergebnissen, die Google dazu produziert. Aber zum einen wäre die Anfrage dann nicht trotzdem in der Statistik? Und zum anderen das Stichwort "coronavirus" ist ja in den top 25 vorhanden.

  • Aber das ist bestimmt ein Effekt, weil sich nicht alle bewusst sind, dass ein Suchfeld schon direkt zur Google-Suche führt.


    Ansonsten ist das natürlich ein grundsätzliches Problem solcher Datensammlungen. Einfache Fehler, die sehr oft gemacht werden, können ein Scheininteresse vorgaukeln. In dem Fall könnte ich mir zum Bespiel vorstellen, dass Leute öfter Google-Dienstleistungen eintippen, Google Translate, Google Maps, Google Drive usw. und wenn man dann Ausversehen schon bei Google die Suche auslöst, dann ist am Ende nur "google" der Begriff, der am häufigsten auftaucht. (Wobei "google translate" für sich auch schon sehr häufig in den top 25 vorkommt.)


    Dazu eben wieder die Frage wie automatische Ergänzungen in der Datensammlung berücksichtigt werden. Ich könnte mir gut vorstellen, dass die rausgelassen werden, weil man so ja eigentlich bestehende Trends verstärkt und das scheint mir irgendwo dem Sinn der Datensammlung entgegenzulaufen. Und dann würde es natürlich oft nach "google" abbrechen, weil die Leute schon in den Vorschlägen finden, was sie gesucht haben.

  • So also ich hätte ein Ergebnis und ich denke, es stützt nicht die Idee, dass die Google Trends zeigen, man würde sich außerhalb der reicheren Länder für SARS-CoV-2 nicht interessieren.


    Drei Auswertungen (jeweils wegen der Zeichenlimitierung gekürzt):


    1. Die erste Liste links sind die oben aufgelisteten SARS-CoV-2-verbundenen Suchbegriffe aus den top 25 mit ihren zugehörigen relativen Suchvolumina-Angaben. Wie schon gesagt, da sieht man ja durchaus bereits eine Durchmischung wohlhabender und ärmerer Länder, auch wenn erstere im oberen Bereich stärker vertreten sind. Die zweite Liste rechts zeigt anstatt des relativen Suchvolumens die Position des Suchbegriffs in der Rangordnung. Und ich würde sagen, da ist es nochmal deutlicher gemischt.


  • 2. Erste Liste links ist identisch mit 1. Die zweite Liste rechts ist der Versuch einer Normalisierung des Suchvolumens und zwar ist der Wert in der linken Liste jeweils durch den Mittelwert aller Volumina unterhalb von 100 für das Land geteilt. Sprich wenn der Wert sehr stark ähnlich oder unähnlich zu den anderen ist, dann wird er entsprechend eingeordnet. Werte um 1 liegen beim Mittelwert des Suchinteresses, darunter ist es weniger interessant als das Mittel, darüber mehr. Auch hier würde ich die Durchmischung in der Tendenz als größer einschätzen.


  • 3. Schließlich nochmal eine andere Art der Normalisierung. Und zwar was ich schon angesprochen hatte, hier gibt es ja eine Grundlast von Suchbegriffen, die vermutlich eher einer Lesezeichen-Funktion der Suchmaschine entsprechen als einem neuen Informationsinteresse. Diesmal ist die erste Liste links die Rangordnung aus 1. Für die zweite Liste rechts habe ich etliche solcher "Grundlast"-Suchbegriffe entfernt. Also Dienste oder Medien wie "aftonbladet", "amazon", "bbc", "facebook", "google translate", "netflix", "яндекс" oder Funktionssuchen wie "download", "ニュース", "streaming", "weather". Habe ich aber nicht abgeschlossen. Nimmt man das heraus, sieht man, dass Suchanfragen nach SARS-CoV-2-verbundenen Begriffen deutlich höher rücken und oft sogar das erste wirklich neue Informationsinteresse gegenüber solcher, wie ich vermute, Standardnutzung darstellen. Und auch die Vermischung ist nochmal stärker.


Jetzt mitmachen!

Du hast noch kein Benutzerkonto auf unserer Seite? Registriere dich kostenlos und nimm an unserer Community teil!