Verktøy 3 – Google fight

Jeg har nevnt Google fight tidligere på bloggen, men siden jeg holder på med en liste over verktøy for skrivelystne nå, tar jeg det med her også. Dersom du ønsker å finne hvilket av to alternative uttrykksmåter som er mest frekvent, kan du sette dem opp mot hverandre på http://www.googlefight.com.

Nedenfor er frekvensen av ordformene «colour» og «color» i henholdsvis engelsk og amerikansk versjon av Google (det kan velges mellom 20 språk, ikke norsk).  Figurene viser hvilke former som er mest brukt (britisk engelsk – «colour»), amerikansk engelsk –  «color». I tillegg ser en hvor ofte den andre ordformen opptrer. Talluttrykket er i prosent.

Statistiske hjelpemidler

Jeg satt og puslet med en tekst der korrekturleseren hadde foreslått at «det samme er tilfelle når det gjelder …» heller burde skrives som «det samme er tilfellet når det gjelder …».  Jeg var lite lysten på å endre utsagnsmåten og ønsket å se hva andre hadde valgt å gjøre.

Første sjekk var Google fighthttp://www.googlefight.com. Svaret var følgende:

Screenshot 2014-05-25 22.20.04

I over 3 av 5 tilfeller skriver andre det samme.

Jeg vet ikke hvordan Google fight bygger opp statistikken. Søker den hele nettet, eller deler av det?

 

 

 

 

 

 

 

 

 

Det andre redskapet jeg brukte, søker innenfor en database som ligger på Nasjonalbiblioteket, nemlig Nasjonalbibliotekets ngramleser  http://www.nb.no/ngram/. Mens Google ikke har noen øvre grense på hvor lang søkestrengen kan være (husk å sette den mellom hermetegn slik at det søkes på hele strengen), har ngramleseren en øvre grense på fire ord.

På hjemmesiden finner en følgende

Nasjonalbibliotekets ngramleser lar deg søke i et tekstkorpus som inneholder ca. en og en halv milliard løpende ord fra forskjellige nettaviser, samlet inn fra slutten av 1990 frem til 2011.

Søket støtter jokertegn, benytt * for ord, og % i ord. For eksempel vil

spise *

finne alle ord som følger etter spise, mens

spis% * ikke

finner alle trigrammer der første ord begynner med spis og der tredje og siste ord er ikke, og ordet imellom, andreordet, er hvilket ord som helst.

Treffene kan også begrenses til en gruppe, der gruppene omsluttes av anførselstegn. Uttrykk som

«alle noen hver» *

finner alle bigrammer der førsteordet er ett av alle, noen eller hver.

 

Svaret på mine søk ble følgende (og jeg måtte gjøre to søk, Google fight inviterer til «fight», så der får en begge resultatene med en gang):

Screenshot 2014-05-25 22.30.06

Altså 485 tilfeller

Screenshot 2014-05-25 22.30.25

Totalt 643 tilfeller

Begge analysen gav med medhold i cirka 3 av 5 tilfeller, så jeg stoler på flertallet og skriver «det samme er tilfelle». Uansett er dette to verktøy som kan komme til nytte i ulike sammenhenger. Hva opptrer oftest «fram» eller «frem»? Skriver de fleste «for øvrig» eller «forøvrig» og så videre.