Statistiske hjelpemidler

Jeg satt og puslet med en tekst der korrekturleseren hadde foreslått at «det samme er tilfelle når det gjelder …» heller burde skrives som «det samme er tilfellet når det gjelder …».  Jeg var lite lysten på å endre utsagnsmåten og ønsket å se hva andre hadde valgt å gjøre.

Første sjekk var Google fighthttp://www.googlefight.com. Svaret var følgende:

Screenshot 2014-05-25 22.20.04

I over 3 av 5 tilfeller skriver andre det samme.

Jeg vet ikke hvordan Google fight bygger opp statistikken. Søker den hele nettet, eller deler av det?

 

 

 

 

 

 

 

 

 

Det andre redskapet jeg brukte, søker innenfor en database som ligger på Nasjonalbiblioteket, nemlig Nasjonalbibliotekets ngramleser  http://www.nb.no/ngram/. Mens Google ikke har noen øvre grense på hvor lang søkestrengen kan være (husk å sette den mellom hermetegn slik at det søkes på hele strengen), har ngramleseren en øvre grense på fire ord.

På hjemmesiden finner en følgende

Nasjonalbibliotekets ngramleser lar deg søke i et tekstkorpus som inneholder ca. en og en halv milliard løpende ord fra forskjellige nettaviser, samlet inn fra slutten av 1990 frem til 2011.

Søket støtter jokertegn, benytt * for ord, og % i ord. For eksempel vil

spise *

finne alle ord som følger etter spise, mens

spis% * ikke

finner alle trigrammer der første ord begynner med spis og der tredje og siste ord er ikke, og ordet imellom, andreordet, er hvilket ord som helst.

Treffene kan også begrenses til en gruppe, der gruppene omsluttes av anførselstegn. Uttrykk som

«alle noen hver» *

finner alle bigrammer der førsteordet er ett av alle, noen eller hver.

 

Svaret på mine søk ble følgende (og jeg måtte gjøre to søk, Google fight inviterer til «fight», så der får en begge resultatene med en gang):

Screenshot 2014-05-25 22.30.06

Altså 485 tilfeller

Screenshot 2014-05-25 22.30.25

Totalt 643 tilfeller

Begge analysen gav med medhold i cirka 3 av 5 tilfeller, så jeg stoler på flertallet og skriver «det samme er tilfelle». Uansett er dette to verktøy som kan komme til nytte i ulike sammenhenger. Hva opptrer oftest «fram» eller «frem»? Skriver de fleste «for øvrig» eller «forøvrig» og så videre.

Om olafhusby
Språkviter, bestefar, forfatter, forlegger, blogger, reisende

2 Responses to Statistiske hjelpemidler

  1. Dominique Heyler sier:

    Ja, det er veldig greit med slike verktøy. Ellers ser jeg at mange strever med bestemt/ubestemt form av intetkjønnsord, spesielt i faste uttrykk. Eksempelvis er det mange som skriver «til stedet» i stedet for «til stede» eller «i stede» i stedet for «i stedet» …🙂

  2. Sigve sier:

    Sandhedens og frihedens farligste fiender iblandt os, det er den kompakte majoritet.

    Hvis spørsmålet er hva som er korrekt, og ikke hva som er brukt, burde en nok i dette tilfellet heller tydd til ordboken enn til statistiske hjelpemidler.

    Der har du eksemplene «det motsatte er t-t nå» og «det motsette synte seg å vere tilfellet». Selv om det her er snakk om det motsatte og ikke det samme, er bestemmelsen nok den samme uansett.

    http://www.nob-ordbok.uio.no/perl/ordbok.cgi?OPP=tilfelle&ordbok=begge&spraak=begge&begge=+

    Hvis den norske språkfølelsen ikke strekker til for å bestemme rettskrivningen pga. homonymi, er det et triks å prøve å omskrive til et annet språk.

    http://googlefight.com/index.php?lang=en_GB&word1=%22the+same+was+the+case%22&word2=%22the+same+was+case%22

    Her er noen som ikke har greit det, men hvor feilen går andre veien:

Legg igjen en kommentar

Fyll inn i feltene under, eller klikk på et ikon for å logge inn:

WordPress.com-logo

Du kommenterer med bruk av din WordPress.com konto. Logg ut / Endre )

Twitter picture

Du kommenterer med bruk av din Twitter konto. Logg ut / Endre )

Facebookbilde

Du kommenterer med bruk av din Facebook konto. Logg ut / Endre )

Google+ photo

Du kommenterer med bruk av din Google+ konto. Logg ut / Endre )

Kobler til %s

%d bloggers like this: