Politikk – posisjon

I går kveld annonserte Erna at hvilken kroppslig posisjon hun vil innta utover høsten dersom høyresiden vinner valget. Jonas nevnte ikke noe, men han kommer til å gjøre det samme som Erna dersom han får anledning.

Erna skal forhandle med sine samarbeidspartnere. Det vil si at hun skal «sette seg ned» og snakke med dem. I løpet av de siste årene har «å sette seg ned» nærmest blir et standarduttrykk når politikerne inviterer til forhandlinger. Det ser ikke ut til at man forhandler stående eller gående.

Det tallmessige underlaget for bruk av uttrykket er hentet fram ved hjelp av Nasjonalbiblotekets n-gramsøker som baserer seg på analyser av skriftlige kilder. Som en ser øker bruken betydelig fra slutten av 1900-tallet, og hypotesen er at det er samarbeidssøkende politikere som bidrar mest til dette.

Følg med få valgsendingene framover! Det kommer til å være mange som skal sette seg ned – ofte.

 

 

Advertisements

Årets navn 2016

De mest populære navnene i 2016 ble offentliggjort av SSB for en tid siden. Listene over jente- og guttenavn viser at tendens en har kunnet observere de siste tiårene nesten har nådd sitt toppunkt. Her er navnene etter popularitet:

Alle jentenavnene ender i prinsippet på vokal og alle guttenavnene på konsonant. Riktignok finner en jentenavnene Ingrid/Ingerid som kan representere uttale med/uten /d/ og Sarah, der bokstaven <h> neppe har noe lydlig korrelat. For guttene er Noa det eneste navnet som skrives med vokal til slutt. Der finner alternativet Noah, der bokstaven <h> heller står et skriftlig uttrykk enn et lydlig.

Mens guttenavnene slutter på sju ulike konsonanter (-m, -r, -s, -p, -b,  -l, -h) ender jentenavn på -a eller -e (hvis vi ser bord fra Ingri).

Det er også større variasjon mellom fylkene når det gjelder guttenavn:

Skjermbilde 2017-04-23 kl. 18.55.33

En finner også navnet med alternative skrivemåter. Dette er noe som ser ut til å bli mer og mer vanlig.  Kanskje kan en vente flere varianter i årene som kommer. Virkemidlene som er brukt ovenfor er dobling av lang vokal (o > oo), mindre lydrette skrivemåter for konsonanter (V > W,  K > C, S > Z, F > Ph,) og tegn uten tilknyttet lyd (stumme bokstaver) (- > h, . Ut fra dette skulle navnene nedenfor være mulige – og det er slik at noen av disse formene allerede er tatt i bruk (Tallene i parentes angir antall treff pr. 23.4.17).

  • Noorah (6)
  • Zarah (37), Zaarah (-) , Saara (33), Saara (-)
  • Nooa (-), Nooah (-)
  • Philippe (108)

Tendensen ser ut til å gå mot mer uregelrette skrivemåter:

  • William (7422) vs. Villiam (64) dvs. mindre enn 1 prosent.
  • Jacob (3118), Jakob (5608) vs. Jakop (69), Jacop (8)
  • Mathias (10974) vs.  Matias (1301)

Denne tendensen er ikke ny:

  • Wenche (14006) vs. Venke (795).
  • Willy (2694) vs. Villy (427).

Og utviklingen framover? Illustrasjonen ovenfor viser et interessant trekk: Det vanligste guttennavnet i Oslo er Mohammad (og her kan en finne ulike varianter). SSB nevner også at navnetrender gjerne starter i Sverige og så kommer det hit. Et populært jentenavn i år er Saga. Det er 566 som bærer det navnet i Norge. Her ser det ikke ut til å være varianter som Sagah, Saaga, Zagah, Zaagah. Men hvem vet hva som kan skje?

Språklig innsikt

Jeg har en venn på to og et halvt år som for lenge siden oppdaget hvilke ressurser det ligger i det å beherske et språk, både muntlig og auditivt. Han er bosatt på Østlandet og har tilegnet seg deler av lydinventar og intonasjon far de omgivelsene han lever i. Nå ser det ut til at han har oppdaget flere ting ved språket. Han er en vant lytter, de første analysene av talespråk gjorde han da han ble født. Etter hvert begynte han å forme egne lyder og ord, og i dag har han det en vil kalle aldersadekvat kompetanse. Etter mange timer på fanget vet han hvordan boka skal ligge når en skal lese, og hvordan en skal bla i den. Han har erfart at tegnene på boksidene, bokstavene, uttrykker noe.  Bokstavene kan han ikke, men han vet at min bokstav er den runde sirkelen. Om dette er uttrykk for noen noen dypere forståelse av skriftspråk, er usikkert. Han vet også at bilen min er rød, så relasjonen mellom O’en og meg kan være en lært forbindelse. På den annen side har han innsett forskjellen mellom rolle/relasjon («pappa, mamma») og navn («Ola, Kari»).

Han ser på TV og iPad og har hørt at folk snakker på måter han ikke forstår. For noen uker siden satt han og bladde i en bruksanvisning der det fantes tekst på mange ulike språk. Hver side ble lest høyt og tydelig, og han bladde rolig og kontrollert fra side til side.  Lesingen ble innledningsvis kommentert av en voksen som nevnte et nytt språk hver gang han var ferdig med en side (tsjekkisk etter side 2 og spansk etter side 3).. Totalt bladde han om 10 ganger og nedenfor gjengis innholdet på hver av de 11 sidene slik han gav uttrykk for det.

Jeg bruker en litt folkelig transkripsjon istedet for å gjengi dette med IPA. Dermed blir det introdusert noen ekstra tegn og tegnkombinasjoner for  få med nyanser i uttalen:

  • Vokaltegnene refererer til lydene slik de uttales under oppramsing av alfabetet
  • Dobbeltskrevet vokal indikerer lang vokal.
  • <ə> er «slapp e» (jf. siste lyd i «late»). Kvaliteten på vokalen i <kəə> er  markert forskjellig fra den i «te».
  • <ʔ> er et lukke mellom stemmeleppene (det en gjør før en skal kremte – altså stillheten før selve kremtet).
  • er den første lyden i eneglsk uttale av «gin»
  • er samme lyd som i trøndersk «itj»
  • <‘> indikerer stavelse med trykk.

Noen ganger er det vanskelig å fastslå om to stavelser som følger etter hverandre skal regnes som ett eller to ord, en annen lytter vil kanskje komme fram til et litt annet analyseresultat. Uansett, han leste følgende:

  1. gå gå gå gei dsjidsji.
  2. gå gå gå gå gå gå dsjidsji dsjidsji ga gå fe de.
  3. då tə ʀedi tetowet. ˈBaa ‘kekə ‘geen.
  4. te ti eti te te te te te teete.
  5. go go go ge dsjidsji dsji gå geʔ gagá? E jåike ðæ jåike.
  6. ʔu keike tjə tjæ koo ˈkəə kəə sååte.
  7. go go go go dsji dsji dsji gaa-a kowei.
  8. ʔe  gogo dsju gavei.
  9. go go gi ga gapwei.
  10. go go ga pi ti dsji.
  11. gå gå gå ga tjitji ka pi ˈgei.

Totalt er det 43 ulike ordformer etter min analyse. Nedenfor er de alfabetisert etter første lyd i et litt utvidet system idet <dsj, ð, ʀ, tj, ʔ> er ført opp som egne kategorier. Tallene i parentes angir antall forekomster.

  1. (1) baa
  2. (2) de då
  3. (3) dsji dsjidsji dsju
  4. (1) ðæ
  5. (2) e eti
  6. (1) fe
  7. (13) ga gaa-a gaga gapwei gavei ge geen gei geʔ gi go gogo gå
  8. (1) jåike
  9. (6) ka keike kekə koo kowei kəə
  10. (1) pi
  11. (1) ʀedi
  12. (1) sååte
  13. (5) te teete tetowet tə ti
  14. (3) tjæ tjə tjitji
  15. (2) ʔu ʔe

En finner er rikholdig inventar av lyder. Ord som begynner på /ɡ/ og /k/ utgjør de største kategoriene. I noen tilfeller har det vært vanskelig å kategorisere, for eksempel er det ikke alltid like lett å skille mellom initial uaspirert [k] og [ɡ]. Jeg har kun lyttet til det som sies. Det er ikke gjort akustiske analyser ved hjelp av program som f.eks. Praat.

Lydverk

I oversikten nedenfor settes lydene mellom skråstreker for å markere at det er språklyder (en diskusjon om dette er fonemer tar jeg ikke her).

Vokaler

Vi finner både lange og korte vokaler. Dette tolker jeg som innflytelse fra norsk. Totalt er det 8 korte vokaler, /a e ə å i u æ o/ og fire lange /aa, ee, əə, oo, åå/. Det er også to diftonger – /ei, åi/.  Den vanskelige norske u-en finnes i to tilfeller, men /y/ og /ø/ er fraværende. Vanligvis regnes [ə] som en variant av /e/, men her føres den opp som en egen vokal her ut fra den prominente posisjonen den har idet den også realiseres som lang (noen en ikke finner i norsk).

Konsonanter

Konsonantinventaret er ganske rikt med sine 16 lyder.  En finner også segmenter som en ikke finner i norsk. Materialet inneholder

  • Plosiv /p b t d tj k ɡ ʔ/ («tj» i IPA: /c/)
  • Affrikat /dsj/ (IPA: /ʧ ʤ/)
  • Frikativ  /f ʋ ð ʀ/
  • Glidelyd /w j/

Den observante leseren har allerede observert flere par av ustemt/stemt lyd som for eksempel /p/-/b/, /t/-/d/, /k/-/ɡ/.  Dette er parallelt med hva en finner i norsk. En finner to lyder som tilhører ulike dialekter i norsk. /ʀ/ representerer en skarre -r, og /tj/ siste lyd i trøndersk «itj».   I materialet opptrer imidlertid tj-lyden først i ord (jf. dialekter på Nordvestlandet i ord som «kjøpe, køyre»). Bruken av disse to lydene kan kanskje forklares med referanse til språklig input fra foreldrene. Det er interessant å finne den stemte affrikaten /dsj/ (en affriakt er enlyd som starter med lukke, men som har friksjon under åpningsfasten). Denne lyden er ikke en del av norsk. /ð/ og /w/ finner en heller ikke i norsk, men de er  i engelsk, jf. «the» og «we». At disse inkluderes her kan tyde på at lydene er registrert i omgivelsene, kanskje er de til og med som fremmede i forhold til norsk, og derfor inkluderes i språket som legges til grunn for høytlesningen.

I forhold til østnorsk mangler /s/, /ʃ/ – (sj-lyden), /ç/ – (kj-lyden), /h/, /l/, /m/, /n/,  /ŋ/ – (ng-lyden), -/l/ og /r/ (tungespiss-r). I tillegg mangler også  /ʈ/ («rt» i fort»), /ɖ/ («rd» i «ferdig»), /ɳ/ («rn» i «barn») og /ɭ/ («rl» i «ærlig»). De fire siste mestrer han ikke. De resterende manglende lydene en finner i norsk må/kan være valgt bort som lydinventar i språket/språkene han leser på (hvis det er det han gjør). Ekskluderingen av de nasale lydene /m, n,  ŋ/ er interessant, særlig tatt i betraktning av disse mestres godt på norsk. /m/ er en lyd som barn normalt tilegner seg tidlig. Et argument for å utelate dem kan være ønsket om å gi en fremmed klang til lesningen.

Intonasjon

Setningene leses rett fram med en ganske flat tone som er svakt synkende utover. Jeg har valgt å sette inn punktum for å markere en lav slutt på hver av «setningene». Noen av stavelsene får høyere toner enn omgivelsene, og i et tilfelle (linje 5) ender intonasjonen så høyt at jeg har valgt å sette inn et spørsmålstegn.

Talerytme

Talerytmen er ganske stakkato. Hvert ord kommer isolert og det legges trykk på hvert ord. Til tross for det har åpne stavelser ikke særlig lange vokaler. I flerstavelsesord og i slutten av spørresetningen er det større grad av sammenkjeding, og dette bidrar til inntrykket av han uttaler flerstavelsesord.

Stavelsesstruktur

De fleste stavelsene har KV-struktur (konsonant+vokal) som i «go». Det finnes også V («e»), VK («et»), KVV («kei»), KVK («geen»). Det er altså en variasjon av strukturer utover KV, men likevel langt mindre enn hva enn finner i norsk der en har KKK før første vokal («språk») og KKKK etter vokalen («falskt»). Utvalget av stavelsesstrukturer avspeiler nok det som er vanlig for dette alderstrinnet, men samtidig er det i overensstemmelse med hva en finner i ulike språk.

Ord

De fleste ordene har én stavelse (slik jeg oppfatter dem), men det finnes både tostavelsesord og trestavelsesord her  som «gap.wei» og  «te.to.wet» der punktum inne i ordet illustrerer stavelsesgrense.

Bøyningsformer

Det er vanskelig å finne bøyningsformer, men det er ikke urimelig å påsta at redupliserte former som «dsjidjsi» og «gogo», som hvis de er utviklet fra «dsji» og «go», uttrykker bøyning på en eller annet måte (flertall av substantiv, komparativ av adjektiv/adverb, tempus av verb).

Setninger

Teksten inneholder 13 setninger slik jeg oppfatter det ut fra intonasjonsforløpet under lesinga. Det er altså stort sett en setning per side, men side 3 og 5 har to setninger.

Grammatikk

Det er vanskelig å finne en grammatisk struktur i teksten, altså å lokalisere ledd som subjekt, verbal og så videre. Den første setninga på side 5 inneholder imidlertid en stigetone som jeg tolker som spørsmål. Inneldningen på den første setningen på side 5 er ellers nesten en kopi av teksten på side 1, så hvem vet hva som ligger i «dsji gå geʔ gagá?»

Setningslengde

Det er 13 setninger med fra 4 til 9 ord. Gjennomsnittet er på 6,7 ord.

Lesbarhet

Hvis en analyserer det skriftlige uttrykket for teksten finner en at lesbarhetsindeksen (LIKS) er 10, noe som kvalifiserer teksten som «veldig lettlest», noe som er naturlig siden det bare er ett ord med 7 bokstaver.

Vokabular

Totalt er det 87 ord i teksten, og en finner 46 unike ordformer og et type/token ratio på 0,53, en verdi som ligger litt under hva en kilde oppgir for barnebøker, men her har jeg ikke gjort gode nok undersøkelser. Selv om noen få ord blir gjentatt svært ofte («gå» sies 13 ganger og «go» 11 ganger), og det faktum at noen ord er reduplisert, viser teksten er rikt utvalg av ordformer. Hvis en ser dette fra motsatt synsvinkel kan en si at omtrent hvert annet ord i teksten må være nytt, og evnen til å konstruere dem på direkten vitner om språklig innsikt og kreativitet.

Ulike språk?

Bruksanvisningen han leser fra er faktisk på flere språk, og det sitter en voksen på siden som kommenterer at lesningen er på flere språk, men kan en si at det er flere språk som kommer til uttrykk? En kan ikke referere til grammatiske trekk og kikke etter ordstilling, det er også vanskelig å bruke bøyningsformer. Det ser imidlertid ut til at det er noen kvalitative brudd i teksten hvis en kikker på lydverket:

  1. gå gå gå gei dsjidsji.
  2. gå gå gå gå gå gå dsjidsji dsjidsji ga gå fe de.
  3. då tə ʀedi tetowet. ˈBaa ‘kekə ‘geen.
  4. te ti eti te te te te te teete.
  5. go go go ge dsjidsji dsji gå geʔ gagá? E jåike ðæ jåike.
  6. ʔu keike tjə tjæ koo ˈkəə kəə sååte.
  7. go go go go dsji dsji dsji gaa-a kowei.
  8. ʔe  gogo dsju gavei.
  9. go go gi ga gapwei.
  10. go go ga pi ti dsji.
  11. gå gå gå ga tjitji ka pi ˈgei.

Siste setning i 5. er avvikende fra de foregående og settes i kursiv. 8-9 grupper seg ut far siste ord i hver setning, og dermed blir de forskjellig fra 10-11 som også kursiveres.

Hvis det er slik at intensjonen var å lese på forskjellige språk, har han lyktes i ganske stor grad siden det ser ut til å være 5-7 ulike mønster avhengig av om regner inn de kursiverte delene eller ikke. Skiftet av språk i 5. er ikke godt motivert (hvis det da ikke er et skifte fra et språk til et annet på en side, og det kan jo godt skje). Skiftet av språk mellom 9. og 10. er kanskje sannsynlig, men finnes ulikhetene i slutten av setningene. Kanskje språkene er like nærliggende som norsk og svensk?

 

Slik kan en la seg imponere – og forføre – av språkkompetanse hos de svært unge!

Dialektskam i Østfold

Nils Ole Oftebro fra Sarpsborg var nettopp på besøk hos Vegard Larsen fra Sarpsborg ”I Larsens leilighet”. I denne programserien fra NRK blir en rekke skuespillere intervjuet om sin karriere. Stemningen under åpningssekvensen er gemyttlig, og det hele starter på sarpborgsdialekt:

Larsen: Det er bælkoselig å ha deg her i leiligheten.
Oftebro: Ille hyggelig å være her,du, det må jeg få lov til å si.
Larsen:Det blir preking i hele kveld.
Oftebro:Vi [uklart] å preke sarping i hele kveld. Vi kan godt gjøre det hvis du vil.
Larsen:Hahaha, ja da blir dem fornøyd i Sarp iallfall.

Begge er smilende og ler mens dette skjer. Det ser nesten ut som latteren skal unnskylde  dialektbruken. Men så er det slutt. Samtalen dreier i retning av Oftebros skuespiller-karriere og talemålsgrunnlaget endres en umarkert østlandsdialekt, noen vil kalle det standard østnorsk, andre Oslo-dialekt.

Et stykke ut i programmet, når Oftebro skal fortelle om bakgrunnen for at han ble skuespiller, bringes sarpborgsdialekt inn igjen. Larsen spør om ikke Sarpsborg er en pen by,  og litt nølende svarer Oftebro at byen var penere under hans oppvekst. Denne kritikken kompenserer han imidlertid ved å si ”… [men] østfoldialekten er jo en av dem finaste dialektene i Norge, det må jeg få lov til å si altså.” Larsen, som så langt har sett direkte på ham,  lukker øynene, trekker pusten, løfter opp øyenbrynene. En kunne mistenke ham for å la hyggelige minner passere revy, men det ser heller ut som han tenker ”snakk for deg selv”. Oftebro ler når han skryter av østfoldialekten, og noen blant publikum ler i bakgrunnen. Oftebro forteller fra prøver med Hamlet på Teaterhøyskolen der en kjent monolog fra Hamlet i hans munn fikk formen ”Å være eller inte, det er det det spørst om.” Dette var så morsomt at de andre skuespillerstudentene lo så rullet rundt på golvet. Oftebro og publikum i studio ler også mens hans forteller dette. ”For det var ikke innafor”, sier Larsen. ”Det kan du trygt si ikke var innafor”, svarer Oftebro, ”det er en viss grunn til at vi la av dialekten ganske fort!” ”Ja, dessverre”, sier sarpingen Larsen til sarpingen Oftebro og intervjuet på standard østnorsk.

Episoden står i kontrast til jeg nylig opplevde under en forestilling med Bjørn Sundquist. Da han begynte på Teaterhøyskolen i 1969, fire år etter Oftebro, fikk han kommentaren ”Kan du ikke snakke norsk, Bjørn?” Den umiddelbare responsen hans var: ”Og æ som trudde at æ hadde snakka norsk heile livet”. I sin senere karriere har Sundquist brukt sitt nordnorsk tungemål.

De fleste norske dialekter ser nå ut til ”å være innafor”, for å bruke Larsen uttrykk. Det vil si at personer med  dialektal bakgrunn kan bruke dialekt på riksdekkende sendinger. Spørsmålet er om dette gjelder østfolddialekten. Dette ble også tatt opp i en episode av Dialektriket (fra Fredrikstad). I programmet brukte man termen «dialektskam» og jeg låner den til overskriften her.

Er østfolddialekten den siste negativt merkede dialekten i Norge? Mens estetiske sider og bruksverdi ved andre dialekter diskuteres mer sjelden, har det vært et visst fokus på østfolddialekten. Professor Finn Erik Vinje har jo sagt sitt, og det har vært ulike reaksjoner på utspillene hans. Når vil østfolddialekten være innafor?

Mellombar

Jeg stod i en kioskkø og ble plutselig sendt 60 år tilbake i tida. I hylla ved kassen var det tilbud på et raskt mellommåltid. Innpakningen viser tydelig hva det gjaldt, men for meg betyr ordet noe heskjermbilde-2017-02-24-17-05-48lt annet, og det fenomenet har jeg ikke tenkt på på lenge. Da jeg som barn kom inn etter å ha vært ute og lekt i snø, regn eller vind (også kalt «Guds gode været»), hendte det seg at moren min ble bekymret fordi jeg kom inn «mellombar» eller «mejllabær» som hun min sa. Jeg kom med andre ord inn i en tilstand der skjorte og underskjorte hadde glidd ut av buksa slik at mageskinnet ble bart. Norsk ordbok forklarer det på denne måten under oppslagsordet «mellomberr»: «(om klednad) som har glipe (1a) mellom kledeplagg (slik at huda er berr)».

Det som litt bekymringsverdig på 1950-tallet, har nå en helt annen status. Norsk ordbok) sier at det «no er det mote blant unge jenter skjermbilde-2017-02-24-17-10-35å gå mellomberre om magen». 

Før gav dette litt lufting for en svett kropp, men det hendte at det kunne bli kaldt.

Jeg kjøpte en banan og et eple.

ja

Jeg har hørt dette mange ganger før, men i dag kom det i løpet av kort tid (100 sekunder) så mange eksemplarer av fenomenet at det kan være interessant å se på hva som skjer. Heidi Weng ble intervjuet av NRK etter at hun inntok lederposisjon i Tour de Ski. Intervjuet var i prinsippet som alle andre intervju med idrettsutøvere like etter en konkurranse. Det interessante er at Weng i sine svar bruker «ja» på en bestemt måte. Jeg har også hørt «ja» brukt slik av ulike personer i ulike sammenhenger. Det er altså snakk om et «ja» som settes inn i ytringer uten å ha den bekreftende funksjonen som «ja» har når ordet er et positivt svar på et ja/nei-spørsmål.

Når «ja» brukes slik det er vist nedenfor, har det i tillegg en litt annen uttale enn hva det har som svarord. I alle tilfellene nedenfor er ordet uttalt med kort /a/ – altså /ja/, som er ulik formen en i svarordet «ja», som normalt er uttalt med en lang /a:/ – /ja:/    I tillegg er det slik at «ja» eksemplene nedenfor ikke høres ut til å ha trykk. Utover dette kan uttalen variere litt mer. Hos noen kan «ja» ende med en glottal plosiv [jaʔ] eller være med et tydelig pust mot slutten – [jah]. Intonasjonen og en liten pause markerer tydelig at ordet ikke er knyttet direkte til utsagnet foran som i for eksempel «Den var fin, ja.» Slik jeg prøver å uttrykke dette i skrift, er det heller «Den var fin. Ja«, og da med et kort, trykksvakt /ja/, [jaʔ] eller[jah].

Se på utdragene fra intervjuet med Weng:

  1. … Jeg var ikke så på hugget i starten, og hørte at jeg var mange sekunder bak, og … Ja. Og plutselig tenkte … var det sånn at jeg måtte skjerpe meg litt og fikk opp farta.
  2. … Det her var min desidert beste dag.  Ja. Padling gikk jeg veldig bra, synes jeg, og ble veldig stiv når jeg dobbeldansa, men alle blir stiv så …  Ja. Jeg taper veldig, veldig mye på slutten, og det er egentlig bare nedover, så…
  3. Jeg kan liksom ikke skjønne at jeg gikk så sakte på på slutten heller, så  … Ja. Jeg veit ikke riktig helt.
  4. Selvfølgelig var jeg litt stiv på slutten, men det er vel alle, så jeg … Ja. Jeg kan ikke helt skjønne det.
  5. Det var varmt i sola, og i skyggen var det kaldt, men … Ja. Jeg hadde min desidert beste dag i dag, og … Ja. Litt overraska over at jeg ble slått med så mye på slutten.

Hvilken funksjon har «Ja» her? Det er åpenbart at det ikke er et svarord. En kunne tenke seg at var en parallell til et «eh», dvs. et slags uttrykk for nøling?

Kikker en på hvor «ja» dukker opp (i disse eksemplene), ser en at det opptrer etter konjunksjonene «og, så, men» med unntak av et tilfelle (2.1). Uten at jeg har svar på hva som skjer, vil min hypotese være at «ja» her signaliserer at det etter ordet vil komme en slags oppsummering. Intervjuobjektet kommer med et lengre utsagn, og dette understøttes med en utfyllende kommentar som samtidig uttrykker at «slik er det».

Slik ser jeg det – inntil videre.

Skriveregler

På denne websiden ligger en del skriveregler som også kan være greie å referere til når en skriver norsk.

  1. Avstå fra alliterasjon. Alltid.
  2. Preposisjoner er ord som du ikke skal slutte setninger med.
  3. En må få med seg alle ordene når en leter etter måter å uttrykke seg elegant og ordrikt.
  4. Å skille partisippet fra hjelpeverbet, må, hvis det ikke er spesielle og dyptgripende grunner for det motsatte, unngås.
  5. Unngå klisjeer som pesten.
  6. Ikke bruk ampersand & forkortelser osv.
  7. Ikke bruk for mange utropstegn!!
  8. Ikke bruk komma, overflødig.
  9. Bruk apostrof etter Språkrådets’ regler.
  10. Å sette et komma mellom subjekt og predikat, er ikke korrekt.
  11. Unngå bemerkninger i parentes (selv om de er relevante).
  12. Ord som står i parentes kan hvis det er en bedre løsning også settes mellom to komma.
  13. Det er ikke elegant å ikke la infinitivsmerket stå sammen med infinitiven.
  14. Det passer sig ikke å bruke gammelmodige ord og vendinger.
  15. Sammentrekninger er’ke nødvendige.
  16. Utenlandske ord og uttrykk er ikke adekvate.
  17. Unngå komplekse ordsammensetningskonstruksjoner.
  18. Plasser anaforiske pronomen så nært som mulig, særlig i komplekse og lange setninger med ti ord eller mer, sine antesedenter.
  19. Man må aldri generalisere.
  20. Når De henvender Dem til leseren, bør De unngå ordformer som er gått ut av bruk.
  21. Unngå sitater. Som Ralph Waldo Emerson en gang sa: «Jeg hater sitater. Fortell hva du kan.»
  22. Ikke gjenta deg selv, eller si på nytt eller repeter det du nettopp har sagt.
  23. Pass på at du alltid tar på bruk korrekte uttrykksmåter.
  24. Sammenligninger fungerer like dårlig som klisjeer.
  25. Bruk ikke flere ord enn høyst nødvendig. Slik sløsing er totalt overflødig.
  26. Sky bannskap som faen.
  27. Vær mer eller mindre spesifikk.
  28. Underdrivelser er alltid best.
  29. Overdrivelser er en million ganger verre enn underdrivelser.
  30. Ettordsetninger? Avstå.
  31. Ingen setningsfragmenter.
  32. Ikke bruk lange ord når diminutive alternativer er bedre.
  33. Analogier i tekster er som en slange med fjær.
  34. Passiv bør unngås.
  35. Gå som katten rundt den varme grøten for ikke å bruke for mange ordtak.
  36. Ta tyren i hånda og unngå å blande sammen uttrykk.
  37. Hvem trenger retoriske spørsmål?
  38. Bruk retteprogram for å ungå skrivefeil.
  39. Forhåpentlivis vil du skrive korrekt selv om mange andre dessværre skriver feil.
  40. Les nøye gjennom for å om noen ord er falt ut.
  41. Skriv på norsk og bruk adekvate synonymer.
  42. I forhold til ord og uttrykk må du vokte deg for «forholdismen».
  43. Kontroller at du alltid avslutter det du

Verktøy 5: Konkordans

Noen ganger trenger en å finner ut hvilke ord som omgir et aktuelt ord. Hva kommer foran, og hva kommer bak? Da kan en bruke et såkalt konkordansprogam. Det ligger et slikt på http://www.lextutor.ca/conc/text/. Prosedyren er enkel. Kopier teksten du vil ha analysert og lim den inn i boksen på den aktuelle siden. Trykk på SUBMIT, og straks publiseres resultatet i to rammer. Rammen til venstre viser alle ord i teksten i alfabetisert rekkefølge. I en parentes står et tall som viser hvor mange gange ordet er brukt i teksten. I rammen til høyre finner en teksten. Formatet er slik det er vist nedenfor. Tallet viser til linjenummer i analyseresultatet.  Midt i rammen er alle ordene i teksten listet opp i alfabetisk rekkefølge (linjene er ganske lange, og av jeg viser bare deler av hver linje). Her er det ordene som omgir «OG» som er opplistet. Oppslagsordene danner en slags alfabetisert søyle i fet skrift midt i teksten. Ved å klikke på ord i venstre ramme, eller ved å rulle opp og ned i det høyre vinduet, kan en finne ordet en leter etter.

Dina håndball Hun spiller på jentelaget i Fjordvik OG de har trening på mandag og torsdag
for å kaste enda hardere Håndball er en tøff sport OG det er ganske lett å bli skadet Din
somste idretten I håndball bruker hun hele kroppen OG det liker hun Det er viktig å ha st
e bare muskler og kondisjon Taktikk er også viktig OG Dina må bruke hodet når hun spiller

 

Vinduet på konkordanssiden er ganske mye større enn det som kan vises her.

 

Skjermbilde 2016-06-05 18.00.54

Setningene som viser omgivelsene som «OG» opptrer i, er vist i framstillingen nedenfor (noe redigert av plasshensyn).

En kjapp kikk på de fire linjene over viser at «OG» binder sammen helsetninger. I setning 1, 2, 4 innledes neste setning med subjektet, i setning 3 er det objektet som kommer først, og setninger er invertert siden V2-regelen må brukes her. EN liste over alle «OG» gir et mer nyansert resultat. Vi bruker følgende fargekode:

  • Grønt: Dideordnede helsetninger og helsetning (linje 193)
  • Lilla: Sideordnede nominalledd
  • Blå: Sideordnede verb + adverb
  • Brun: Idiomatisk uttrykk (kan også tolkes som sideordnede preposisjoner)
  • Rød: Opprinnelig helsetning med strøket subjekt
 
188.   Hun spiller på jentelaget i Fjordvik OG de har trening på mandag og torsdag Dessuten spiller de ofte kamp i helg 
189.   da hardere Håndball er en tøff sport OG det er ganske lett å bli skadet Dina har slått seg noen ganger men det h 
190.   n I håndball bruker hun hele kroppen OG det liker hun Det er viktig å ha sterke og raske bein i håndball fordi h 
191.    og kondisjon Taktikk er også viktig OG Dina må bruke hodet når hun spiller Det synes hun er interessant Den stø 
192.   lDerfor må hun også ha sterke lunger OG god kondisjon Hun er veldig flink til å kaste ballen med den høyre armen 
193.   pene sine Dina har alltid vært aktiv OG har alltid holdt seg i form Hun har prøvd forskjellige idretter men hånd 
194.   in i håndball fordi hun må løpe fort OG hoppe høyt Derfor må hun også ha sterke lunger og god kondisjon Hun er v 
195.   un Men håndball er ikke bare muskler OG kondisjon Taktikk er også viktig og Dina må bruke hodet når hun spiller  
196.    spillerne er kjempeflinke De er til OG med olympiske mestere! Kanskje kan hun representere Norge i OL om noen å 
197.    liker hun Det er viktig å ha sterke OG raske bein i håndball fordi hun må løpe fort og hoppe høyt Derfor må hun 
198.   Fjordvik og de har trening på mandag OG torsdag Dessuten spiller de ofte kamp i helgene Hun liker veldig godt å  
199.   k fordi alle jentene er veldig greie OG treneren er kul Hun har spilt håndball i seks år men Fjordvik er mye bed 

Verktøy 4: Vokabular: Oversikt over ordmaterialet

Hvilke andre bearbeidelser enn dem som er nevnt under Verktøy 2 kan en gjøre med tekster?

Ressursene som omtales nedenfor finnes på ulike nettsteder. Vi tar utgangspunkt i siden om lesbarhetsindeks – lix.se. En finner også noe av det samme på skriftlig.no, men ikke alt. I den videre presentasjonen av ulike verktøy tar jeg utgangspunkt i et tidligere blogginnlegg om stedsnavnet Matstia. Teksten er mindre viktig i denne sammenhengen.

Når en sitter med en tekst som skal tilpasses en bestemt målgruppe, for eksempel personer som skal lære seg norsk, vil det være viktig å analysere teksten med hensyn til bestemte språktrekk. Hvor mange or har teksten totalt? Hvor mange forskjellige ord er det i teksten? Hvor mange lange ord inneholder den? Hvor er lang er setningene?

Den aktuelle teksten har fått liksverdien 35. ( 745 ord fordelt på 53 setninger gitt gjennomsnittlig setningslengde på 14,06 ord. 152 av ordene, 20,4 prosent,  har mer enn seks tegn. Liksblir 20,4+14,06=34,46. Avhengig av hvilken avrundingsmetode en bruker vil liksen bli 34 eller 35.

 

Hvordan lage liste over setninger?

Dette kan en gjøre i Word (søke etter punktum, og så erstatte det med punktum+ linjeskift for å få setningene listet under hverandre. En enklere måte er å gå til http://textanalysisonline.com/nltk-sentence-segmentation og lime inn teksten der. På et øyeblikk er alt klart i en egen kolonne som en kan kopiere over i det tekstbehandlingsprogrammet en bruker.

 

Hvordan lage liste over ord?

Både den norsk og svenske gir denne informasjonen direkte i og med at enkeltordene listes opp med dubletter fjernet. Totalt er det 354 forskjellige ordformer i teksten. Analysen tar imidlertid ikke høyde for at et og samme ord opptrer i ulike bøyningsformer. De ti mest frekvente ordene er:

 

Nr Ord Antall
1 det 29
2 i 23
3 en 22
4 er 19
5 navnet 18
6 16
7 av 15
8 et 15
9 som 15
10 og 14

Det er flere måter å renske ut bøyningsformer på. Metoden som følger her er litt omstendelig, men den er ikke komplisert. Fra den svenske lixsiden kopieres de tre kolonnene i Frekvensordlista over til en tekstbehandler, f.eks. Word. Marker kolonnene «Nr» og «Ord» og slett dem (først den ene kolonnen, så den andre). Marker den gjenstående kolonnen med ord, gå til Tabell og velg Konverter tabell til tekst, velg at ordene skal skilles med avsnittsmerking. Ordene står nå i samme rekkefølge som før, men de er frigjort fra tabellformatet. Det kan hende at noen av ordene er tilknyttet spesialtegn  som hermetegn eller bindestrek. Velg Søk/erstatt og søk etter det aktuelle tegnet og erstatt det med ingenting. (Vær oppmerksom på at bruk av spesialttegn påvirker ordtellingen. Et og samme ord ±hermetegn telles som to ord. Det beste hadde altså vært å fjerne slike tegn før en gjorde liksanalysen.) Marker så hele kolonnen med ord (Ctrl-A), gå til Tabell og velg Sorter. Ordene er nå sortert alfabetisk. Hvis det var tall i teksten, står de øverst. Slett dem. De første ordene i min liste er

alta
alternativ
alternative
altså
andre
annet
antall
at
av

Nå kan strykingen av bøyningsformer begynne. Det er spørsmål som dukker opp akkurat i denne listen. Det ligger i kortene at «alternativ» og «alternative» er samme ord, men hva med «annet» og «andre»?  «Andre» kan være flertallsformen av «annet» (og annen, anna) og slik må de to regnes som samme ord. «Andre» kan også være ordentallet («første, andre») og da må det regnes som et eget ord. En må altså sjekke teksten for å se hva slags ord en har med å gjøre (jeg kommer tilbake i et annet blogginnlegg med et nyttig verktøy). En gjennomgang av teksten viser at den inneholder 298 unike ord (med forbehold for feil etter en rask gjennomgang). Da er egennavn og forkortelser tatt med. Liksanalysen oppgir et såkalt type/token-forhold på 47,5 prosent. Dette tallet får en ved å sjekke antall forskjellige ord sett i forhold til alle ordene i teksten. Dette tallet øker altså når flere uker ord brukes. Store tall viser altså tekser med stor variasjon i ordforrådet. Etter å fjernet bøyningsformer av ord, faller naturlig dette tallet. I den aktuelle teksten er det på 40 prosent. Lix.se oppgir også to andre måter å regne ut variasjon på: OVIX (ordvariationsindex) og OVR (ordvariationsratio). Jeg går ikke inn på disse her. Formlene finnes på siden.

Noen av verktøyene som beskrives nedenfor gjør lignende operasjoner, noen av dem på enklere måter enn dem som er listet her.

 

Prosentvis andel av hvert ord

Nettstedet Textmechanic.com gir mulighet til å få tall på hvor hyppige de ulike ordene opptrer regnet i absolutte tall og prosent. Kopier inn teksten, trykk på knappen og tallene er klare. En får også opplysninger om hvor mange bokstaver og ord teksten inneholder i tillegg til antall setninger.

 

Hvordan sortere etter ordlengde?

Hva så med sortering etter lengde? På siden http://appincredible.com/online/list-sort/ kan man lime inn tekst og be om å få innholdet sortert etter lengde. Resultatet ser slik ut hvis en velger fra korteste til lengste:

a a i i i i i i i i i i i i i i i i i i i i i i i at at at at at at at at at at at av av av av av av av av av av av av av av av da da da da de de de de ei ei en en en en en en en en en en en en en en en en en en en en en en er er er er er

Ber en om en liste som viser ord fra lengst til kortest ser listen slik ut:

stedsnavnregister omfortolkninger landskapsformer landskapsformer facebooksidene sandnesjentene ruoššaluokta norskspråklig sandnessjøen sandnessjøen sandnessjøen rettskrivning

Dette er nyttig, men det krever ekstra arbeid for å få alt på plass slik at kan se nærmere på vokabularet. For det første vil en gjerne har ordene ordnet i kolonner. Den enkleste måten å gjøre dette på her er å kopiere teksten inn i Word, søke etter mellomrom og så erstatte mellomrommet med avsnittsmerke. Da kommer ordene under hverandre slik:

stedsnavnregister
omfortolkninger
landskapsformer
landskapsformer
facebooksidene
sandnesjentene

Det ser ut til at ord nr. 2 har kortere utstrekning enn nr. 3, men det er faktisk ikke kortere. Avviket kommer av at bokstavene i fonten er av ulik utstrekning. Dersom en bytter til en font der alle bokstaver har samme utstrekning horisontalt, f.eks. Courier, blir resultatet slik:

stedsnavnregister
omfortolkninger
landskapsformer
landskapsformer
facebooksidene
sandnesjentene

Da ser en at ord 2-5 faktisk er like lange, dvs at de har like mange bokstaver.

Listen viser at vi ikke er kvitt dubletter. De kan en enkelt få bort ved å gå til http://www.tracemyip.org/tools/remove-duplicate-words-in-text/ og kopiere inn teksten. På dette nettstedet kan en få den ferdig teksten sortert alfabetisk (forlengs og baklengs) eller i original rekkefølge. Hvis en limer inn ordene som er sortert etter lengde (jf. prosedyren ovenfor), vil en få ut en liste med enkeltforekomster etter fallende ordlengde.

stedsnavnregister omfortolkninger landskapsformer facebook-sidene sandnesjentene ruoššaluokta norskspråklig sandnessjøen rettskrivning nyfortolkning gjeterguttene

Ordene er ikke sortert som kolonne, prosedyren for å få det til er angitt ovenfor.

stedsnavnregister
omfortolkninger
landskapsformer
facebooksidene
sandnesjentene
ruoššaluokta
norskspråklig
sandnessjøen
rettskrivning
nyfortolkning
gjeterguttene

Etter dette gjenstår det bare å slette bøyningsformer (jf. ovenfor).

Verktøy 3 – Google fight

Jeg har nevnt Google fight tidligere på bloggen, men siden jeg holder på med en liste over verktøy for skrivelystne nå, tar jeg det med her også. Dersom du ønsker å finne hvilket av to alternative uttrykksmåter som er mest frekvent, kan du sette dem opp mot hverandre på http://www.googlefight.com.

Nedenfor er frekvensen av ordformene «colour» og «color» i henholdsvis engelsk og amerikansk versjon av Google (det kan velges mellom 20 språk, ikke norsk).  Figurene viser hvilke former som er mest brukt (britisk engelsk – «colour»), amerikansk engelsk –  «color». I tillegg ser en hvor ofte den andre ordformen opptrer. Talluttrykket er i prosent.