Verktøy 3 – Google fight

Jeg har nevnt Google fight tidligere på bloggen, men siden jeg holder på med en liste over verktøy for skrivelystne nå, tar jeg det med her også. Dersom du ønsker å finne hvilket av to alternative uttrykksmåter som er mest frekvent, kan du sette dem opp mot hverandre på http://www.googlefight.com.

Nedenfor er frekvensen av ordformene «colour» og «color» i henholdsvis engelsk og amerikansk versjon av Google (det kan velges mellom 20 språk, ikke norsk).  Figurene viser hvilke former som er mest brukt (britisk engelsk – «colour»), amerikansk engelsk –  «color». I tillegg ser en hvor ofte den andre ordformen opptrer. Talluttrykket er i prosent.

/ç/ vs /ʃ/ – litt om kje- og sje-lyden

Jeg havnet i en diskusjon forleden om sammenfallet mellom kje- og sje-lyden som skjer blant unge (se f.eks. dette innlegget). Mange er bekymret og klager på barn og ungdoms «munnslapphet». Jeg følger interessert med i prosessen og er glad for å få oppleve en større språkendring. En av samtalepartnerne var bekymret over at ord falt sammen i en form «kyss» og «skyss» kommer til å høres ut som «skyss» begge to. Argumentet mitt om at språket var fullt av likelydende, eller homofone, ord som høy (adj) – høy (tørket gras) lav (adj) – lav (mat for rein) vise (verb) – vise (subst) ble ikke tatt særlig alvorlig. Da jeg i tillegg påstod at antallet par ikke var så stort fikk jeg motbør. På spørsmål om hvor mange slike par det fantes i norsk ble jeg svar skyldig. Det foresvevde meg at jeg hadde hørt i Petter Schervens program «Typisk norsk»  at antall var rundt 20. Samtalepartneren påstod at antall var langt høyere. «Hundrevis?» spurte jeg. «Neppe så høyt», var svaret. En sjekk i  boka «Typisk norsk» viste 22 par. Dette er kanskje de samme som Arne Torp viser til i en artikkel fra 1999 (nevnt her). Antallet skal gjelde østnorsk. Litt fabulering rundt disse ordene førte til at jeg fant flere. Bokmålsordboka stod i bokhylla, og en halvtime senere satt jeg med følgende liste på over 70 ord:

  1. keik sjeik
  2. keiser skeiser
  3. keiv skeiv
  4. kikk chic
  5. kikk skikk
  6. kildre skildre
  7. kile Chile?
  8. kille skille
  9. kinker skinker
  10. kinn skinne
  11. kinne skinne
  12. kip skip
  13. kipe skipe
  14. kiper skiper
  15. kipper skipper
  16. kis skis
  17. kis skis
  18. kitt skitt
  19. kive skive
  20. kjangse sjanse
  21. kjappe sjappe
  22. kje skje
  23. kjede skjede
  24. kjefte skjefte
  25. kjei skei
  26. kjekk sjekk
  27. kjel sjel
  28. kjele skjele
  29. Kjell skjell
  30. kjeller skjeller
  31. kjemme skjemme
  32. kjenne skjenne
  33. kjenning skjenning
  34. kjensel skjensel
  35. kjepper skjepper
  36. kjerr skjerr
  37. kjerv skjerv
  38. kjette sjette
  39. kjeve skjeve
  40. kjip skip
  41. kjoks sjokks
  42. kjuke sjuke
  43. kjær skjær
  44. kjære skjære
  45. kjød skjød
  46. kjøen sjøen
  47. kjøl sjøl
  48. kjønn skjønn
  49. kjøre skjøre
  50. kjøter skjøter
  51. kjøtt skjøtt
  52. kjøv skjøv
  53. kylle skylle
  54. kylling skylling
  55. kynd skynd
  56. kynne skynde
  57. kyr skyr
  58. kyss skyss
  59. kyt skyt
  60. kyte skyte
  61. kytte skytte
  62. tja sjah
  63. tjære skjære
  64. tjau sjau
  65. tjeld skjell
  66. tjene skjene
  67. tjo sj
  68. tjønn skjønn
  69. tjor jour?
  70. tjor skjor
  71. tjuende sjuende*? (kommentar nedenfor)
  72. killing schilling? (kommentar nedenfor)
  73. kjøttet skjøtte? (kommentar nedenfor)

Listen inneholder ordpar som er identiske med hensyn på uttale, men ikke når det gjelder skrivemåte, se f.eks. 29 Kjell – skjell og 65. tjeld – skjell. Antallet par vil derfor varierer avhengig av de kriteriene en legger til grunn når en teller. Det samme gjelder 69 og 70.

Det er ikke vanskelig å forlenge listen. Litt mer graving i Bokmålsordboka vil nok gi flere par. I tillegg kan en

  • bøye ord og ende med par som «kjent  – skjent»
  • trekke fra infinitivsendelsen -e og lage imperativer som «kjeft – skjeft»
  • lage passivformer som «kives – skives»
  • henge på genitivs-s «kjøds – skjøds» og så videre.

Antallet par i norsk er nok større enn dette. Jeg forventer at en granskning av Nynorskordboka vil gi par som en ikke finner i bokmålet . I tillegg finnes det helt sikkert en rekke dialektformer som for eksempel «kjægLæ – skjægLæ» («L» står for «tjukk l»). De tre siste parene i lista er merket med spørsmålstegn. Det skyldes at ordene har forskjellige tonelag. Hvis en også tar med slike par, altså par der det er to forskjeller mellom ordene: (1) sje/kje (2) tonelag, øker også antallet. Ordparet «tjuende – sjuende» har samme tonelag slik jeg sier det, andre har tonelagsforskjell her, så derfor er det merket med *.

Dersom noen finner andre par enn dem som står her, er jeg takknemlig for tilbakemelding.

PS 03.06.15: Noen tilbakemeldinger er kommet, så listen er modifisert litt fra den opprinnelige. I tillegg er den alfabetisert etter ord som begynner på kje-lyden med unntak av spesielle ordpar, som er stilt opp til slutt.

Uttaleregler – transkripsjon

Uttaleregler – transkripsjon

På sprak.nrk.no ligger det ei liste som angir uttale av norske stedsnavn. Det er ingen direkte lenke dit, men en finner oppslagene om en søker i feltet øverst på nettsiden. En får da se hvordan stedsnavn er tilrådd uttalt i NRK. I tillegg vises oppslag i NRKs gamle stadnamnarkiv fra rundt 1960. Dette arkivet har tilrådd uttale for 2000 ulike stedsnavn i Norge. I tillegg til å finne tilrådd uttale, kan en finne eksempler på at uttalen av navn har endret seg de siste 55 årene ved at en annen uttale er angitt i tekst på selve nettsiden. Arkivet fra fra 1960 foreslår følgende uttale for «Oslo»: Skjermbilde 2015-05-27 kl. 11.41.34veiledningen til siden heter det at uttalen er markert på to måter. I svart finner man uttale vist med «normale» bokstaver. I rødt finner en markeringer med spesialtegn (i lydskriften Norvegia), tonelagsmarkering og enkelte andre tegn. Trykk skal være markert med understreking. Aksenttegnet  indikerer at ordet har tonelag 1. Tonelag 2 markeres med . En merker seg at den foreslåtte uttalen av «Oslo» i 1960 var med med /s/. Trykkplasseringen er ikke markert med understreking, men en kan utlede hvor trykket er plassert ved å se på  tonelags-markeringen. Den er satt etterstavelsen med trykk. (Mer eksplisitt trykkmarkering er kanskje unødvendig her.) På den nye nettsiden er det oppgitt to  måter å si ordet på:  /osj`lo/ eller /os`lo/.

Skjermbilde 2015-05-27 kl. 12.06.41

Et eksempel på trykkmarkering ved hjelp av understreking finner en for «Flatanger». I lydskriften finner en et tegn som angir ng-lyden, en med en ekstra krøll nedover. Den er skrevet to ganger. Årsaken er ikke umiddelbart tydelig,  men det kan være gjort slik med referanse til normalortografi der en finner dobbelt konsonant etter kort vokal. På den annen side er lang vokal angitt med /fla:t/ og da kunne det jo ha vært slik at fravær av kolon = fravær av lengde = kort vokal. Skjermbilde 2015-05-27 kl. 11.41.05 Det var naturlig for meg å sjekke uttaleangivelsen for navnet på hjemstedet mitt. Svaret er litt spesielt idet en finner en dobbeltskrevet /ee/ i angivelsen i Norvegia – /san`neessjøen/. Stedsnavnet «Sandnes» (Rogaland) er angitt som og /san’nes/ uten noen dobbeltskrevet /ee/ i lydskriften. Det er mulig dette skal angi en lang /e:/, men ordet uttales nok oftere med kort /e/ i andre stavelse. (Det finnes ingen ny uttaleangivelse.) Markeringen får en også til å stille spørsmål om hva navnet på stedet faktisk er. Det vi ser angitt er en slags leseuttale. Det er ikke vist at de lokale innbyggerne bruker en palatal nasal i ordet noe som skulle ha gitt en markering a la /sajn`nessjøen/, men så er nok det en uttale en sjelden hører brukt under innannonseringer på riksnettet. Jeg ble gjort oppmerksom på NRKs nettsiden i et innslag på Språkteigen 26. april 2015. Språksjef i NRK, Ragnhild Bjørge, ba der om hjelp til å sikre at navn blir korrekt uttalt på NRK. Hun var imidlertid ikke helt villig til å la lokal uttale virke styrende, for eksempel ville det være å gå for langt å uttale «Stjørdalen» som /2ʃø ̩ɖɑ:ɳ/. Det er litt merkelig all den tid at nettopp er slik stedsnavnet er anbefalt uttalt i NRK-arkivet. Skjermbilde 2015-05-27 kl. 12.37.46 Kompleksiteten og det litt uhensiktsmessige i Norvegia-transkripsjonen ser en i det som er skrevet i rødt. At uttaleangivelse ellers er vanskelig ser vi i den nye angivelsen som er angitt på nettsiden: /sørr‵da:l/ (Tegnene  og // står ikke på NRKs nettside). Her er det åpenbart at den siste markeringen er gal. I det minste bør det være en prikk under s’en i det siste ordet eller at sj-lyden angis med /sj/ eventuelt /stj/ siden akkurat den angitte uttalen var «å gå for langt».

Ortoepi

Ortoepi (av gresk orthoepeia, som igjen kommer av orthos ’riktig’ og epos ’ord’) er læren om den rette uttalen av ord i et språk. Begrepet er lite brukt i norsk. En finner det imidlertid i den norske oversettelsen av Det felles europeiske rammeverket for språk (s.142) hvor ortoepisk kompetanse defineres som den kompetansen en språkbruker må ha for å kunne resonnere seg fram til korrekt uttale på grunnlag av en skriftlig form.

Skrift en konvensjonalisert i den forstand at det er regler for relasjonen mellom tegn/tegnkombinasjoner og språklydene som tegnene representerer. Nordmenn vet at «di» skal uttales /di:/ (her er det samsvar mellom bokstav og lyd), men også at «de» skal uttale /di:/ (her mangler det et slikt samsvar når det gjelder bokstaven «e» – den står her for en i-lyd.) Bokstaven «e» kan forresten stå for mange andre lyder også. Hvilke?

Den engelske forfatteren George Bernhard Shaw (1856-1950) er kjent for å ha illustrert et ortoepisk regelbrudd ved hjelp av følgende ord: «ghoti» – som skal uttale /fiʃ/ –  ordet som normalt skrives «fish». «gh» er hentet fra «enough» der de to bokstavene står for en /f/. «o» er hentet fra «women», der «o» representerer en /i/. «ti» er hentet fra «nation» og er lyden /ʃ/. Shaws skrivemåte blir gal av flere grunner. Det to første er ikke vanlige skrivemåter, i tillegg er bokstavsekvensene plassert på steder i ordet hvor de normalt ikke opptrer.

Den vanlige oppfatningen er at engelsk har en ganske rotete når det gjelder ortografi. Ord som «heat, break, jealous, ear» inneholder alle «ea», men sekvensen uttales ulikt i de forskjellige ordene. Hva så med norsk. Vanligvis regner en med at norsk har et større samsvar mellom skrift og tale (norsk er mer ortofont (lydrett). Det gjelder selvsagt relasjonen mellom talt bokmål eller talt nynorsk og ortografien i de to målformene. I dialektene er situasjonen en helt annen. Der finnes det språklyder som en ikke er enig om hvordan skal skrives.)

Nedenfor har jeg forsøkt å bryte de ortoepiske konvensjonene i norsk ved å legge Shaws metode til grunn. Teksten er hentet fra min blogg The Famous Nomas Queen Rayo. Nedenfor står en ukommentert versjon av teksten. Under den finnes en kommentert versjon.

Den originale versjonen:

Ckø phårrand ckaccen po xupperdmarkedeg, sircka klåcha phetm pod eterdmedaggend. End ddame pot runnt førdtid, xtord mmaggeg åt letein jakeg, wentterr mmenx phamildiepharend phrempst bettalderr. Bach hendnet ctord einn mand mmet owerfylldt hannldevångnd. Pplutseldid sedterd hund kkurrwend send net åd gord enåverd ed budticend. Ndesdtemand hventterd nouend xekunnerd, xåd beijynderd hand od ldeget hvardende pot rduldebånnet. Ddammend cåmerdr telbacei åd endxserr adtt hunnd mod fårtskjeidte åt wendnteg. E einn sudtrredte, lit hisi tounet bersyller hunn mmanenn fård o had ttatt hendes pldac. Hand ingnuretrer henet. Hund stilder cei e end aneind cø.

Hjei ppaserer hende xendere uttet po parrkerringspldasend, bourtet vet bendsendpoumpened. Hunn stor camend met end ondom såmm seer: “Wedt ddu word ldenget gjeig hard wennttett? Ded qannd dda weild ickeig ttad sot lan ttit od hannlded?” Å xåd peckerd hann pod clocat. “Ded ward end phyrd xåmm cneck ed cøend, åt hann hade hanldedt mmace”, xwarte hunn.

Den kommenterte versjonen:

Ckø1 phårrand2 ckacen3 po4 xupperdmarkedeg, 5 sircka6 klåcha7 phetm8 pod9 eterdmedaggend 10. End11 ddame12 pot13 runnt14 førdtid 15, xtord16 mmaggeg17 åt18 letein19 jakeg,20 wentterr21 mmenx22 phamildiepharend23 phrempst24 bettalderr 25. Bach26 hendnet27 ctord28 einn29 mand30 mmet31 owerfylldt32 hannldevångnd33. Pplutseldid34 sedterd35 hund36 kkurrwend37 send38 net39 åd40 gord41 enåverd42 ed43 budticend44. Ndesdtemand45 hventterd46 nouend47 xekunnerd48, xåd49 beijynderd50 hand51 od52 ldeget53 hvardende54 pot55 rduldebånnet56. Ddammend57 cåmerdr58 telbacei59 åd60 endxserr61 adtt62 hunnd63 mod64 fårtskjeidte65 åt66 wendnteg67. E68 einn69 sudtrredte,70 lit71 hisi72 tounet73 bersyller74 hunn75 mmanenn76 fård77 o78 had79 ttatt80 hendes81 pldac82. Hand83 ingnuretrer84 henet.85 Hund86 stilder87 cei88 e89 end90 aneind9192 .

Hjei93 ppaserer94 hende95 xendere96 uttet97 po98 parrkerringspldasend99, bourtet100 vet101 bendsendpoumpened.102 Hunn103 stor104 camend105 met106 end107 ondom108 såmm109 seer110: “Wedt111 ddu112 word113 ldenget114 gjeig115 hard116 wennttett117? Ded118 qannd119 dda120 weild121 ickeig122 ttad123 sot124 lan125 ttit126 od127 hannlded?128” Å129 xåd130 peckerd131 hann132 pod133 clocat134. “Ded135 ward136 end137 phyrd138 xåmm139 cneck140 ed141 cøend,142 åt143 hann144 hade145 hanldedt146 mmace”,147 xwarte148 hunn.

Retningslinjer for tolkning av teksten:

Tallet etter hvert ord ovenfor viser til fotnoter. Hvert av de første 25 ordene i teksten er illustrert med ord hvor den aktuelle bokstavsekvensen illustrerer lyden det er snakk om. Deretter kommer bare ord som viser sekvenser som ikke er omtalt tidligere.  Den originale teksten inneholder ikke alle mulige tegnkombinasjoner i norsk. Sje-lyden (som i «skjære, ski, sjanse») kan for eksempel skrives på minst 15 måter på norsk. Originalteksten inneholder for få tilfeller av denne lyden til at alle variantene kan brukes.

I fotnotene nedenfor viser første oppføring med svart skrift til en aktuell tegn/tegnsekvens i ordet fotnoten viser til. I skråstrek vises så språklyden som tegn/tegnkombinasjonen representerer (lyden er angitt med lydskrift – IPA). Etter bindestrek står et ord korrekt skrevet hentet fra Bokmålsordboka hvor den aktuelle sekvensen er brukt og markert med rødt.

1. ck – /k/ – rock
2. ph – /f/ – philos., å – /a/ – vått, rr – /r/ – verre, nd – /n/- land
3. ck – /k/ – rock, c – /s/ – cirka
4. o – /å/ – kott
5. x – /s/- xylofon, p – /p/ – topp, r – /r/ – bord, g – (stum) – billig
6. s – /s/- se, ck – /k/ – rock
7. å – /å/ – vått, ch – /k/ – dachs
8. ph – /f/ – philos., t – (stum) – (hus)et
9. o – /å/ – kott, d – (stum) – med
10. t – /t/- at, r – /r/ bord, i – /i/ – de, d – /d/ lede, gg – /ɡ/ – legge, n – /n/ – land
11. n – /n/ – land
12. dd – /d/ – hadde
13. o – /å/ – kott, t – (stum) – (hus)et
14. nn – /n/ – vinn
15. rd – /r/ – bord, d – (stum) – med
16. x – /s/ – xylofon, rd – /r/ – bord
17. mm – /m/ – samme, gg – /ɡ/ – legge, g – (stum) – billig
18. t – (stum) – (hus)et
19. e – /i/ – de, ei – /e/ – beige
20. k – /k/ – rekke, g – (stum) – billig
21. w – /v/ – watt, tt – /t/ – lett, rr – /r/ – verre
22. mm – /m/ – samme, x – /s/ – xylofon
23. ph – /f/ – philos., ld – /l/ – kald, n – /n/ – land
24. ph – /f/ – philos., ps – /s/ – psykolog, 
25. tt – /t/ – lett, ld – /l/ – kald, rr – /r/ – verre
33. ng – /ŋ/ – sang, n – /n/ – land
35. dt – /t/ – midt
44. dt – /t/ – midt, c – /k/ – chic
46. hv – /v/ – hva
47. ou – /o/ – journalist
50. j – /j/ – ja
58. rdr – /r/ – Hardråde 
62. dtt – /t/ – tungbedtt
65. rtskj -/ʈʃ/ – bortskjemt
74. rs – /ʃ/ – vers
93. hj – /j/ – hjelpe
108. n – /ŋ/ – bank
115. gj – /j/ – gjerne
119. q – /k/ – quiz

Navn på latvisk

nesbeEn reise til utlandet gir rike muligheter til å utvide kunnskapshorisonten. En måte å gjøre dette på er å besøke bokhandler. Da jeg i Riga for en tid siden, kunne jeg ikke la sjansen gå fra meg. Latvisk er et språk som ligger langt fra norsk. Det skrives med det latinske alfabetet, og de eneste ordene en kjenner igjen, er de som tilhører det internasjonale vokabularet.

Besøket på bokhandelen kom til å avsløre en spesiell og interessant side ved språket. En titt i bestselgerhyllene viste at forfattere som Dens Brauns, Henri Kisindžers og Maikls Mūrs ble lest av mange. Det var ikke før jeg stavet meg gjennom det siste navnet at jeg forsto hvordan man skriver utenlandske navn på latvisk. Det korrekte er å skrive navnet slik det uttales på språket der forfatteren hører hjemme. Forfatterne ovenfor er nemlig Dan Brown, Henry Kissinger og Michael Moore. I land hvor man bruker det latinske alfabetet, bruker man oftest den originale skrivemåten for forfatternavnet, men det hender at aksenttegn og lignende sløyfes.

En nærmere gransking av hyllene viste blant annet følgende forfattere: Viljams Šekspīrs, Džeks Keruaks og Gabriels Garsija Markess. Andre kjente navn varr Bils Braisons, Johans Volfgangs Gēte og Džons Grižams.
Denne uttalennære skrivemåten er fornuftig. På den måten sikrer man at bokkjøperen uttaler brasilianeren Paulo Coelhos navn tilnærmet korrekt, Koeljo. Det samme gjelder Jorge Luis Borges. Mange lar første og siste del av navnet rime på Norge og Norges. Den latviske skrivemåten, Horhe Luis Borhess, avspeiler mye bedre den spanske uttalen.

Titler med internasjonale ord er lette å forstå. Selvsagt er Čarlijs un šokolādes fabrika skrevet av Roalda Dāla.

Bokhandelen solgte også bøker av norske forfattere. Jeg fant følgende navn: Lars Sobijs Kristensens, Trigve Gulbransens, Justein Gorders, Erik Fosness Hansens og Jū Nesbē. Herbjorga Vasmu var representert med «Dinas Dēls» og Sigrija Unsete med «Kristine Lavransa meita». Her er også titlene gjennomsiktige. Nesbøs bok «Glābējs» heter «Frelseren» på norsk.

Skrivemåter for palatale lyder

Her er en form jeg glemte:»Ball» skrives <baijl> i VG:
http://www.vg.no/nyheter/innenriks/la-barna-faa-si-sjylling-og-fotbaijl/a/23275272/

Å skrive på Dønna-dialekt

320xI 2013 gav Roy Jakobsen ut romanen «De usynlige», en beretning om fattigfolk på ei lita øy på Helgelandskysten. Boka ble svært godt mottatt. Dette er «rett og slett en fantastisk roman», skrev Cathrine Krøger i Dagbladet, mens Marta Norheim i NRK kaller den «ei uvanleg fengslande og viktig bok». Pål Gerhard Olsen i Aftenposten sier at dette er «skjønnlitteratur av høy klasse» og «en utkantskildring av de sjeldne». Kritikerne er altså enige, og allerede før jul i 2013 passerte opplaget 100000.

For å gi handlingen lokal koloritt, lar forfatteren de fem hovedpersonene framføre sine replikker dialekt. Handlingen er lagt til Barrøy, ei fiktiv øy på Helgelandskysten. I Bokprogrammet ( NRK1 08.10.2013) blir seerne med forfatteren nordover der moren kom fra. nærmere bestemt øya Dønna.  Jacobsen har god kjennskap til øya og han «stjeler historiene» til folk han har kjent, sier han til NRK. Med dette som utgangspunkt  har jeg sett på hvordan dialekten kommer til uttrykk i boka. Denne problemstillingen har jeg nærmet meg på to måter:

 

1. Hvordan gjengir Jacobsen den lokale dialekten. Bruker han korrekte dialektformer?

2. Hvordan framstiller dialektale trekk ortografisk?

Å skrive på en gitt dialekt må innebære at en forsøker å gi gode skriftlig uttrykk for lokal uttale. Dersom det ikke finnes en etablert ortografi for den aktuelle dialekten, må en skape sin eget skriftlige uttrykk slik Alf Prøysen har gjort det for Ringsakerdialekten. Prøysen tilnærming kommenteres av Kristin Fridtun i Språkteigen 13.0.7.2014. Et slikt prosjekt er ikke uproblematisk. Hvor nært skal en legge seg til den lokale dialekten, og hvilken rolle skal etablert ortografi (bokmål, nynorsk) spille? I den videre diskusjonen vil jeg la tegnene < > omslutte bokstaver, / / omslutter språklyder og » » omslutter ord, som i setningen:  I ordet «kjem» skal bokstaven <e> uttales /æ/.

 

Jacobsen må forholde seg til begge punktene allerede i den første replikken på romanens første side (s. 5): «Jasså, det kjem fintfolk?» Ordformen «jasså» avspeiler den lokale uttalen godt. Bruken av dobbelt konsonant indikerer at ordet uttales med kort /a/, og at det har trykk på første stavelse – «JASSå». Ordet «det» er mer problematisk ettersom den lokale uttalen er «dæ». Det skriftlige uttrykket «kjem» inviterer til en uttale med /e/. Den lokale uttalen er «kjæm». På side 81 skriver han imidlertid «kjæm», så dette framstår som inkonsekvent.

Bindingen til normalortografien kommer til uttrykk gjennom bruken av en enkelt «m» i slutten av ordet. Siden vokalen er kort, er grunnregelen at det skal være dobbelt konsonant – «kjæmm» –  men siden denne regelen ikke gjelder for «m» i norsk, følger Jacobsen regelen.  «Fintfolk» er gjengitt etter normalortografi. Den jevne leser vil uttale siste del «folk» med «å-lyd», dermed velges formen «fålk» bort. På Dønna vil l’en i dette ordet uttales som «tjukk l» (la oss bruke symbolet < ʟ > for denne lyden), noe som vil gi formen «foʟk» eller «fåʟk». Skiftet fra <o> til <å> er ellers parallelt med skiftet fra <e> til <æ> i «kjem → kjæm». Ut fra denne korte drøftingen skulle en mer dialektnær framstilling av utsagnet

«Jasså, det kjem fintfolk?»

vært enten den mer moderate : «Jasså, dæ kjæm fintfolk?»

eller en mer lydnær (og dermed mer avstikkende) form: «Jasså, dæ kjæmm fintfåʟk?»

Den neste replikken (s. 6)  er:

«Kain du sei me, kor lite det e, main kain knapt sjå husan».

Bortsett fra formen «det» som er kommentert ovenfor, ser dette ut til å være god Dønna-dialekt. Ord som «kain, main» er et forsøk på å avspeile palatal uttale av n-lyden i «kan, man»; formen «me» representerer det som i bokmål og nynorsk er «meg», «e» er helgelandsk for «er»; «husan» er flertall bestemt – «husene» – der den siste e’en ikke uttales. Det finnes ingen etablert form for hvordan en skal skrive palatale lyder. Ordformen «kain» er i andre sammenhenger observert skrevet som

”kajn, kanj, kannj, kanjn, kajnn, kainn, kai’n, kainnj, kainjn».

Jacobsen velger også å følge normalortografien ved å la ordet ende på én konsonant. (Ord som «man, vil, skal» følger ikke hovedregelen i norsk. De uttales på samme måte som «mann, vill, skall» og burde også vært skrevet slik dersom prinsippene for forhold mellom tale og tegn hadde vært fulgt mer strengt.)

I dialektal skrift er jeg tilhenger av å bruke bokstaven <j> framfor <i>. Når ord som «vinn» finn» uttales med palatal lyd til slutt, vil ordene skrives som «viinn, fiinn» dersom en følger Jacobsens ortografi. Den første i’en uttrykker vokalen i ordet, den andre brukes for å uttrykke palatal «n». Former som «vijnn, fijnn» eller «vinnj, finnj» er bedre synes jeg. At dette kan gå riktig galt, ser en av formen «goidt» (s.53). Ordet uttales med tre språklyder. Den siste er samme lyd som den en finner i den trønderske varianten av «ikke» ( ofte skrevet «itj»). Ordet burde nok ha vært skrevet «gojtt» («gojdt»?), evt. «gåjtt», men dette er former som ligger et godt stykke unna det som er vanlig rettskrivning – «godt». Dette er kanskje grunnen til at Jacobsen velger sin egen form.

Den neste replikken er

«Å, æ kain no sjå de.» 

Her introduseres en ordform som ikke finnes på Dønna. Det som på bokmål heter «jeg», har formen «e» på Dønna, «ikke «æ».  Den siste formen, «æ», finner en lenger nord i fylket, og dette er et av hyppigst kjennetegnene når en skal skille «sørlige» nordlendinger, fra de «nordlige». Jacobsen er ikke konsekvent her. På side 7 bruker han imidlertid  formen «e»: «No ser e pinadø også prest’gården». I all hovedsak er det formen «æ» som brukes i boka. Senere dukker formen «dæ» («deg») opp der den lokale dialekten har «de», uttalt med /e/.  For en leser med lokal tilknytning fører dette til at handlingen legges til mer nordlige deler av Nordland.

Formen «sjå» er i samsvar med dialekten, men på side 7 brukes han presensformen «sjer». Den finnes ikke på Dønna etter det jeg vet.  Formen «de» representerer pronomenet (3. person flertall) og samsvarer med bokmålsformen og uttalen av den. En mer dialektnær versjon av denne replikken kunne ha vært.

 «Å, e kajnn no sjå di.» 

Et spesielt lokalt trekk kommer til uttrykk i neste replikk på samme side:

«Ja. Dogger ha no aildri vørri her før.».

«Dogger» representerer uttalen av ordet «dokker» («dere»). Formen bidrar til et dialektskille på Dønna idet det på deler av øya også brukes «dokker». De fleste norske dialektene har skille mellom /k/ og /ɡ/. PÅ deler av Dønna finnes en tredje lyd som er en mellomting mellom disse. For utenforstående oppfattes den ofte som en g-lyd, og det er trolig grunnen til at Jacobsen velger å bruke bokstaven <g>. Skulle en skille de tre lyden fra hverandre, måtte en ha tre bokstaver, f.eks. < k, g, ɢ>.

Ofte finner en presens av verb uttalt uten /r/, som her hvor «har» gjengis som «ha». Jacobsen er inkonsekvent i markeringen av dette.  Noen ganger skriver han <ha> andre ganger <ha’>, gjerne på samme side. Apostrofen skal indikerer at det er en språklyd som ikke er uttalt. Også i andre ord brukes apostof på samme måte, og også her er det vakling: «a» heter det på side 14, men «av» på side 235. Han skriver et sted «… tru’ du på Gud?» I presens av dette verbet skal det nok være en /r/ her, og den vil smelte sammen med d’en til en såkalt retrofleks lyd (hvis en imiterer østlendinger og sier «har du», uttales det ikke noen /r/, /r/+/d/ smelter sammen til en d-aktig lyd uttalt med tungespissen bøyd opp og bakover). Det samme skjer på Dønna. Bruken av apostrof framstår altså som inkonsekvent og til tider gir den uønskede effekter.

Ordformen «vørri» har jeg aldri hørt uttalt med /i/ til slutt. Jeg vil anta at den faktiske uttalen er «vørre».

På side 7 finner en også formen «blankstilla». Siste del uttale med palatal «l», men siden Jacobsen har valgt å bruke <i> som grafisk uttrykk for palataler, ville han ha fått den litt rare formen «blankstiilla». Den unngår han, dermed ser ordet ut som om det ikke uttale med palatal l. Dønna ligger i søndre del av Nordland, og er særtrekk ved substantivbøyningen her, er at hunkjønnsord ender på «-æ» i bestemt form entall. Lenger nord i fylket (og videre nordover) ender de samme ordene på «-a». Dette er også et trekk som sterkt bidrar til å markere en persons herkomst. Ordet «blankstilla» skal uttales med «-æ» til slutt, og siden jeg velger <j> som uttrykk for palatal lyd, blir formen «blankstijllæ». (Ønsker en å markere tjukk l, blir formen «bʟankstijllæ».)

«Ho gjær då vel dæ.»

sier Maria på side 7.  Her ser en at Jacobsen velger å skriver «gjær» og ikke «gjer» (jf. «kjem/kjæm) ovenfor. Han holder seg imidlertid når normalortografien ved å skrive «gj-» først i ordet. Ordet uttales uten «g» og kunne ha vært skrevet «jær». Senere (s. 28) dukker imidlertid formen «gjer» opp». Jacobsen er altså mer eller mindre lydnær i sin skriftlige framstilling. Et eksempel på mer lydnær skrift finner en i formen «kjerska». Ordet fjerner seg fra dialekten ved å ikke ende på «-æ» som det brude ha gjort:  » kjerska – kjerskæ», men det nærmer seg dialekten ved at lyden før k’en er en sj-lyd og ikke en /r/. Ordet uttales faktisk «kjerskæ» lokalt (en alternativ, men mindre heldig skrivemåte ville være «kjesjkæ»). På s. 222 finner en formen «hæsskuk-arbei», Her er en stum konsonant strøket, noe som ellers er unngått de fleste andre steder hvor det er mulig.

Jacobsen bruker to bøyningsformer for hunkjønnsord. Dette er i samsvar med dialekten. Svake hunkjønnsord (de som ender på en trykksvak /æ/ i ubestemt form) får «-o» i bestemt form: «ei kveitæ → kveito» (s. 24), «ei prammæ (= en pram) – prammo» (s. 188), men sterke hunkjønnsord (de som ender på konsonant eller trykksterk vokal» får «-a»: «ei gammelrogn – gammelrogna» (s. 53). Denne siste formen er ikke i samsvar med Dønna-målet. Der vil det hete «ei gammelrogn – gammelrognæ». Han tar et steg mot Dønna-dialekten («kveito») og et sted bort fra den («rogna»).

Jacobsen bruker heller ikke «-æ» i svake verb av 1. klasse. Der han skriver «kauka», har Dønnadialekten «kaukæ». (Igjen ser den lokalkjente leseren at det er mer nordlige former som blir brukt.)

Jacobsen bruker en rekke særpregede dialektord:  «Dar» for «der (s.7), «svang» for «sulten» (s. 14), «gørråt» for «slimete» (s.14), «haurt» for «hørt» (s. 132), «hut» (s. 138), «bi» (s. 174), «puskåt» (s. 199). Han bruker også nordnorsk ordstilling i den spørsmål med spørreord: «Ka det derran e?»  (Hva det der er? > «Hva er det der?»). På den annen side bruker han ordformer som jeg ikke ville forvente å finne, som  «å le» den jeg heller ville bruke «å flir»:

«Du ler no a ailt» > «Du fliræ no a ajllt»

Formen «forstår»  heter nok heller «førstår» på Dønna, og formen «sjøll» peker nordover. På Dønna sier en «sjøl» med tjukk l og lang vokal: «sjøʟ».

Denne gjennomgangen gir et tverrsnitt av hvordan Jacobsen framstiller en dialekt i skrift. Eksemplene er langt flere enn de som er vist ovenfor, men i stort har jeg pekt på forhold som jeg mener er problematiske i framstillingen. Innledningsvis ble det stilt to spørsmål om framstillingen av dialekten i boka. Oppsummeringsvis gir jeg korte svar på begge:

1. Hvordan gjengir Jacobsen den lokale dialekten. Bruker han korrekte dialektformer?

Svaret er «tja…». En leser som ikke har direkte kjennskap til Dønna-dialekten, vil plassere handlingen i Nord-Norge et sted. Lesere med kunnskap om nordnorske dialekter vil se at forfatteren delvis bruker former som har sin hjemstavn på Dønna, og delvis anvender former som hører til lenger nord. Det er spesielt bruken av 1. personsformen «æ» for «e» og endelsen «-a» for «-æ» i svake verb og i sterke hunkjønnsord som bidrar til dette inntrykket. Jeg hadde ønsket mer Dønna-koloritt.

2. Hvordan framstiller dialektale trekk ortografisk?

Gjennomgangen viser at Jacobsen ikke er konsekvent. Et og samme ord skrives på flere måter (kjem, kjæm). Konvensjonen som brukes for å uttrykke palatale lyder er ikke heldig. Den er heller ikke konsekvent i og med at ord med <i> ikke får den aktuelle formen.  (Dette temaet har vært behandlet i et tidligere blogginnlegg.) Forhold knyttet til såkalte stumme bokstaver  og bruk av apostrof for bortfalte lyder burde også ha vært bedre avklart.

Slik jeg ser det, hadde det vært ønskelig at forfatteren/forlaget hadde brukt mer på disse formelle sidene. Det ville ha gjort romanen mer helstøpt (og iallfall ville jeg ha sluppet å ergre meg over løsningene som er valgt). Romanen som sådan vil jeg anbefale varmt. Når den er gjennomlest, kan en ta for seg fortsettelsen av historien. Den følger i «Seierherrene», som kom i 1991. Den dialektinteresserte leseren kan selv analysere språkmaterialet der.

Statistiske hjelpemidler

Jeg satt og puslet med en tekst der korrekturleseren hadde foreslått at «det samme er tilfelle når det gjelder …» heller burde skrives som «det samme er tilfellet når det gjelder …».  Jeg var lite lysten på å endre utsagnsmåten og ønsket å se hva andre hadde valgt å gjøre.

Første sjekk var Google fighthttp://www.googlefight.com. Svaret var følgende:

Screenshot 2014-05-25 22.20.04

I over 3 av 5 tilfeller skriver andre det samme.

Jeg vet ikke hvordan Google fight bygger opp statistikken. Søker den hele nettet, eller deler av det?

 

 

 

 

 

 

 

 

 

Det andre redskapet jeg brukte, søker innenfor en database som ligger på Nasjonalbiblioteket, nemlig Nasjonalbibliotekets ngramleser  http://www.nb.no/ngram/. Mens Google ikke har noen øvre grense på hvor lang søkestrengen kan være (husk å sette den mellom hermetegn slik at det søkes på hele strengen), har ngramleseren en øvre grense på fire ord.

På hjemmesiden finner en følgende

Nasjonalbibliotekets ngramleser lar deg søke i et tekstkorpus som inneholder ca. en og en halv milliard løpende ord fra forskjellige nettaviser, samlet inn fra slutten av 1990 frem til 2011.

Søket støtter jokertegn, benytt * for ord, og % i ord. For eksempel vil

spise *

finne alle ord som følger etter spise, mens

spis% * ikke

finner alle trigrammer der første ord begynner med spis og der tredje og siste ord er ikke, og ordet imellom, andreordet, er hvilket ord som helst.

Treffene kan også begrenses til en gruppe, der gruppene omsluttes av anførselstegn. Uttrykk som

«alle noen hver» *

finner alle bigrammer der førsteordet er ett av alle, noen eller hver.

 

Svaret på mine søk ble følgende (og jeg måtte gjøre to søk, Google fight inviterer til «fight», så der får en begge resultatene med en gang):

Screenshot 2014-05-25 22.30.06

Altså 485 tilfeller

Screenshot 2014-05-25 22.30.25

Totalt 643 tilfeller

Begge analysen gav med medhold i cirka 3 av 5 tilfeller, så jeg stoler på flertallet og skriver «det samme er tilfelle». Uansett er dette to verktøy som kan komme til nytte i ulike sammenhenger. Hva opptrer oftest «fram» eller «frem»? Skriver de fleste «for øvrig» eller «forøvrig» og så videre.

Språk en aprildag

Aktiviteten har er har vært minimal den sist tida, men siden summen av alle aktiviteter er konstant, avspeiler dette et nokså travelt liv ellers.

Jeg stoler derfor på andre og sender leserne videre til et par historier relatert til språk. Den første handler om Anders Mørkved Schiefloe, som nå må bytte navn til Ainnesj Møsjkve Sjæfflo, den andre om Språkrådet som vil fjerne fire av de minst brukte bokstavene i alfabetet.

Transkribere, translitterere

thaiSylfest Lomheims språkspalte i Klassekampen er obligatorisk lesning. 15.01.14 skriver han under overskriften «Tapt i transkribering» om problemer med å gjengi navn i ulike skriftsystem. Dette har vært behandlet i denne bloggen tidligere. Lomheims tar fatt i dette med henvisning til vinter-OL i Сочи  – Sotsji … eller Sochi (engelsk og spansk), Sotji (dansk og svensk), Sotchi (fransk), Sotschi (tysk), Sotši (finsk), Soči (italiensk), Sotxi (katalansk), Soczi (polsk), Szocsi (ungarsk), Soçi (tyrkisk) etc.

Lomheim kaller denne omskrivningen for «transkribering», og han viser til at Språkrådet har fastsatt regler om transkripsjon av kyrillisk og nygresk. I norsk er «transkripsjon» en etablert term for å «overføre tekst i en ny form, enten mellom ulike alfabeter, eller fra muntlig til skriftlig form» (Wikipedia).  Termen har altså to ganske ulike betydninger:

  1. Overføring av tale til lydskrift.
  2. Overføring av skrift fra ett alfabet til et annet ved å gjengi bokstav for bokstav med tegn fra et annet alfabet. Normalt ønsker en å la de to tegnsettene stå i en 1:1-relasjon, altså at alfabetene motsvarer hverandre tegn for tegn.
  3. (Det finnes også en tredje betydning knyttet til musikk og noter, men den lar vi ligge her)

Innenfor fonetikken bruker transkripsjon i den første betydningen. En hører en språklyd, og representerer den aktuelle språklyden med et gitt tegn. For den andre aktiviteten finnes begrepet translitterasjon. Det nevnes i siste setningen i artikkelen på Språkrådets nettsiden.  snl.no finnes translitterasjon som eget oppslag med betydning 2. Ordet er også nevnt under transkripsjon.

Jeg ser gjerne at disse to begrepene holdes fra hverandre, og understreker det på forelesninger og kurs. Transkripsjon er nedtegnelse av lyder, translitterasjon er overføring fra et skriftsystem til et annet.Dette er to ganske forskjellige operasjoner.

Nok om det. Når begynner en å translittere? I utgangspunktet skjer det når en skifter en skrifter ut et tegn med et annet, som når Göteborg blir Gøteborg. Her er overgangen så liten at en knapt legger merke til den, og det er kanskje bare nerder som vil problematisere det som skjer her.

Lomheim viser til polsk og påpeker at overgangen fra polsk til norsk er uproblematisk:

«Frå polsk treng me derimot ikkje reglar, for i Polen nyttar dei vårt alfabet, det latinske. Det forklarer kvifor me skriv Warszawa, som er slik polakkane skriv hovudstadsnamnet sitt, endå me uttaler namnet ’varsjava’. Det er tilnærma likt det dei seier på polsk. Hadde polakkane nytta det kyrilliske alfabetet, ville truleg den transkriberte forma på norsk nettopp ha vorte Varsjava.»

Det er interessant at Lomheim viser til polsk, men han underslår en del opplysninger om det polske alfabetet. Innspillet hans gir imidlertid en anledning til å peke på en praksis som ikke gir et helt god resultat. Han sier jo: «Frå polsk treng me […] ikkje reglar». Altså: Flytt bokstavene fra polsk til norsk.

Det polske alfabetet har følgende tegn:

A Ą B C Ć D E Ę F G H I J K L Ł M N Ń O Ó P R S Ś T U W Y Z Ź Ż

a ą b c ć d e ę f g h i j k l ł m n ń o ó p r s ś t u w y z ź ż

Som en ser er det flere av tegnene som i form skiller seg fra norsk. jeg tenker på bokstavene < ą ć ę ł ń ó ś ź ż >. De representerer lydene

  • ą – /ɔ̃/
  • ć – /ʨ̑/
  • ę – /ɛ̃/
  • ł – /w/
  • ń – /ɲ̟/
  • ó – /u/ (norsk o-lyd, bokstaven <o> representerer å-lyden)
  • ś – /ɕ/
  • ź – /ʑ/
  • ż – /ʐ/

I tillegg er det slik at et og samme tegn representerer ulike lyder på norsk og polsk. Lydverdien til <o> er nevnt ovenfor, andre eksempler på ulikheter er <c> som står for sekvensen /ts/, <h> som representerer  ch-lyden i «Bach», <y> som har lydverdien /ɨ/ og <z> som står for en stemt s – /z/. Dette skulle være nok til at en heller ville presentere en translitterasjon som tok bedre vare på den polske uttalen av ordene som bokstavene brukes i. Jeg kan gjerne ønske det, men det er nok i seineste laget å kreve det.

Lomheims oppskrift medfører at translitterasjonen fra polsk ser grei ut på papiret. Lech Wałęsa var president i Polen 1990-1995, og av de aller fleste i Norge ble han i skrift omtalt som «Walesa». Lesemåten var «Valesa» med trykk på nest siste stavelse. Dette er et rimelig resultat når sekvensen <łę> estattes med <le>. Den polske uttalen er /vaˈwɛ̃sa/. Gjengitt i en form noe tilpasset norsk skulle resultatet bli omtrent /vaoˈensa/ i den grad en nasalisert «e» kan gjengis som «en». Siden navnet opprinnelig er skrevet med latinske bokstaver, velger man altså på norsk (og andre vestlige språk iallfall)  å stryke «krusedullene» på (de ellers kjente) bokstavene , og da ender en med en uttale som kan ligge langt fra den originale. Det er ikke umulig at navnet Wałęsa hadde fått en annen skriftlig utforming på norsk hvis det hadde vært snakk om en russer.

Det skulle være ganske tydelig at arbeidet med overføring av ordformer fra et alfabet til et annet er ganske forskjellig fra en nedtegning av språklydene en hører («transkripsjon). Det er derfor ville jeg foretrekke å benevne prosessen ovenfor som translitterasjon.

En litt pussig sak til: Bokmålsordboka viser at «transkribere» har en alternativ  skriftlig form» transskribere», det samme har «transkripsjon»: «transskripsjon». En kan altså velge om en vil bruke én eller to s’er. Nynorskordboka har denne valgmuligheten bare for «transkripsjon/transskripsjon». Det er litt merkelig. Ordene er jo sammensatt av «trans + skribere» (latin trans– «over»  + scribere «skrive») og «trans + skripsjon». Forenkling av «-ss-» til «-s-» blir litt underlig her. Det er i og for seg ingen regler som tilsier at det skulle skje en forenkling. Opphavet er jo ikke «tran + skribere» og «tran + skripsjon». Ord som «transseksuell, transsibirsk» har bare formen med to s’er. På den annen side er ordboksredaktørene i godt selskap. Søk i engelsk, tysk og franske ordbøker gir former med én «s».

Men: ordnet.dk gir responsen «Der er ingen resultater med “transkription” i Den Danske Ordbog. Måske mente du transskription«.  Svenska Akademins ordlista bruker bare én «s». Bokmål og nynorsk har altså valgt begge variantene.

For øvrig står «translitterasjon» både Bokmålsordboka og Nynorskordboka. Det samme gjelder «translitterere».