Mangel på skriftspråk hindrer modernisering

 

De to siste ukene har jeg samarbeidet med en gruppe forskere fra Vietnam om dokumentasjon av språket cơ tu (også kalt katu) som snakkes av ca 60000 personer (2009) i det sentrale høylandet i Vietnam (vest for Hoi An, Da Nang). Jeg har blogget om dette på NTNU og legger inn en lenke til artikkelen nedenfor.

https://blogg.svt.ntnu.no/mangel-pa-skriftsprak-hindrer-modernisering/

Skjermbilde 2018-02-14 kl. 13.39.58

Foto: http://www.bhohoongbungalows.com

Reklamer

Spørsmål til læreren

Nedenfor finnes en rekke konstruerte dialoger som i prinsippet kunne ha vært hentet fra et hvilket som helst klasserom der det undervises norsk som andrespråk til voksne. Kan den som leser dette besvare spørsmålene fra elevene?

 1. Lærer, du har sagt at jeg ikke kan si: ”Han jeg møtte i går” og ”Læreren jeg skal møte på skolen i dag.” Du har sagt at dette er feil fordi verbet må være nummer to, men jeg hører mange nordmenn si ”Jenta jeg møtte i går var hyggelig” og ”Læreren jeg møtte var trøtt.” Hvorfor kan nordmenn slippe å ha verb som nummer to, men ikke jeg?

 

 1. Når jeg spiser sammen med nordmenn, og de trenger salt, så sier mange ”Gi meg saltet”, det forstår jeg. Noen andre sier ”Få saltet”. Det forstår jeg ikke. Hvordan kan man bruke ”gi” og ”få” om det samme?

 

 1. Når jeg sier ”Jeg liker ikke tomat” kan Toan fortelle Huyen hva jeg sa: ”Hun sa at hun liker ikke tomat”. Men du sier det er feil når jeg sier ”Der sitter en gutt som liker ikke tomater”. Hvorfor er det feil?

 

 1. Lærer, jeg kan forskjellen mellom ”Han legger boka hans på bordet” og ”Han legger boka si på bordet”, men hvorfor kan jeg si ”Boka hans ligger på bordet”, men ikke ”Boka si ligger på bordet”. Jeg hører nordmenn si ”Gutten si bok ligger på bordet” Hvorfor gjør de rett og jeg feil?

 

 1. Lærer, jeg skjønner ikke forskjellen mellom ”å tro, å tenke, å synes, å mene”. Kan du forklare det? Hva med forskjellen mellom ”å kunne, å vite, å kjenne”?

 

 1. Lærer, hvorfor sier nordmenn ”Kommer ikke bussen”, men ”Kommer den ikke”. Jeg tror ikke at jeg har hørt noen si ”Kommer ikke den”.

 

 1. Når en nordmann spør: ”Liker du deg på skolen?” svarer jeg ”Ja, jeg liker meg på skolen”. Når jeg spør tilbake: ”Liker du deg på jobben?” svarer han ”Ja, det gjør jeg”. En norsk kvinne spurte meg: ”Har du barn?” Jeg svarte ”Ja, det gjør jeg.” Da lo hun. Hun sa at jeg må si ”Ja, det har jeg” eller ”Ja, jeg har barn.” Hvorfor det?

 

 1. Lærer, hva er forskjell på ”sette, å legge” og ”å sitte, å ligge”? Hvorfor sier dusett tallerken på bordet», men smiler når jeg sier at ”tallerken sitter på bordet”. Du sier at jeg må si ”tallerkenen står på bordet”. Hvorfor kan jeg ikke si at ”tallerkenen ligger på bordet”. Hva er sammenhengen mellom ordene ”å sette, legge, sitte, ligge, stå, henge, plassere”?

 

 1. Lærer. Jeg ser så ofte ordet ”så”. Jeg tror det betyr mye forskjellig. Kan du hjelpe meg? Hvorfor kan vi for eksempel si ”De bråkte jeg fikk ikke sove” og ”De bråkte jeg ikke fikk sove”. Er det noen forskjell? Jeg tror dette ord finnes i mange andre betydninger også. Hvilke betydninger er det, jeg husker ikke det.

 

 1. Lærer, kan du hjelpe meg med preposisjoner og tid. Jeg synes det er vanskelig. Jeg har hørt slike uttrykk: «i sommer, om sommeren, til sommeren, om to år, for to år siden, to år.»

 

 1. Lærer, hvorfor er det bedre å siDet sitter en fugl i vinduet” ennEn fugl sitter i vinduet”?

 

 1. Lærer, hvorfor har du satt strek under disse setningene ”Jeg lurte på hva sa hunog ”De spurte meg når kommer hun.” Vi har jo lært om inversjon. Du har sagt at hvis det kommer et ledd foran det finitte verbet, må subjektet flytte bak verbet – til n-plassen. Hva er det som er galt?

 

 1. Lærer, hvorfor kan jeg si ”Jeg har ingen barn”, men ikke ”Jeg har ikke fått ingen barn». Når bruker jeg ”ikke noe, ikke noen, ingen, ingenting, intet, ikke noen ting”?

 

 1. Når jeg sier: ”Jeg har ikke boka mi med meg” og du spør Toan hva jeg sa, så sier han: ”Hun sa at hun ikke hadde boka si med seg”. Jeg sier ”har”, mens Toan sier ”hadde”. Hvorfor det? Jeg sier ”mi”, Toan sier ”si”. Hvorfor det? Hvorfor ikke ”hennes”?

 

Verktøy 4: Vokabular: Oversikt over ordmaterialet

Hvilke andre bearbeidelser enn dem som er nevnt under Verktøy 2 kan en gjøre med tekster?

Ressursene som omtales nedenfor finnes på ulike nettsteder. Vi tar utgangspunkt i siden om lesbarhetsindeks – lix.se. En finner også noe av det samme på skriftlig.no, men ikke alt. I den videre presentasjonen av ulike verktøy tar jeg utgangspunkt i et tidligere blogginnlegg om stedsnavnet Matstia. Teksten er mindre viktig i denne sammenhengen.

Når en sitter med en tekst som skal tilpasses en bestemt målgruppe, for eksempel personer som skal lære seg norsk, vil det være viktig å analysere teksten med hensyn til bestemte språktrekk. Hvor mange or har teksten totalt? Hvor mange forskjellige ord er det i teksten? Hvor mange lange ord inneholder den? Hvor er lang er setningene?

Den aktuelle teksten har fått liksverdien 35. ( 745 ord fordelt på 53 setninger gitt gjennomsnittlig setningslengde på 14,06 ord. 152 av ordene, 20,4 prosent,  har mer enn seks tegn. Liksblir 20,4+14,06=34,46. Avhengig av hvilken avrundingsmetode en bruker vil liksen bli 34 eller 35.

 

Hvordan lage liste over setninger?

Dette kan en gjøre i Word (søke etter punktum, og så erstatte det med punktum+ linjeskift for å få setningene listet under hverandre. En enklere måte er å gå til http://textanalysisonline.com/nltk-sentence-segmentation og lime inn teksten der. På et øyeblikk er alt klart i en egen kolonne som en kan kopiere over i det tekstbehandlingsprogrammet en bruker.

 

Hvordan lage liste over ord?

Både den norsk og svenske gir denne informasjonen direkte i og med at enkeltordene listes opp med dubletter fjernet. Totalt er det 354 forskjellige ordformer i teksten. Analysen tar imidlertid ikke høyde for at et og samme ord opptrer i ulike bøyningsformer. De ti mest frekvente ordene er:

 

Nr Ord Antall
1 det 29
2 i 23
3 en 22
4 er 19
5 navnet 18
6 16
7 av 15
8 et 15
9 som 15
10 og 14

Det er flere måter å renske ut bøyningsformer på. Metoden som følger her er litt omstendelig, men den er ikke komplisert. Fra den svenske lixsiden kopieres de tre kolonnene i Frekvensordlista over til en tekstbehandler, f.eks. Word. Marker kolonnene «Nr» og «Ord» og slett dem (først den ene kolonnen, så den andre). Marker den gjenstående kolonnen med ord, gå til Tabell og velg Konverter tabell til tekst, velg at ordene skal skilles med avsnittsmerking. Ordene står nå i samme rekkefølge som før, men de er frigjort fra tabellformatet. Det kan hende at noen av ordene er tilknyttet spesialtegn  som hermetegn eller bindestrek. Velg Søk/erstatt og søk etter det aktuelle tegnet og erstatt det med ingenting. (Vær oppmerksom på at bruk av spesialttegn påvirker ordtellingen. Et og samme ord ±hermetegn telles som to ord. Det beste hadde altså vært å fjerne slike tegn før en gjorde liksanalysen.) Marker så hele kolonnen med ord (Ctrl-A), gå til Tabell og velg Sorter. Ordene er nå sortert alfabetisk. Hvis det var tall i teksten, står de øverst. Slett dem. De første ordene i min liste er

alta
alternativ
alternative
altså
andre
annet
antall
at
av

Nå kan strykingen av bøyningsformer begynne. Det er spørsmål som dukker opp akkurat i denne listen. Det ligger i kortene at «alternativ» og «alternative» er samme ord, men hva med «annet» og «andre»?  «Andre» kan være flertallsformen av «annet» (og annen, anna) og slik må de to regnes som samme ord. «Andre» kan også være ordentallet («første, andre») og da må det regnes som et eget ord. En må altså sjekke teksten for å se hva slags ord en har med å gjøre (jeg kommer tilbake i et annet blogginnlegg med et nyttig verktøy). En gjennomgang av teksten viser at den inneholder 298 unike ord (med forbehold for feil etter en rask gjennomgang). Da er egennavn og forkortelser tatt med. Liksanalysen oppgir et såkalt type/token-forhold på 47,5 prosent. Dette tallet får en ved å sjekke antall forskjellige ord sett i forhold til alle ordene i teksten. Dette tallet øker altså når flere uker ord brukes. Store tall viser altså tekser med stor variasjon i ordforrådet. Etter å fjernet bøyningsformer av ord, faller naturlig dette tallet. I den aktuelle teksten er det på 40 prosent. Lix.se oppgir også to andre måter å regne ut variasjon på: OVIX (ordvariationsindex) og OVR (ordvariationsratio). Jeg går ikke inn på disse her. Formlene finnes på siden.

Noen av verktøyene som beskrives nedenfor gjør lignende operasjoner, noen av dem på enklere måter enn dem som er listet her.

 

Prosentvis andel av hvert ord

Nettstedet Textmechanic.com gir mulighet til å få tall på hvor hyppige de ulike ordene opptrer regnet i absolutte tall og prosent. Kopier inn teksten, trykk på knappen og tallene er klare. En får også opplysninger om hvor mange bokstaver og ord teksten inneholder i tillegg til antall setninger.

 

Hvordan sortere etter ordlengde?

Hva så med sortering etter lengde? På siden http://appincredible.com/online/list-sort/ kan man lime inn tekst og be om å få innholdet sortert etter lengde. Resultatet ser slik ut hvis en velger fra korteste til lengste:

a a i i i i i i i i i i i i i i i i i i i i i i i at at at at at at at at at at at av av av av av av av av av av av av av av av da da da da de de de de ei ei en en en en en en en en en en en en en en en en en en en en en en er er er er er

Ber en om en liste som viser ord fra lengst til kortest ser listen slik ut:

stedsnavnregister omfortolkninger landskapsformer landskapsformer facebooksidene sandnesjentene ruoššaluokta norskspråklig sandnessjøen sandnessjøen sandnessjøen rettskrivning

Dette er nyttig, men det krever ekstra arbeid for å få alt på plass slik at kan se nærmere på vokabularet. For det første vil en gjerne har ordene ordnet i kolonner. Den enkleste måten å gjøre dette på her er å kopiere teksten inn i Word, søke etter mellomrom og så erstatte mellomrommet med avsnittsmerke. Da kommer ordene under hverandre slik:

stedsnavnregister
omfortolkninger
landskapsformer
landskapsformer
facebooksidene
sandnesjentene

Det ser ut til at ord nr. 2 har kortere utstrekning enn nr. 3, men det er faktisk ikke kortere. Avviket kommer av at bokstavene i fonten er av ulik utstrekning. Dersom en bytter til en font der alle bokstaver har samme utstrekning horisontalt, f.eks. Courier, blir resultatet slik:

stedsnavnregister
omfortolkninger
landskapsformer
landskapsformer
facebooksidene
sandnesjentene

Da ser en at ord 2-5 faktisk er like lange, dvs at de har like mange bokstaver.

Listen viser at vi ikke er kvitt dubletter. De kan en enkelt få bort ved å gå til http://www.tracemyip.org/tools/remove-duplicate-words-in-text/ og kopiere inn teksten. På dette nettstedet kan en få den ferdig teksten sortert alfabetisk (forlengs og baklengs) eller i original rekkefølge. Hvis en limer inn ordene som er sortert etter lengde (jf. prosedyren ovenfor), vil en få ut en liste med enkeltforekomster etter fallende ordlengde.

stedsnavnregister omfortolkninger landskapsformer facebook-sidene sandnesjentene ruoššaluokta norskspråklig sandnessjøen rettskrivning nyfortolkning gjeterguttene

Ordene er ikke sortert som kolonne, prosedyren for å få det til er angitt ovenfor.

stedsnavnregister
omfortolkninger
landskapsformer
facebooksidene
sandnesjentene
ruoššaluokta
norskspråklig
sandnessjøen
rettskrivning
nyfortolkning
gjeterguttene

Etter dette gjenstår det bare å slette bøyningsformer (jf. ovenfor).

Verktøy 2 – LIKS

Hva er det som gjør en tekst vanskelig å lese? Det er åpenbart flere faktorer, men to av dem kan en observere ganske enkelt: Lange ord og lange setninger. Vanskelighetsgrad forårsaket av disse to kan uttrykkes ved hjelp av den såkalte lesbarhetsindeksen, LIKS, også kalt LIX. Den regnes ved å se på prosentandelen av lange ord i en tekst, det vil si ord med mer enn seks bokstaver, og gjennomsnittlig periodelengde, der periode defineres som det som står mellom to punktum.

Wikipedia viser grunnlaget for LIKS  ved hjelp av denne formelen

{LIX} = \frac{A}{B} + \frac{C \times 100}{A}

A = Antall ord
B = Antall setningsterminatorer (punktum, kolon, stor forbokstav)
C = Antall lange ord (flere enn 6 bokstaver)

skriftlig.no forklarer liks-verdiene slik:

< 30 – Veldig lettlest, som barnebøker
30–40 – Lettlest, som skjønnlitteratur eller ukeblader
40–50 – Middels vanskelig, som vanlig avistekst
50–60 – Vanskelig, vanlig verdi for offisielle tekster.
> 60 – Veldig tunglest byråkratspråk.

Når en skriver tekster, hender det at en ønsker å sjekke liks. Da er det litt tungvint å telle lange ord og periodelengde og så gå over til prosentregning og addisjon. Det er enklere å kopiere den ferdige teksten og så lime den inn på liks-siden til skriftlig.no. Et øyeblikk etter får en verdiene.

Syrisk jente lærer dansk på seks uker

Jeg ble kontaktet av Dagbladet som skulle legge ut en artikkel om ei 10-Skjermbilde 2015-12-18 kl. 16.32.10årig syrisk jente bosatt i Danmark som hadde lært seg dansk på seks uker:

Jeg sendte et kvikt svar, men artikkelen ble lagt ut uten referanser til den. Jeg legger ut responsen her (noen innledende fraser er strøket, og noen skrivefeil/uttrykksmåter er korrigert):

«Mitt første inntrykk etter å ha sett på henne, er at dette er en flink elev, trolig langt over gjennomsnittet, men hun beviser ikke at seks uker er nok til å lære seg dansk. Uttalen hennes er god (ut fra mine begrensede muligheter til å bedømme dansk uttale) – den høres dansk ut for meg, men jeg kan ikke si noe om hvor stor grad den er avvikende. Yngre mennesker har normalt bedre forutsetninger til å tilegne seg god uttale en eldre, hun kan ha den udefinerbare ferdigheten vi kaller «språkøre». Jenta virker trygg og motivert, og slikt skaper gode læringsvilkår.  På den annen side tror jeg at hun kan engelsk, hun sier blant annet «looker» et sted istedenfor «ser». Det betyr at at hun kanskje er flerspråklig – noe som leder til spørsmålet «Hvem er hennes foreldre, og hva gjør de, og hvilken bakgrunn har familien?» Hennes leseferdigheter mht til det latinske alfabetet bekrefter for meg at hun kan engelsk, og da er det ikke så vanskelig å uttale navnet på skandinaviske hovedsteder når ordene er skrevet og læreren peker, en lærer hun for øvrig ser ut til å ha et godt forhold til, og som ser ut til å være engasjert og flink. Det er også enkelt å peke på typiske grammatiske feil når hun snakker, for eksempel på setningsnivå. Men for all del, jeg er imponert.

Barn som på overflaten er så flinke som henne, kan få trøbbel hvis de går raskt over i majoritetsspråklige klasser der elevene allerede har begynt innlæringen av et akademisk vokabular. I  fagbøker er en stor del av vokabularet lite frekvent, svært mange ord dukker opp bare en gang, og siden slike ord går inn i større nettverk av ord, kan det blir svært vanskelig å henge med faglig. Hadde dette vært min datter, ville jeg ikke ha flyttet henne over i en ren dansk klasse etter 6 uker.
Det som er «farlig» med slike innslag, er at det kan skapes et inntrykk av at barn lærer språk så raskt at det bare er å flytte dem inn i majoritetsspråklige klasser. Forskningen har vist at det er det dårligste alternativet. Den vedlagte figuren fra Thomas og Collier (http://www.thomasandcollier.com) viser årlig skoleframgagn med ulike undervisningsmodeller. Den stiplede linjen viser gjennomsnittlig skoleframgang: Et år på skolen gir ett års framgang. Noen elever har saktere progresjon (lavere en 50, de blir altså hengende etter i stadig større grad). Noe har en progresjon som er raskere enn gjennomsnittet, (skåre høyere enn 50). Skåren kan relateres til undervisningsorganisering. De som skårer lavest har ikke spesiell tilrettelagt undervisning (grp. 7), de flyttes inn i en majoritetsspråklig klasse, de nest dårligste har vært tatt ut av klassen og har fått majoritetsspråket i noen timer. De med best progresjon (grp 1) har gått i tospråklige klasser der det er tospråklige lærere, hvor elevgruppen er delt 50/50 mellom minoritet og majoritet hvor og begge språkene brukes  i undervisningen (også for majoritetselevene). Legg merke til at alle modellene har lik utvikling fram til 3. klasse. Det er når skolen blir akademisk, at forskjellene viser seg, og derfra blir de større og større hvert år.
Screen+shot+2010-08-15+at+12.14.27+AM
I Norge ligger brukes morsmål som et redskap til å lære norsk, når norskferdighetene er gode nok til at elevene kan følge en ren norskspråklig klasse flyttes eleven dit og morsmålsopplæringen opphører. Norsk kan litt upresist plasseres som modell 4.»

30. oktober var det en lignende reportasje på vgtv. Gutten viser hva han har lært på fem dager. Kan han norsk?

Tilegnelse av motoriske ferdigheter

Jeg foreleser jevnlig om uttale i norsk som andrespråk, og et av poengene mine er at uttaleferdigheter ikke er språklige ferdigheter i og for seg, men motoriske ferdigheter. Gjennom korrekte muskelbevegelser settes luft  bevegelse, dette blir grunnlaget for stemmen. Muskulaturen i strupehodet modifiserer denne på ulike måter. Ved å bevege kjeven, flytte tunga og endre på tungeformen,  flytte tungas kontaktpunkter i munnen, åpne og lukke ganesegl og lepper, runde leppene skapes ulike språklyder. (Når det gjelder tegnspråk utføres motvarende bevegelser med hender, armer og ansiktsmuskulatur.)

Et dyptloddende spørsmål er: Hvordan lærer barn disse ferdighetene? I motsetning til voksne lykkes de når det gjelder å tilegne seg det nye språket som omgir dem. Voksne som havner i et nytt språkmiljø og som ønsker å lærer det aktuelle språket, ender opp med en mer eller mindre tydelig aksent. Patricia Kuhl er en av verdens ledende forskere når det gjelder barns språktilegnelse. Hun har presentert arbeidet sitt i en presentasjon på ted.com. Presentasjon varer 10 minutter. Se den før du leser videre.

Barn har altså medfødte ferdigheter som de utnytter under språktilegnelse. Som Kuhl viser, svekkes denne evnen  i takt med økende alder. Hun viste blant annet til følgende figur:

gr2

Illustrasjon fra: Johnson, J.S. and Newport, E.L. Critical period effects in second language learning: the influence of maturational state on the acquisition of English as a second language. Cognitive Psychology 19892160–99.

Barn bruker den første delen av livet til å observere karakteristiske trekk ved talespråket som omgir dem. Dette gjør de lenge før de kan snakke. Først etableres systemet, deretter brukes tiden på å utvikle de motoriske ferdighetene slik at barnet selv kan artikulere språklydene som er observert. Det tar iallfall to-tre år til før det hele er på plass. I begynnelsen av denne perioden svekkes evnen til å tilegne seg nye språklyder, men som Kuhl viser, skjer prosessen gradvis og når det gjelder yngre barn, kan den «gjenopplives». Fra treårsalderen svekkes evnen betydelig.

Voksnes artikulasjonsvaner er stivnet, og når voksne skal tilegne nye språk, overføres motoriske mønster til det nye språket. Personer med samme språkbrakgrunn gjør omtrent det samme under innlæring av samme nye språk, og de får en uttale som er ganske lik: De snakker med aksent. Vi ser at etablerte motoriske vaner på andre felt blir et problem når noe nytt skal læres. Leseren av dette kjenner skrift basert på det latinske alfabetet. Håndskriften «ligger i» den hånden som brukes når en skriver. Kunsnkapen om hvordan en skriver er lagret som automatiserte ferdigheter. Flytt penna over i den andre hånden og skriv på vanlig måte. Det går saktere, bokstavene får en annen form. Innsikten om prosess og produkt hjelper til en viss grad, men kan ikke overstyre den faktiske utførelsen. Prøv å lære et nytt alfabet, for eksempel det arabiske. Det tar tid å lære bokstavene, utførelsen er nølende, stilen er barnlig, og skrivingen ligger langt tilbake sammenlignet med dem som har lært dette fra barnsbein av.

Jeg så nylig en video som illustrerer tilegnelsen av nye motoriske ferdigheter (takk til Espen Munch). Den illustrerer hvor lang tid tar det å lære nye motoriske mønster, hvilken rolle allerde tilegnede ferdigheter spiller – og betydningen av alder. Videoen tar cirka 8 minutter.

Det ideelle er at disse to videoene kombinerer mine to store interesser: Språk og sykling!

 

26 lærere og forskere: Gjør andrespråksinnlæring obligatorisk

Med det økende antallet barn og unge med norsk som andrespråk blir læreres kunnskap om andrespråksinnlæring stadig viktigere. Dette bør snarest bli et nasjonalt eksamensmål i alle lærerutdanninger.

Nei, du har rett. Overskrift og ingress ikke er hentet fra avisoppslag knyttet til norsk lærerutdanning. Det skal ikke står «norsk som andrespråk», men «svensk som andrespråk». originalen lyder:

26 lärare och forskare: Gör andraspråksinlärning obligatoriskt

Med det ökande antalet barn och unga med svenska som andraspråk blir lärares kunskap om andraspråksinlärning allt viktigare. Det bör snarast bli ett nationellt examensmål i alla lärarutbildningar.

Ingressen er hentet fra en debatt som går i Sverige der 26 forskere og lærere, blant dem Kenneth Hyltenstam og Inger Lindberg fra Stockholms universitet publiserte en artikkel 17. august i år der de krever at andrespråksfaglige problemstillinger gjøres obligatoriske i lærerutdanningen. Artikkelen ligger her. Den svenske undervisningsministeren avviste umiddelbart kravet med den begrunnelsen at myndighetene ikke vil detaljstyre lærerutdanningen. I et tilsvar sier de 26 at forslaget ikke handler om detaljstyring, men «snarare om vilka aspekter av utbildningen som anses vara viktiga och prioriteras genom att göras obligatoriska.» Diskusjonen fortsetter, blant annet på hjemmesiden til Nationellt centrum för svenska som andraspråk.

Men tilbake til Norge: Bør ikke vi også diskutere dette?