Hvorfor heter det «Matstia»?

På en av Facebook-sidene som har Sandnessjøen som tema, ble det for en tid siden vist et bilde av Matstia, og raskt kom det spørsmål om opphavet til navnet. I svaret som kom, ble navnet forklart på den mest konkrete måten: Navnet ble først brukt på ei sti der det ble fraktet mat på den tida da bøndene på Sandnes hadde felles utmark bak Høgåsen. Gårdene hadde egne gjetergutter som så etter kyrne. Maten de trengte i løpet av dagen, ble båret dit av småjenter fra Sandnes. Jentene gikk over Sandneselva og oppover mot Høgåsen. Den eneste farbare stia den gangen gikk der Kirkåsveien går i dag til den møter Botnveien lenger oppe. Den stia ble etterhvert kalt mat-stia. Etter hvert kom dette navnet til å betegne området som i dag heter Matstia.

Jeg vokste opp i dette området, og selv om vi sa «Masstia» med kort a først, og ikke «Matstia» med lang a i «Mat-«, stusset jeg ikke da jeg som barn fikk høre at navnet var knyttet til matbæring. Det hørtes jo logisk ut. Nå er jeg i sterk tvil, og av flere grunner. Hvis det var vanlig praksis å bære mat til gjetere, skulle en forvente at navnet «Matstia» dukker opp andre steder i landet der en gjorde det samme. Et søk i Sentralt stedsnavnregister (SSR) viser at navnet bare er i bruk et sted, nemlig i Sandnessjøen. Søk på Google gir samme svar. Navnet er altså særdeles sjeldent. Et søk på navnet «Sandnes» gir derimot et stort antall treff spredt over hele landet. Det er et vanlig navn. En finner landskapsformer bestående av et nes av sand mange steder i landet.

Hva så med Matstia? Hvis det ikke er snakk om ei mat-sti, hva betyr navnet da? La meg gå en liten omvei. Cirka 60 km fra Sandnessjøen ligger Luktvatnet. Hva betyr det navnet? Lukter det spesielt der (det er lansert teorier om at navnet kan komme av at det ligger «innelukt» mellom fjellene), eller kommer navnet av at den 1343 meter høye Lukttinden rager så «høgt opp i loktæ»? Vi må nok tenke i helt andre baner for å finne svaret. På sørsamisk heter vannet Luoktajavrie. Den første delen er «luokta» som betyr «bukt, vik», og ser en på kartet, ser en tydelig hvorfor Luktvatnet har det navnet det har. Det er en innsjø med bukter og viker. Den første delen av navnet er tatt fra samisk og brukt i det norske navnet, og den første delen er gitt et norskspråklig innhold. Slike omfortolkninger av samiske navn er ikke uvanlig. Ved Alta ligger Jiepmaluokta, egentlig «Selvika», som er blitt til Hjemmeluft på norsk, og Ruoššaluokta, egentlig «Russevika», som er blitt til Russeluft.

Kan en nyfortolkning med utgangspunkt i samisk være en fruktbar metode når det gjelder Matstia? Kan Matstia være et navn som egentlig har sitt opphav i sørsamisk?  Hypotesen må testes, og referansene må hentes fra de samiske språkene en finner i Norge. Under slike granskninger kan det dukke opp flere alternative tolkninger. I nordsamisk og lulesamisk finner en ordformene «máhcci» og «máhttse» som betyr «fald, brett, rynke». Brukt om landskapsformer peker dette ordet ut et sted der det er en «brett i landskapet», et sted der landskapet går fra å være flatt til å bli en helling eller stigning. Dette er en ganske god beskrivelse av hva som skjer når en har passert Sandneselva. Da starter en på stigningen oppover.

I sørsamisk finner en et annet ord, «matt» eller «mattag(a)».  Det betegner «en lavere overgang over et fjell eller bergpass». Denne beskrivelsen er heller ikke upassende. Etter stigningen opp gjennom Matstia kommer en opp på åsen, der det flater ut før det bærer nedover mot Botnfjorden.

For å komme tilhengere av «mat-stia» litt i møte kan det vises til et tredje alternativ.  Etter gjeldende nordsamisk rettskrivning brukes «má-didja» eller «máadii» om en vei som er dannet på grunn av ferdsel. Da er vi plutselig tilbake til «stia» igjen, men jeg vil ta et forbehold: Det samiske ordet sier ikke noe om formålet med ferdselen, dvs. om de var en «matvei, snarvei, krøttersti» eller lignende.

Jeg tviler altså på at stia oppstod på grunn av at sandnesjentene sprang med mat til gjeterguttene. Kanskje er det så enkelt som at det har gått gammel ferdselsvei her, og at navnet Matstia har sitt utgangspunkt i sørsamisk. Kunne det være slik at når norsktalende hørte det sørsamiske navnet, så omfortolket de det på samme måte som når Luoktajavrie ble til Luktvatnet?

(Også publisert i Helgelands Blad 4.januar 2016)

Nordland – et flerspråklig fylke

Undervisningen på folkeskolen (og realskolen og gymnaset, for den del) var særdeles nærsynt når det gjaldt språklige forhold i fylket jeg bodde i, Nordland. I norsktimene eller i timene med samfunnsfaglige tema var aldri språklige forhold i nærmiljøet et tema. Joda, vi hadde språkhistorie og lærte om Aasen og Knudsen og landsmål, riksmål og bokmål, men det var jo nettopp fordi det var en del av pensum. Der var selvsagt Petter Dass på plass. Alstahaug var jo bare noen kilometer unna, men det var lite om dikterprestens beskrivelse av lokalt liv, og ingenting om bruk av helgelandsdialekten i hans diktning.

På skolen var det bokmålet som dominerte. Ikke fikk vi vite noe om at det faktisk var to norske målformer i i bruk i fylket. I nabokommunen Leirfjord hadde 27,3 prosent av elevene nynorsk i 1964 (det året jeg gikk i 7. klassen). I Vefsn var det 22,1 prosent, i Grane 88,2 og i Hattfjelldal hadde alle elevene nynorsk på skolen. Det var også elever med nynorsk som hovedmål i Hemnes og Rana, men kun 0,1 prosent i begge kommunene. I tillegg var det nynorsk i Vestvågøy (5,0) og Sørfold (2,2).

Vi fikk vite lite om særtrekk ved dialekten vi snakket, for eksempel at det var to bøyningsmønster i hunkjønn: ei bok – bokæ (siden «bok» ender på konsonant, brukes endelsen «-æ») og ei bøtta – bøtto (siden «bøttæ» ender på vokal, brukes endelsen «-«)- Det er også mye annet interessant. Vi fikk aldri høre at det i 1921 hadde Vilhjelm Riksheim skrevet hovedoppgaven Ljodvokstren i Vefsn-målet (Ner-Vefsn)Riktignok var den skrevet noen tiår før vi begynte på realskolen, men var det noe argument? Jeg tror det var(minst) to årsaker til at slikt ikke ble omtalt: Dårlig kunnskap om dialekten og nedvurdering av lokale tema.

Flere språk

Men det var ikke bare norsk som var i bruk i Nordland. Lengst nord i fylket ble det snakket nordsamisk. Det som tidligere var Skånland kommune ( i dag slått sammen med Tjeldsund kommune) hører under det nordsamiske språkområdet. Det er vanskelig å finne antall nordsamisktalende i Nordland, men UNESCO Atlas of the World’s Languages in Danger oppgir at et finnes rundt 30000 som snakker språket*. Cirka 70 prosent bor i Norge, 20 prosent i Sverige og 10 prosent i Finland.

Det andre samiske språket som brukes i Nordland er lulesamisk som snakkes i Tysfjord, Hamarøy og Sørfold.  På Drag i Tysfjord ligger det lulesamiske senteret Árran. Språket snakkes også i Sverige. Det totale antall brukere ble i 2015 anslått til å være rundt 650. Den etniske gruppen regnes å være på 7000–8000 personer.

Det tredje samiske språket i Nordland, pitesamisk, har liten utbredelse i Norge, og det er kun noen få på norsk side av grensen som har kjennskap til språket. Pitesamisk ble snakket fra Saltenfjorden i nord til Ranfjorden i sør, det vil si områder som omfatter Beiarn Saltdal, Gildeskål, Meløy, Rødøy, deler av Bodø  og deler av Fauske  kommuner. Den siste som hadde språket som morsmål døde på 1960-tallet. I dag snakkes pitesamsik i området rundt Arjeplog i Sverige. Antall språkbrukere er regnet å være rundt 30 av ein etnisk gruppe på kring 2000 personer.

Umesamisk er det fjerde samiske språket med tilknytning til Nordland. Det ble talt i Hemnes, Rana og Rødøy.   I dag er språket helt fraværendet på norsk side, men til til tross for det lever kulturen videre, og flere nordmenn regner seg som umesamiske. Umesamisk blir snakket av rundt 20 personer av en etnisk gruppe på omkring 1000.

Det femte samiske språket i Nordland er sørsamisk. Antall språkbrukere er usikkert, men en regner med at det rundt 250–300 personer i Norge som snakkar sørsamisk og like mange i Sverige. Den etniske gruppen er regnet å være rundt 1200 personer. Språket er i bruk over et stort område, og en finner dialektale forskjeller som er så tydelige at en snakker om  «Vefsnsamisk» på Helgeland og i Namdalen) og «rørossamisk» i den sørlige delen av området.

Vi fikk heller aldri vite om samer på Helgeland selv om de befant seg i nabokommunene, og det var reinbeite på naboøya Dønna. Kanskje er det til og med samiske stedsnavn i Sandnessjøen? Se min artikkel om stedsnavnet Matstia.

1. Sørsamisk
2. Umesamsik
3. Pitesamisk
4. Lulesamisk
5. Nordsamisk
6.Enaresamisk
7. Østsamisk
8 Ahkkilsamisk
9. Kildinsamisk
  1. Sørsamisk
  2. Umesamisk
  3. Pitesamisk
  4. Lulesamisk
  5. Nordsamisk

*Tallene varierer fra kilde til kilde.


Etter at artikkelen ble publisert, gjorde seniorrådgiver ved Nasjonalbiblioteket Olve Utne meg oppmerksom på to kart som jeg legger ved. I Moréns kart er grensen tillatt s lulesamisk litt for langt sør),:

De samiske språkene. © Bruce Morén-Duolljá, CASTL, UiT (Foto: © Bruce Morén-Duolljá, CASTL, UiT) 

Ifølge Utne viser Quigstads kart omtrent rett grense mellom pite og lule i nord mens grensen mellom pite og lule er satt for langt nord.

Verktøy 4: Vokabular: Oversikt over ordmaterialet

Hvilke andre bearbeidelser enn dem som er nevnt under Verktøy 2 kan en gjøre med tekster?

Ressursene som omtales nedenfor finnes på ulike nettsteder. Vi tar utgangspunkt i siden om lesbarhetsindeks – lix.se. En finner også noe av det samme på skriftlig.no, men ikke alt. I den videre presentasjonen av ulike verktøy tar jeg utgangspunkt i et tidligere blogginnlegg om stedsnavnet Matstia. Teksten er mindre viktig i denne sammenhengen.

Når en sitter med en tekst som skal tilpasses en bestemt målgruppe, for eksempel personer som skal lære seg norsk, vil det være viktig å analysere teksten med hensyn til bestemte språktrekk. Hvor mange or har teksten totalt? Hvor mange forskjellige ord er det i teksten? Hvor mange lange ord inneholder den? Hvor er lang er setningene?

Den aktuelle teksten har fått liksverdien 35. ( 745 ord fordelt på 53 setninger gitt gjennomsnittlig setningslengde på 14,06 ord. 152 av ordene, 20,4 prosent,  har mer enn seks tegn. Liksblir 20,4+14,06=34,46. Avhengig av hvilken avrundingsmetode en bruker vil liksen bli 34 eller 35.

 

Hvordan lage liste over setninger?

Dette kan en gjøre i Word (søke etter punktum, og så erstatte det med punktum+ linjeskift for å få setningene listet under hverandre. En enklere måte er å gå til http://textanalysisonline.com/nltk-sentence-segmentation og lime inn teksten der. På et øyeblikk er alt klart i en egen kolonne som en kan kopiere over i det tekstbehandlingsprogrammet en bruker.

 

Hvordan lage liste over ord?

Både den norsk og svenske gir denne informasjonen direkte i og med at enkeltordene listes opp med dubletter fjernet. Totalt er det 354 forskjellige ordformer i teksten. Analysen tar imidlertid ikke høyde for at et og samme ord opptrer i ulike bøyningsformer. De ti mest frekvente ordene er:

 

Nr Ord Antall
1 det 29
2 i 23
3 en 22
4 er 19
5 navnet 18
6 16
7 av 15
8 et 15
9 som 15
10 og 14

Det er flere måter å renske ut bøyningsformer på. Metoden som følger her er litt omstendelig, men den er ikke komplisert. Fra den svenske lixsiden kopieres de tre kolonnene i Frekvensordlista over til en tekstbehandler, f.eks. Word. Marker kolonnene «Nr» og «Ord» og slett dem (først den ene kolonnen, så den andre). Marker den gjenstående kolonnen med ord, gå til Tabell og velg Konverter tabell til tekst, velg at ordene skal skilles med avsnittsmerking. Ordene står nå i samme rekkefølge som før, men de er frigjort fra tabellformatet. Det kan hende at noen av ordene er tilknyttet spesialtegn  som hermetegn eller bindestrek. Velg Søk/erstatt og søk etter det aktuelle tegnet og erstatt det med ingenting. (Vær oppmerksom på at bruk av spesialttegn påvirker ordtellingen. Et og samme ord ±hermetegn telles som to ord. Det beste hadde altså vært å fjerne slike tegn før en gjorde liksanalysen.) Marker så hele kolonnen med ord (Ctrl-A), gå til Tabell og velg Sorter. Ordene er nå sortert alfabetisk. Hvis det var tall i teksten, står de øverst. Slett dem. De første ordene i min liste er

alta
alternativ
alternative
altså
andre
annet
antall
at
av

Nå kan strykingen av bøyningsformer begynne. Det er spørsmål som dukker opp akkurat i denne listen. Det ligger i kortene at «alternativ» og «alternative» er samme ord, men hva med «annet» og «andre»?  «Andre» kan være flertallsformen av «annet» (og annen, anna) og slik må de to regnes som samme ord. «Andre» kan også være ordentallet («første, andre») og da må det regnes som et eget ord. En må altså sjekke teksten for å se hva slags ord en har med å gjøre (jeg kommer tilbake i et annet blogginnlegg med et nyttig verktøy). En gjennomgang av teksten viser at den inneholder 298 unike ord (med forbehold for feil etter en rask gjennomgang). Da er egennavn og forkortelser tatt med. Liksanalysen oppgir et såkalt type/token-forhold på 47,5 prosent. Dette tallet får en ved å sjekke antall forskjellige ord sett i forhold til alle ordene i teksten. Dette tallet øker altså når flere uker ord brukes. Store tall viser altså tekser med stor variasjon i ordforrådet. Etter å fjernet bøyningsformer av ord, faller naturlig dette tallet. I den aktuelle teksten er det på 40 prosent. Lix.se oppgir også to andre måter å regne ut variasjon på: OVIX (ordvariationsindex) og OVR (ordvariationsratio). Jeg går ikke inn på disse her. Formlene finnes på siden.

Noen av verktøyene som beskrives nedenfor gjør lignende operasjoner, noen av dem på enklere måter enn dem som er listet her.

 

Prosentvis andel av hvert ord

Nettstedet Textmechanic.com gir mulighet til å få tall på hvor hyppige de ulike ordene opptrer regnet i absolutte tall og prosent. Kopier inn teksten, trykk på knappen og tallene er klare. En får også opplysninger om hvor mange bokstaver og ord teksten inneholder i tillegg til antall setninger.

 

Hvordan sortere etter ordlengde?

Hva så med sortering etter lengde? På siden http://appincredible.com/online/list-sort/ kan man lime inn tekst og be om å få innholdet sortert etter lengde. Resultatet ser slik ut hvis en velger fra korteste til lengste:

a a i i i i i i i i i i i i i i i i i i i i i i i at at at at at at at at at at at av av av av av av av av av av av av av av av da da da da de de de de ei ei en en en en en en en en en en en en en en en en en en en en en en er er er er er

Ber en om en liste som viser ord fra lengst til kortest ser listen slik ut:

stedsnavnregister omfortolkninger landskapsformer landskapsformer facebooksidene sandnesjentene ruoššaluokta norskspråklig sandnessjøen sandnessjøen sandnessjøen rettskrivning

Dette er nyttig, men det krever ekstra arbeid for å få alt på plass slik at kan se nærmere på vokabularet. For det første vil en gjerne har ordene ordnet i kolonner. Den enkleste måten å gjøre dette på her er å kopiere teksten inn i Word, søke etter mellomrom og så erstatte mellomrommet med avsnittsmerke. Da kommer ordene under hverandre slik:

stedsnavnregister
omfortolkninger
landskapsformer
landskapsformer
facebooksidene
sandnesjentene

Det ser ut til at ord nr. 2 har kortere utstrekning enn nr. 3, men det er faktisk ikke kortere. Avviket kommer av at bokstavene i fonten er av ulik utstrekning. Dersom en bytter til en font der alle bokstaver har samme utstrekning horisontalt, f.eks. Courier, blir resultatet slik:

stedsnavnregister
omfortolkninger
landskapsformer
landskapsformer
facebooksidene
sandnesjentene

Da ser en at ord 2-5 faktisk er like lange, dvs at de har like mange bokstaver.

Listen viser at vi ikke er kvitt dubletter. De kan en enkelt få bort ved å gå til http://www.tracemyip.org/tools/remove-duplicate-words-in-text/ og kopiere inn teksten. På dette nettstedet kan en få den ferdig teksten sortert alfabetisk (forlengs og baklengs) eller i original rekkefølge. Hvis en limer inn ordene som er sortert etter lengde (jf. prosedyren ovenfor), vil en få ut en liste med enkeltforekomster etter fallende ordlengde.

stedsnavnregister omfortolkninger landskapsformer facebook-sidene sandnesjentene ruoššaluokta norskspråklig sandnessjøen rettskrivning nyfortolkning gjeterguttene

Ordene er ikke sortert som kolonne, prosedyren for å få det til er angitt ovenfor.

stedsnavnregister
omfortolkninger
landskapsformer
facebooksidene
sandnesjentene
ruoššaluokta
norskspråklig
sandnessjøen
rettskrivning
nyfortolkning
gjeterguttene

Etter dette gjenstår det bare å slette bøyningsformer (jf. ovenfor).