|
|
- Med
bokstavfrekvens mener vi hvor mange ganger hver bokstav fins
i en viss mengde av bokstaver eller ord. Denne forekomsten
blir som regel oppgitt i prosent av hele bokstavmengden, og
slik blir det også gjort i tabellen under.
-
- Det
er to typer kilder som er særskilt relevante når en skal
regne ut bokstavfrekvensen i språket. Den ene er ordene
slik de står som oppslagsord i en ordbok eller ordliste. Som grunnlag her er brukt
Bokmålsordboka, med om lag 60 000 oppslagsord.
-
- Den
andre typen kilde for bokstavfrekvens er å ta med alle
ordene som fins i en tekstmasse. I dette tilfellet er
tekstmassen skaffet fra Humanistisk datasenter (Norsk
Tekstarkiv) i Bergen. Den tekstmengden som er benyttet,
inneholder noe over 800 000 ord fra bokmålsaviser.
-
- I
en ordbok er det slik at hvert ord er oppført én gang, og
bøyninger er ikke er tatt med når bokstavfrekvensen skal
regnes ut. I en tekstmasse derimot, kan samme ordet være
benyttet flere ganger og med ulike bøyninger. Dette gir seg
utslag i at den samme bokstaven har ulik frekvens i de to
kildene.
-
- I
tabellen under vises bokstavfrekvensen i Bokmålsordboka og
tekstmassen. I første kolonne ser vi hvor ofte hver bokstav
er først i
ordene. I neste kolonne vises den totale
bokstavfrekvensen.
-
- Legg
spesielt merke til bokstaven E. Den har en frekvens på
2,7/6,5 først i ordene, og 10,1/15,2 totalt. Dette skyldes
blant annet at vi
har en viss andel ord som slutter på -er,
-ere, -eri,
-else. Dertil kommer mange verb og substantiver som slutter på -e.
- Og
i tekstmassen fra bokmålsavisene er det i tillegg mange ord
med bøyningsendelsene -en,
-et, -ene.
-
- Andre
ting som er påfallende, er at bokstaven H forekommer langt
hyppigere først i ordene enn totalt sett. Det samme gjelder
S, mens N og R er vanligere totalt enn som førstebokstaver.
-
-
|
- Bokmålsordboka
|
-
|
- Bokmålstekst
|
-
|
- Først i
- ordene
|
-
- Totalt
|
-
|
- Først i
- ordene
|
- Totalt
|
- A
- B
- C
- D
- E
- F
- G
- H
- I
- J
- K
- L
- M
- N
- O
- P
- Q
- R
- S
- T
- U
- V
- W
- X
- Y
- Z
- Æ
- Ø
- Å
|
- 4,9
- 6,8
- 0,5
- 3,6
- 2,7
- 7,8
- 4,3
- 6,2
- 2,6
- 1,0
- 7,6
- 4,6
- 5,1
- 2,3
- 2,5
- 4,2
- 0,03
- 3,3
- 14,0
- 5,7
- 3,4
- 5,3
- 0,1
- 0,04
- 0,2
- 0,1
- 0,1
- 0,6
- 0,4
|
- 6,5
- 2,3
- 0,2
- 3,8
- 10,1
- 2,5
- 4,1
- 1,6
- 6,3
- 1,6
- 5,5
- 6,3
- 3,3
- 6,4
- 4,5
- 2,5
- 0,01
- 7,9
- 7,7
- 6,7
- 3,0
- 2,9
- 0,03
- 0,02
- 1,4
- 0,03
- 0,3
- 1,7
- 0,9
|
|
- 5,8
- 4,4
- 0,3
- 7,3
- 6,5
- 7,1
- 2,6
- 5,8
- 6,1
- 1,3
- 4,1
- 2,8
- 5,8
- 2,8
- 6,2
- 3,7
- 0,01
- 2,0
- 11,4
- 5,0
- 1,9
- 4,5
- 0,2
- 0,02
- 0,1
- 0,03
- 0,04
- 0,5
- 1,9
|
- 6,1
- 1,5
- 0,2
- 4,3
- 15,2
- 2,0
- 3,8
- 1,6
- 6,2
- 1,0
- 3,8
- 5,4
- 3,3
- 8,1
- 4,9
- 1,9
- 0,004
- 8,6
- 6,7
- 7,9
- 1,6
- 2,5
- 0,1
- 0,03
- 0,7
- 0,03
- 0,2
- 0,9
- 1,5
|
Kilde:
Laurits Killingbergtrø
|
|