Bokstavfrekvens i allmennspråket

 

 
 
Med bokstavfrekvens mener vi hvor mange ganger hver bokstav fins i en viss mengde av bokstaver eller ord. Denne forekomsten blir som regel oppgitt i prosent av hele bokstavmengden, og slik blir det også gjort i tabellen under.
 
Det er to typer kilder som er særskilt relevante når en skal regne ut bokstavfrekvensen i språket. Den ene er ordene slik de står som oppslagsord i en ordbok eller ordliste.  Som grunnlag her er brukt  Bokmålsordboka, med om lag 60 000 oppslagsord.
 
Den andre typen kilde for bokstavfrekvens er å ta med alle ordene som fins i en tekstmasse. I dette tilfellet er tekstmassen skaffet fra Humanistisk datasenter (Norsk Tekstarkiv) i Bergen. Den tekstmengden som er benyttet, inneholder noe over 800 000 ord fra bokmålsaviser.
 
I en ordbok er det slik at hvert ord er oppført én gang, og bøyninger er ikke er tatt med når bokstavfrekvensen skal regnes ut. I en tekstmasse derimot, kan samme ordet være benyttet flere ganger og med ulike bøyninger. Dette gir seg utslag i at den samme bokstaven har ulik frekvens i de to kildene.
 
I tabellen under vises bokstavfrekvensen i Bokmålsordboka og tekstmassen. I første kolonne ser vi hvor ofte hver bokstav er først i ordene. I neste kolonne vises den totale bokstavfrekvensen.
 
Legg spesielt merke til bokstaven E. Den har en frekvens på 2,7/6,5 først i ordene, og 10,1/15,2 totalt. Dette skyldes blant annet at  vi har en viss andel ord som slutter på -er, -ere, -eri, -else. Dertil kommer mange verb og substantiver som slutter på -e.
Og i tekstmassen fra bokmålsavisene er det i tillegg mange ord med bøyningsendelsene -en, -et, -ene.
 
Andre ting som er påfallende, er at bokstaven H forekommer langt hyppigere først i ordene enn totalt sett. Det samme gjelder S, mens N og R er vanligere totalt enn som førstebokstaver.
 
 
Bokmålsordboka 
 
Bokmålstekst
 
Først i
ordene
 
Totalt
 
Først i
ordene
Totalt
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
Æ
Ø
Å
 4,9
 6,8
 0,5
 3,6
 2,7
 7,8
 4,3
 6,2
 2,6
 1,0
 7,6
 4,6
 5,1
 2,3
 2,5
 4,2
 0,03
 3,3
14,0
 5,7
 3,4
 5,3
 0,1
 0,04
 0,2
 0,1
 0,1
 0,6
 0,4
 6,5
 2,3
 0,2
 3,8
10,1
 2,5
 4,1
 1,6
 6,3
 1,6
 5,5
 6,3
 3,3
 6,4
 4,5
 2,5
 0,01
 7,9
 7,7
 6,7
 3,0
 2,9
 0,03
 0,02
 1,4
 0,03
 0,3
 1,7
 0,9
 5,8
 4,4
 0,3
 7,3
 6,5
 7,1
 2,6
 5,8
 6,1
 1,3
 4,1
 2,8
 5,8
 2,8
 6,2
 3,7
 0,01
 2,0
11,4
 5,0
 1,9
 4,5
 0,2
 0,02
 0,1
 0,03
 0,04
 0,5
 1,9
 6,1
 1,5
 0,2
 4,3
15,2
 2,0
 3,8
 1,6
 6,2
 1,0
 3,8
 5,4
 3,3
 8,1
 4,9
 1,9
 0,004
 8,6
 6,7
 7,9
 1,6
 2,5
 0,1
 0,03
 0,7
 0,03
 0,2
 0,9
 1,5
                                                                                   Kilde: Laurits Killingbergtrø
 
 
 
Opp ] Bokstavfrekvens i kryssord ] [ Bokstavfrekvens i allmennspråket ] Hva er Re? ] Omtale av x-ord-bøker ] Ordbøker og leksika ]
Redaktør: Jan-Tore Stien