Bokstavfrekvens i kryssord

 

 
 
Med bokstavfrekvens mener vi hvor mange ganger hver bokstav fins i en viss mengde av bokstaver eller ord. Denne forekomsten blir som regel oppgitt i prosent av hele bokstavmengden, og slik blir det også gjort i tabellen under.
 
Tabellen viser bokstavfrekvensen i en mengde på omkring 4000 ord i kryssord med til sammen 19 000 bokstaver. I tabellen går det frem hvor vanlig hver bokstav er i ordtilfanget i kryssord. Det er løsningsordene (svarordene som løseren skriver i rutene) som er kilden.
 

Bokstavfrekvens i kryssord

 
 
Først i
ordene
 
Totalt
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
Æ
Ø
Å
 8,7
 3,8
 0,2
 3,4
11,4
 2,8
 3,4
 1,9
 4,7
 0,7
 4,7
 5,0
 3,2
 4,7
 4,4
 2,5
 0,0
 7,5
11,6
 7,3
 3,2
 2,1
 0,03
 0
 0,4
 0
 0,1
 1,0
 1,4
 7,7
 1,5
 0,1
 2,9
17,5
 1,1
 3,2
 0,7
 6,3
 0,5
 4,2
 5,7
 2,5
 7,3
 4,2
 1,6
 0,0
10,6
 7,7
 7,9
 2,4
 2,1
 0,01
 0
 0,8
 0,01
 0,1
 0,8
 0,8
 
Tallene for ulike posisjoner har de samme tendensene som i 
allmennspråket. For eksempel er S vanligere som førstebokstav enn totalt. Bokstaven E er vanligere totalt, slik det også er i allmennspråket. Vi ser likevel at E står først i så mange som 10 % av ordene i kryssord. Dette skyldes at kryssord ofte har med bøyde former (dette gjelder om lag 30 % av ordene i kryssord).
 
Videre er det slik at visse bokstaver har en høyere frekvens som førstebokstav i kryssordspråket enn i allmennspråket.
 
Dette kan forklares med den måten som kryssordet blir laget på: En kryssordforfatter må rimeligvis starte med et enkeltord. Men resten av ordene må bygges ut fra dem som alt er skrevet. Derfor blir bokstaver som står noe ute i et ord, ofte førstebokstaver i nye ord. Et konkret eksempel  kan vise denne utviklingen:
 
Her har  kryssordforfatteren startet i øverste venstre hjørne med ordet VINTERSOLEN. Når en ser bort fra førstebokstaven V, så er alle bokstavene ganske vanlige ute i ordene i allmennspråket.  Men mange av dem er slett ikke vanlige som førstebokstaver. Av bokstavene i kryssordeksempelet gjelder det bokstaver som I, N, E, R, O, A. I diagrammet ovenfor er disse bokstavene plassert slik at de kommer til å stå først i de nye loddrette ordene som skal lages. Det blir nye loddrette ord som må begynne på V, I, N osv. Slik blir det også når resten av kryssordet skal snekres sammen: Første bokstaven i nye ord er en bokstav som alt står noe uti et ord som er skrevet fra før. De bokstavene som er vanlige «totalt», blir derfor i kryssord òg mer vanlige «først i ordene». Slik får de nevnte bokstavene I, N, E, R, O og A en høy frekvens «først i ordene» i kryssord, selv om de har heller lave tall i ordbøker.
 
Det blir nærmest en utfordring å finne på ord på for eksempel E-. Det er vel noe av  grunnen til at det har blitt en god del såkalte kryssord-ord på E: ETA, ERATO, EA, EL, EMU, EDIKT, ENARE, ELAN, EGAL, EAGLE, ERTS, EGEDE, EGO.
 
Bokstavfrekvens og kryssordlaging
Etter dette  kan man stille spørsmålet: Kan kunnskap om dette være til hjelp når du sitter og løser kryssord? På en blank og uløst kryssordoppgave kan det ikke det. En vet riktignok at 11 % av alle ord begynner med S og at 20 % av ordene slutter på E, men det er for lite å starte med. Når man derimot har løst en del, kan det være til hjelp når en vet noe om hva som er sannsynlige bokstavkombinasjoner.
Når for eksempel R (eller L eller M) står først i et ord, må det mest sannsynlig komme en vokal som nummer to.
Her er noen andre eksempler hvor sannsynligheten er angitt i prosent:
- Når K er andre bokstaven i et ord er det 80 % sjanse for at S er første bokstaven.
- Når G er siste bokstaven i et ord er det 50 % sjanse for at ordet ender på -NG, og 28 % sjanse for at ordet skal ende på -IG.
- Når J er tredje bokstaven i et ord er det over 50 % sjanse for at ordet begynner med SKJ-.
 
Kodekryssord
I den kryssordtypen som blir kalt kodekryssord, kommer kunnskapen om bokstavfrekvens og bokstavkombinasjoner godt med. I kodekryssordet er som kjent rutene fylt med tall. Ett og samme tall skal da stå for én og samme bokstav når kryssordet  løses. Dermed skal det bli ord både vannrett og loddrett på vanlig måte. Når en løser slike kryssord starter en gjerne med å se etter hvilket tall det er mest av. Dette tallet må man da tro skal stå for E, for ifølge tabellen øverst på siden er E den mest frekvente bokstaven i kryssord. Denne tendensen for E er enda tydeligere om en ser på slutten av ordene. Der fins E i over 25 % når en gransker de to siste bokstavene av ordene i kryssord, slik det er gjort i tabellen til venstre nedenfor:
Blant de to siste bokstavene Som siste bokstav etter E
E   26,2
R   13,5
A    5,4
T    9,3
N    9,0
R   54,5
N   19,3
T   11,6
Når man tror at man har funnet E-ene i kodekryssordet, kan en løse videre. Blant annet kan en se på tilfellene der E-en står nest sist i ord. Da er det mest sannsynlig at R blir den bokstaven som kommer etterpå, slik tabellen ovenfor til høyre viser.
 
Avslutningsvis må det sies at man ikke akkurat trenger teoretiske kunnskaper for å gjette seg frem til sannsynlige bokstavkombinasjoner i kryssord. Drevne løsere har hele tiden følelse for hvilke bokstaver som passer eller ikke passer sammen med dem som alt er skrevet, og de prøver seg frem etter det.
                                                                                              Kilde: Laurits Killingbergtrø
 
Litteratur:
Killingbergtrø, Laurits 1994. Språket i kryssord. Oslo: Institutt for nordistikk og litteraturvitskap.
 
 
 
Opp ] [ Bokstavfrekvens i kryssord ] Bokstavfrekvens i allmennspråket ] Hva er Re? ] Omtale av x-ord-bøker ] Ordbøker og leksika ]
Redaktør: Jan-Tore Stien