和文符号の使用頻度と符号長さ

一般の文章の文字の出現確率の情報から、モールス符号の長さの決め方を検証してみました。欧文と違って、出現頻度に関係なしに符号が決められていることがよくわかると思います。HI

末尾に、頻度順の符号長のグラフを入れました。(2002/06/16)

ham-net トップ CWの部屋トップ CW入門 CW雑学トップへ戻る CW技術資料 展示室 掲示板 リンク集
和文頻度 文字 出現確率(%) 符号 符号長単位数(1短点+デリミタ1短点長スペースを足した長さを1とする。それに各文字の文字間デリミタ1を足す) 和文平均との比較

(6.391より長い/短い)
和文重み付き符号長
1 9.502 トト 3 短い 0.285
2 5.054 トツー 4 短い 0.202
3 5.027 トツートト 6 短い 0.302
4 4.721 ツーツートツート 9     長い 0.425
5 4.236 ツート 4 短い 0.169
6 4.161 トツートツーツー 9     長い 0.374
7 3.88 トトツーツー 7     長い 0.272
8 3.858 トトツートト 7     長い 0.27
9 3.843 トトツー 5 短い 0.192
10 3.368 トツートツート 8     長い 0.269
11 3.132 トツーツート 6 短い 0.188
12 2.554 ツートツー 5 短い 0.128
13 2.545 ツートツート 7     長い 0.178
14 2.498 ツーツーツーツー 9     長い 0.225
15 2.395 トツート 5 短い 0.12
16 2.286 トトトツー 6 短い 0.137
17 2.043 ツートツーツート 9     長い 0.184
18 2.027 ツートツートト 8     長い 0.162
19 2.023 ツートトツー 7     長い 0.142
20 1.852 ツーツー 5 短い 0.093
21 1.806 ツートトツート 8     長い 0.144
22 1.781 ツーツートツーツー 10     長い 0.178
23 1.608 トトト 4 短い 0.064
24 1.515 ツーツーツートツー 10     長い 0.152
25 1.449 ツートツートツー 9     長い 0.13
26 1.414 トツートトト 7     長い 0.099
27 1.395 ツーツーツー 7     長い 0.098
28 1.394 トツーツーツー 8     長い 0.112
29 1.384 ツーツート 6 短い 0.083
30 1.177 ツーツーツート 8     長い 0.094
31 1.117 ツートトト 6 短い 0.067
32 1.101 トトツート 6 短い 0.066
33 1.008 ツートツーツー 8     長い 0.081
34 0.943 トツーツーツート 9     長い 0.085
35 0.932 ツートツーツーツー 10     長い 0.093
36 0.926 トトツートツー 8     長い 0.074
37 0.911 ツートトツーツー 9     長い 0.082
38 0.886 ツーツートトツー 9     長い 0.08
39 0.835 トツーツー 6 短い 0.05
40 0.718 ツーツートト 7     長い 0.05
41 0.686 ツートト 5 短い 0.034
42 0.614 トツートツー 7     長い 0.043
43 0.582 ツートトトツー 8     長い 0.047
44 0.319 ツーツートツー 8     長い 0.026
45 0.3 ツー 3 短い 0.009
46 0.289 トトツーツート 8     長い 0.023
47 0.267 2 短い 0.005
48 0.11 トトトト 5 短い 0.006
            6.391
            和文重み付き平均符号長

和文の出現頻度順に符号の長さを並べてみました。出現頻度が少ない文字にも短めの符号が割り当てられていることがわかります。欧文のそれと見比べると、違いがよくわかります。横軸は頻度順、縦軸は、頻度は%、文字長は短点マークを1とする単位長。一番短い「ヘ」が2単位となります。47番目!