Download View/Open - HERMES-IR

Transcript
Title
Author(s)
Citation
Issue Date
Type
問題解決の視点からみた現在・過去・未来(VII)
岡山, 誠司
一橋大学研究年報. 自然科学研究, 27: 3-91
1990-08-10
Departmental Bulletin Paper
Text Version publisher
URL
http://hdl.handle.net/10086/9427
Right
Hitotsubashi University Repository
間題解決の視点からみた
現在・過去・未来(皿)
岡 山
目 次
第五章 計量情報論 序説(続)
3,情報の量とその計測法
(A)容器法
(B)文字数法
(C) 文字列種数法
(D) いいあて法
4.情報の量の定義と基準化
(A) 出にくさの指標
(B)相対エント・ビーと冗長度
5.情報量からみた情報の伝達
(A) コード用語のいろいろ
(B) 2元符号語による文字の伝送
(C)通信の質の確保
6.符号当りの情報量
(A)情報伝送速度
(B)伝送速度の概念拡張
(C)予言の情報量
3
誠 司
一橋大学研究年報 自然科学研究 27
3 情報の量とその計測法
情報とか,情報化というコトバは今日では聞きなれてしまって‘‘あいさ
つ”なみになってしまった.しかしコンピュータや各種の通信機器の急速
な進展がみられるようになったのは通信(情報)理論が確立されたことが
その背景にある,それはあらゆる情報表現や表記をすべて2元符号語に変
換して伝送することを前提とした理論大系であった.従って情報の量は,
ビット単位で表わすことで統一されてしまった.
ここでは,通信やコンピュータで使われるピット単位の他に,日常的な,
社会的な意味で受取られ,理解されている,そうした情報にまで視野を広
げて“量”の概念をサーベイし,そうしたなかで,いわゆる“ビッドン単
位はどのように位置づけられるのかを探っていく.
このような立揚から,情報の計測法をレベルの低いほうから以下,順次
とりあげていく,
(A)容器法
情報を入れるr入れもの」の大きさではかる法である.
例えば,新聞紙という情報を運ぶ入れものがある.この入れものは,平
日の新聞よりは日曜日の新聞が,また朝刊やタ刊だけよりは,朝・夕刊の
セットで購読するほうが入手できる情報量が多い.タブ・イド版よりふつ
う版のほうが情報量が多い,
ラジオも音声一電波一音声という形式で情報を耳へ伝える.夜の11:00
で放送終了する放送局よりも朝の2:00まで放送する民間局が送ってくる
情報量は多い.このような認識のしかたで情報の量を理解するばあいであ
る.
4
間題解決の視点からみた現在・過去・未来(畷)
現実には,こうしたはかりかたが結構採用されている.
(1)郵便
はがき:1枚分40円.字を細かくしていくら多量の文字を書いても料
金は割増にはならない,しかし1枚分を“私製はがき”だからといって勝
手に大きなサイズにはできない.
許される絵はがきのサイズは長辺14∼15cm,短辺9∼10.7cmと制限さ
れている.
定形郵便物なら長辺14∼23・5cm,短辺9’》12cm,厚さ1cm以下,重量
50g以下など.
てがみ:重さ(g数)で料金がきまる.定形郵便物なら25gまで60円,
50gまで70円など,
電子(コンピュータ)郵便:郵政省製の封筒と通信文用紙が1枚ついて
20円,これに郵送料60円を加えて80円(注;’89・3・31以前の料金体
系)
(2)電話
これも‘‘秒数”で料金がきまっており,早口で多くの言葉をしゃべった
からといって料金は増額するといったシステムではない.
このほか,旅行先での案内ガイド料金は,例えば1日当り10ドル,と
いうきめかたがふつうである.
しかし,こうした情報をのせる“空間”や‘‘時間”の‘‘入れものや大き
さ”をもって,そこに盛りこまれた情報の量とするのは荒っぽいきめかた
ではある.
スクラップ(切張り)用紙にはった1枚分の情報といっても,それが,
ふつうの新聞紙からの切抜きのぱあいと縮刷版のコピーのばあいとで,ま
たマイク・フィルムが収納されているばあいとでは,情報量は明らかに後
者ほどふえているはず・逆に点字や大活字本の切抜きでは減ってくる.
5
一橋大学研究年報 自然科学研究 27
そこで,情報面密度で,まず比較することになる.
新聞1ぺ一ジ分(面積オ)の情報量を1とすれば,縮刷版ないしマイク
・フィルムに縮小したとき,その倍率をβとするとβ≡」/L
ここでL=オリジナルの辺長,左縮刷の辺長である.縮刷の面積を¢
とすれば,単位面積当りの情報量,つまり情報面積密度σは新聞(オリジ
ナル)でσ4=1μ,縮刷でσβ=1/α,ここでωμ=(z/L)2=β2,従って,
情報面密度の比,つまり情報面密度倍率σB/σ4は,大きさ倍率βの2乗
の逆数となる。
情報時間密度についても同様に考えられる.
標準速度で1本分を時間丁で吹きこんだ情報量を1とすれば,これを
圧縮したとき,その倍率を7とするとγ封/T
ここでむは圧縮したテープの収録時間である.
単位時間当りの情報量,つまり,情報時間密度ρは,標準テープで融
=1/T,圧縮テープでρB=1κ,
従って,情報時間密度の比,つまり情報時間密度倍率ρBノρ4は,時間
倍率7の逆数となる.
こ・のように情報密度のような基準化を行ってみると,単なる“入れもの”
で情報の量をはかることは混乱のもとになることがわかる.そこで,つぎ
は,情報の量を“文字数”ではかることになる.なおここでは,文章また
はそれに等価換算できる話しコトバに,情報を限定しておく.
(B)文字数法
情報を構成している文字列に含まれる文字数の大きさ(文字列の長さ)
ではかる法である.
例えぱ,1月当り10冊の雑誌を読むばあい,そこに含まれている情報
量を,
6
問題解決の視点からみた現在・過去・未来(辺)
10(冊/月)×100(ぺ一ジ/冊)1000(語!ページ)×8(字/語)
=8×106(字/月)
と計算して,月あたり800万字の情報量がこれらの雑誌により提供された
とみる.年間には,この12倍,約1億字とみつもる.
経企庁の予測(1985)によると,テレビ,ラジオ,新聞,雑誌,書籍,
郵便,電報,電話,テレビ電話,コンピュータなどから与えられる,国民
1人当りの情報量は,1年間で,前出の1億字の約40倍(A5,200ぺ一
ジの雑誌2万冊分)になる(なおこれには人と人との直接対話の情報は含
まれていない)と新聞に発表していたが,このはかりかたの例である.
とにかく,このように文字数で情報の量の目安とする考え方も,広く現
実に採用されている.
(1)電報
字数によって料金がきまる.
(2) レタリング
1文字ごとで料金がきまる.
このように,文字数で情報の量をきめるとき,文字のコ数の単なる多さ
だけにとどまらず別の意味が生じてくる.
文章で,文字数が多くなると一般に,“区別”がより細かくできるよう
になる.
情報であることの基本条件は,他とそれとが“区別”できることにある.
例えば,
①rネコ」がいる……という文章だけではそこにネコがいるというだけ,つまり,
そこにいるのは,ライオンでもネズミでもないということを指示している.
②隣りの家の「ネコ」がいる……となれぱ,向いの家のネコでも後ろの家のネ
コでもないことが明らかになる,ネコの飼主がはっきりする.
③隣りの家の三毛の「ネコ」がいる……となれば,ネコは白でも白黒プチでも
7
一橋大学研究年報 自然科学研究 27
ない,とネコの外観が区別されてくる.
④隣りの家の三毛のおやネコがいる・ ・一
なるとネコは子ネコではないと指定
される.
このように区別がよりくわしくなっていくほど,“情報”は増え.たこと
になる.そのためにはふつう文字数をそれだけ多くしなければならない.
では,情報の量を文字数で表わせば,それで問題がないか,といえば,
そう簡単ではない.
日本文で,漢字かなまじり文をすぺてかな
表1 ポラロイド・ランド・
フィルム(Type108) 書きにすると,文字数はふえる。
保証と注意の文字数 っまり,同じ意味内容(情報量)が,異な
文字数
国 語
る文字体系では異なる文字数になってしまう.
Italiano
940
もちろん,日本文を外国語へ翻訳する際にも
858
Dansk
同じことがおこる.
857
Portugues
840
Deutsch
例えぱ,
Nederlands
815
ポラロイド・ランドフィノレム Type108
814
Espano1
804
Frangais
のパッケージの中に取扱説明書がはいってい
English
774
Svens1【a
739
る.取扱い方,保証についての説明,取扱い
上の注意事項の記載が,世界12ヵ国語でな
380
日本語
199
中国語
されている,
(注=アラビア語は除く) いま,これらの記載事項のうち,保証と注
意の部分だけまとめて文字数を調べてみた.
文字数の多い国語からならべてみる(表1).
最も短いのは,いうまでもなく中国語,これを規準にして日本語(漢字
かなまじり文)が約2倍の長さになる.欧米語ではスウェーデン語が最短
で,これを規準にしてイタリー語はその3割増しになっている.この違い
は1!e法則に照らしても無視できない.
8
問題解決の視点からみた現在・過去・未来(孤)
図 1
外国語教室
英語
ドイツ語 日本語
英語 ドイツ語
バツ ト
フ リ ダ ロ マ ウ ス
マンダリンダツク プロロテント
ペ ア
ペ ア
モ ン キ ヒ ア フ エ
キ ヤ メ
ル
カ メ ル
オツクス ステ イ ロ ア
ギヤツト
カ ツ ツ エ
パンノ バンダ
ぱんだ
27PANDA……der Pan〔ia………
コ ツ ク
ハ ン
ノマロソト ノサノぐガイ
カ ウ
ク リ
ピー73ロル フρ7アウハーン
デ イ ア
ヒ ア シ ニ
ペンギン ビングイロン
ロツ ク
1BAT・
2BEAR…”
3CAMEL…・
4CAT一・
5COCK・
6COW一
7DEER・
日本語
24M.DUCK……die Brautente… おしどり
・die Flede㎜aus こうもり
25MONKEY…der Affe…一・・
・der Bar− 9・・”くま
・さる
260X……………der Stier…一
das Kame1一 ・らくだ
・diel(atze一 ・ねこ
・おうし
28PARROT…der Papagei……
・derHahn… おんどリ
おうむ
29PEAFl)WL…der Pfauhahn…
・d玉eKuh・・ めうし
くじゃく
30PENGUIN…der Pinguin… ・ペンギン
der Hirsct一 しか
フ ン ト ウ
ペリカン ペリカロン
ダ ヲ ク
エ ン テ
ビ ジ ヨ ン タ ウ ペ
イ ロ グル
ア ド ウ ラ ロ
ゑ ラいヘア ネロヂボルペア
33POLAR・BEAR der Nδrdpol Bar・
エ レ フ ア ン ト
エレ フ ア ン ト
ポロキユバイン シユタツハルシスワイン
フオツクス
フ ツ ク ス
ラ ツ ト ラ テ
フ アリ シ ロ ル
ゼ ロ ペ ア
ラ ビ ツ ト ノヤ リ ゼ
ゴ ウ ト
テ ロ ゲ
ホ コ ク
フ ア ル ケ
ライノサヲス ナシヨロルン
ヘ ネ
シ ロ プ シ ヤ ロ フ
39SHEEP………das Schaf…・
ひつじ
ニじルプフエアト
スパロ スパツツ
すずめ
8DOG…
31PELICAN…der Pelikan…一 ・ぺりかん
・der Hund一 いぬ
32PIGEGN……die Taube…
9DUCK・・…… dieEnte一 ・あひる
10EAGLE……
der Adler…… わし
11ELEPHANT… derElefant…・ぞう
12FOX・…
13FURSEAL…
15HAWK・…
16HEN一 …
ヒ ボ ウ
17HIPPO…一
34 PORCUPINE・一das Stache【schwein やまあらし
35RAT…………dir Ratte…・
・derFuchs・・… きつね
dirZiege ・やぎ
38RHINOCEROS der Nashom・一
der Falke一一・ たカ』
・dirHenne…… めんどり
・・
・ねずみ
うさぎ
36RABBIT……der Hase・
ラクロン ヴァシュベァ
37RACCOON…der Waschbar・・ あらいぐま
der Seebar…” ・おっとせい
14GOAT………
はと
・ほっきょくぐま
40SPFRROW…der Spatz一
as Nilpferd一 りかば
・さい
ホ ロ ン ア ウ ル
オ ロ ロ イ レ
ス ク イ ラル アイヒヘルンヒエン
ホ コ ス
プフエア ト
テイノぐロ タピロル
レ パ ロ ド
レ オ パ ロ ド
タイガリ テイガロ
43TIGER………der Tiger・・…… とら
ライオン
ン ロ ヴ エ
ト
リンクス
ヴイルロカツツエ
ワイルドボー マ コ リ
が テ イ ツ ヒ
ウ ル フ ヴ オ ル フ
41SQUIRREL das Eichhomchen一
18HORN・OWL・・ ・dieOhreule… みみずく
19HORSE…… dasPferd…一 42TAPIR………der Tapir一・
うま
20LEOPARD… derLeopard… ひょう
シルトクンロタ
21LION……… derL6we…… らいおん 44TORTOISE…dir Schildkr6te
ばく
カ】め
ヴイルトシスノτイン
45WILDBOAR…(las Waldschwein一 いのしし
22LYNX……・一 dieWildkatze− 9おおやまねこ
23MACAW……
ロ タ ス りす
46WOLF………der Wolf
derS三ttich・一 ・いんこ
・おおカ】み
(ギンビス たぺっこどうぶっ)
9
一橋大学研究年報 自然科学研究 27
中国語の漢字と,日本語の漢字かなまじり文でも長さに差がつくのは当
然であるが,欧語どうしでも結構な違いがあることがわかる,
別の例l rビスケット」のパッケージ外側に46種の動物が英語,独語,
日本語(かな)で並記してあるのが眼にとまった(図1).1単語当りの平
均字数を求めると英語で548字.独語で6.35字,日本語で3.15字となる.
これより英語は日本語のL74倍,これは前出のフィルムの例のぱあい
774/380=2.04にほぼ近い.
また独語は英語の1・16倍,これもフィルムの840/774=1・09にほぽ近い.
単純な比較であるが,われわれの言語系の相違は,こうした日常的に眼
につくサンプルからイメージしてることを考えるなら気軽に数値的なチェ
ックをしてみることの必要性を痛感する.
(C) 文字列種数法
ここで,文字列のもつ,もう1つの別の側面に眼を向けてみよう.
さきに,同じ内容が異なる文字数になると気づいたが,逆に,同じ文字
数でどれだけ異なる内容が表わせるかを考えてみる,ふつう内容を異にす
るためには,文字列が異ならなければならない.これは必要条件である.
しかし,意味ある文章の各文字を入れかえてつくれる異なる文字列は,必
ずしも異なる別の意味内容をもつようになるとは限らない.
大部分は意味なき単なる文字列に過ぎなくなる.
しかし,第1近似として,文字を入れかえてつくれる異なる文字列の種
類数(種数)が異なる内容の文字列をつくる可能性があるとして,情報の
量の指標とすることが考えられる.つまり,情報を構成している文字列の
もつ情報量を,各文字を入れかえてつくれる異なる文字列の種類ではかる
法である.
文字数πコの文字列を考える.
10
問題解決の視点からみた現在・過去・未来(W)
①文字数麓が多くなると,一般に異なる文字列の種類は大きくなる、こ
れより,この情報量は文字数法ではかる情報量とその方向が一致すること
がわかる.そのほかこの法では,
②文字(アルファベット)の種数(字種数)Mが大きくなっても・文字
列の種数(列種数)は大きくなる特長をもつ.
そこで,字種数胚で,長さπの文字列がもつ情報の量は,列種数胚鶉
で与えられると定義する.
欧語のアルファペットについては,英語ではAからZまで菰=26だ
が,独語ではU,A,Oおよびエスツェットβを別字とすると1匠=30とな
るし,仏語ではg161ム,6,軌a,e,i,6漁を別字とすると胚=36となる。
スペイン語はCh,L1,N,rrを追加してM=30,ギリシヤ語では巫=
24,露語ではM=33,イタリヤ語では,外国語を示すための5種を追加し
てκ=26,このほか,アラピア語で翌=29,ポリネシア語でM諸16な
どがある.
字種数ハ1が大きいとき情報量が大きくなるという考え方は,タイプラ
イターで,かなうち専用の機種にくらぺて漢字打ちのできる和文タイプの
価格が高くなるのもなっとくできる、
情報量は,文字長%と字種数形とで構成されると分解できるが,ここで,
①文字長πを大にするときは,「こまかい限定ができる」とされ,
②字種数置を大にするときはr表現のバライティが増やせる」ともい
われている.
前者の例としては,rネコ」を使って説明した(前出)が,後者の例と
しては,
わたしはおどろきました
私は驚きました
私はギョッ1! とした
11
一橋大学研究年報 自然科学研究 27
などを比較してみればうなづけよう,
日本語は,かな,カナあわせて約100種,これに一般に使わる漢字2000
種を加わえてわかるように欧語にくらべ字種はケタ違いに大きい.それだ
け微妙な表現ができるわけである.
列種数による情報量のきめかたは,文字の長さ%だけで決めるぱあい
を含み・且つそれの拡張であると位置づけられる.
さて,この情報量五グは,Mやπが大きくなるとその値は急増する.
そこで対数をとり
1091=ηlo9躍
ここで lo91
を,多様さからみた情報量とよぶ.
これを使うと,文字1コ当りの情報量(平均惰報量,またはエントロピ
ーともよぶ)115ま
E≡log〃
となる.
ここで,字種数の変更が文字列の長さにどのような影響を与えるかをみ
ておく.
字種数Mで文字長銘の文字列に対して,
字種数躍で文字長π’の文字列が,同じ情報量をもつとすると
π109躍=πノlo9置
これより,長さの比π7πは
πノ/π=10gハf/lo9丑f’
となる.
いまハ4’=2(2元符号系)とすると,英語ではM=26だから
π’ノπ=10926/1092≒・4.70
つまり英語文を2元符号に直すと,約5倍の長さに伸びることがわかる.
12
間題解決の視点からみた現在・過去・未来(W)
なお,情報量を求めるときの対数は,底を10にとる,θにとる,2にと
る,などいろいろ考えられるが,2元符号を基準にとることを考えるなら
底を2にするとπ’10922=糀で,情報量は,2元符号化したときの長さそ
のものとなる.底を2つにとった対数をlgで表わし,単位をピット(bit)
とよぶ.
クルマのナンバープレートの情報量
例えば,日本式の「さ一2365」がもつ情報量と,カリフォルニアの
rVT9−23」がもつ情報量を比較してみるといずれも5文字列(5ケタ)
で同じだが,かなと,アルファベットでは字種数が異なることに注意して,
日本式では,1字目のかな44種,残り4ケタの数字,各ケタ10種だから
情報量は44x104,これよりlg440000=18.75bit,つまり高々19ビット,
これに対して米国式では1字目から53字目まで,各26種だから1g(263×
102)=20.75bit,約21ピットに達する.これより後者の表示形式のほう
が,含有する情報量が約2ビットつまり約4倍多いといえる,
チヤオ 『言語学入門』岩波書店 1980
(D) いいあて法
情報を構成している文字列一与えられた特定の文字列一に注目する.
その文字列を“特定”あるのに必要な“コスト(費用)”の程度ではかる
法である,
コストが余計かかる文字列ほど,情報量が大きいことになる.
ここで“特定する”とは,自分がその文字列を知ることができ,また他
人にも伝えられることを意味する.また,“コスト”とは,文字列を知る
にいたるまでの困難さや努力の程度を計量的に表わしたものを指す.、
13
一橋大学研究年報 自然科学研究 27
基準モデルとしての「数字札あてゲーム」
数字札1から10までを使う.十分にシャッフルしたあと1枚だけ抜き
出し,その数字を被験者にいいあてさせる.ただし,いいあてる手続き
(ルール)としては,つぎのような「質問回答法」による,
被験者のrそれは……ですか」という質問に対し,実験者は「Yes」か
または「No」だけで回答する,
このときコストは,被験者がいいあてるまでに続けた質問の“回数”と
する.
さて,文字列の最初の文字からいいあてていくが,第1文字をいいあて
るための質問回数をg1,一般に乞番目の文字について質問回数を佛とす
るとすべての文字列をいいあてるための総質問回数9は
ル
9=Σ9、
る=1
となる.これを情報量とする.
一般化すると,ある文字列があるとして,これを全く知らない人が,知
っている人から1字づつ知らされる状況を設定すれば,上記のような質問
回答法によって1字づつ知っていくという過程をイメージしていることに
なる。この情報量は従って一連のπコの文字列の“知りにくざ7の程度を
表わしているともみらる.
情報量を決めるための条件としてその文字列に含まれる字種はあらかじ
め知らされているとする.このとき,情報量の性質,つまり9は
① Mが大きくなれぱ,また
② πが大きくなれぱ,いずれも大きくなるであろう.
この情報量は,前出した文字列種数法で定義した情報量とその傾向は一
致する.
そこで,もう少し,くわしくκとπそして質問回答のしかたと,質
14
問題解決の視点からたみ現在・過去・未来(W)
問回数g5の関係を調べてみる一
① 厘=1 (数字札1だけしかないぱあい)これをあらかじめ知らされ
ているのだから,質問するまでもなく,rその札は1である!」といいあ
てられる.つまり質問回数g1=0,これを犯回つづけてもg=0
平均情報量ヶも
9
σ…≡一=0
π
となる.
② M=・2 (数字札は1と2だけであるぱあい)これを知らされている
として,質問は,最も単純なばあいはr1ですかと質問する,yesと回答
があれぱ,札の数字はもちろん1,noと回答されるなら,札の数字は2と
特定できる・この質間手順と回答り関係をフ・一チャーと(図2)に示す・
こうして,札の数字が1であれ2であれ質間回数g1=1となる.これ
を%回つづければ9=π,従ってg=1となる.
③ 厘=3 (数字札は1,2,3の3種であるぱあい)これを知らされて
いるとして,最も単純な質問手順とみられるのは(図3)に示す.
今度は,札が1か,2または3かでは質間回数が異なる.札が1なら質
問は1回,2または3なら質問は2回となる.
文字列の長さπコとして,このなかに札1が町コ,札2が勉コ,札
3がπ3コ含まれていたとすると,いいあてるに要する総質問回数9は
き
9=Σπ‘9‘
乞=1
ここで91=1,92=93=:2である・
9 3
またσ=一ここでπ=Σπ歪
π 塾3】
これより9またはgは,πが同じであってもπ1,π2,窺の分配の様子
15
一橋大学研究年報 自然科学研究 27
図2質問のフ・一チャート(盟=2)
S
ツ
1
%
2
1
図3質問のフローチャート(M=3)
ツ
s 1 1
%
2
y
2
%
3
で変わってくる。
いまπ1,%2,π3が“等分配”であったとすると
π、/π=π2/π=銘3/犯二1/3
だから
1 1 1 3
蚕=τ×1+τx2+τx2=了÷1・67
となる.
なお,質問の手順として,最初に1ですかとするかわりに2ですかでも
3ですかでも数字が変わるだけで,フローチャートの様相は変わらないか
ら,これ以外の異なる質問の手順は考えなくてよい.
④ 麗=4 (数字札は1,2,3,4の4種であるばあい)これを知らされ
ているとして,最も単純な質問手順とみられるのは(図4),これは厘=3
16
問題解決の視点からみた現在・過去・未来(VII)
図4質問のマローチャート(躍=4)
S
y
1
1
π
2
y
2
π
y
3
3
π
4
図一5質問のフローチャート(盟=5)
y
y
S
1
1
π
2
1,2
Qり﹄
%
ダ
3
%
の質問手順の単なる拡張である.そこで
文字列の長さπコとしたとき
9=Σπ‘9‘
4躍1
17
4
智
一橋大学研究年報 自然科学研究 27
ここでg1=1792=2,g3=g4=3である.
9 4
また㌍マここでπ=
いま,πbπ2,π3,町が‘‘等分配”であったとすると
π、/Fπ2加=π3/冗=π4/π=1/4
だから
1 1 1 1 9
σ=一X1十一×2十一×3十一×3==一=2.25
4 4 4 4 4
,となる,
今度は,別の質問の手順も考えられる.(図5)
最初の質間は,今度は「1か2ですか」となっている.このかわりに
.r2に等しいか,それ以下ですか」と質間してもよい.、
文字列の長さをπコとしたとき
ら
9=Σπε9‘
ざコ ここでΦ=g2=g3=g4=2であるから
9=2π
となり・等分配であろうとなかろうと関係なくπだけできまる.
9
また σ;=一=2.00
π
となり,これは,さきの質問手順のぱあいにくらぺて“小さく”なる.
質問の手順は以上の2種しかない.
従って,後者の質問手順によれぱ9は最小になるといえる.質問回数
はコストであるから以後はコストを“最小”にするぱあいの質問手順を
“基準”として採用することに約束する.
最小値を基準に採用する理由は,ムダな質間を許すと質問回数は“とめ
どもなく”増えていくことが予想されるからである.
18
問題解決の視点からみた現在・過去・未来(V皿)
賢い人は,情報を“最小コスト”で入手するが,ボンヤリした人は,同
じ情報をコスト高で入手することになる,という事情を思い合わせれぱな
っとくがいくであろう.
この後者の質問の手順(等分法)は,任意の字種数Mには適用できな
いが,ハ4=27(7認1,2,…)のばあいには拡張して使える.
このときは,常にヶは最小値となり
9 1趣
σ=一=一Σ%‘9‘=9
π π‘司
ここで
9=γ=lg〃
である.
これに対レて,前者(図4)の質問の手順(順序法)は,任意の字種数
躍に拡張して適用できる(図6).
文字列の長さ%コとしたとき
は
9ニΣπ‘95
‘=1
ここでg1=1,g2=2,g3=3,…一・g肛_1=g督=M−1
である.
ここで等分配ならば
π1=π2=……=勘=η11匠
だから
9一舞[誓(M+・)一・]
一π陛毒]
そして
. 9
9=万
19
一橋大学研究年報 自然科学研究 27
図6質問のフ・一チャート(翌)
1
1︸y
S
,
%
2
2
%
3
ツ
3
% y
4 4
¥
、
¥
、
π
夕
躍一1
M−1
%
M
で求められる.
このようにσは,等分配のぱあいは,順序法で質間すると,等分法で
質問するぱあいよりその値は大きくなるが,等分配でないぱあいは,出や
すい文字がわかっているなら,逆に等分法で質問するぱあいより“小さく”
なることは十分に考えられる(これについては後述する).
さて,等分配であるが,字種数麗がπ≒27(γ=1,2,……)のばあいの
検討をすませておこう.
M=3では,等分法は採用できない.順序法では(図3)σ=513=1・67
で,これより小さい値にはならない.
M=5でも等分法は採用できない.しかし,等分法に近い分割を採用す
ることで順序法とは異なる質問の手順が考えられる,
それをもうら的に取りあげ,等分配のばあいの亟を求めてみる(図7,
20
問題解決の視点からみた現在・過去・未来(V皿)
図7質問のフ・一チャート(ど=5)
ツ ツ
1
s 1,2 1
%
%
2
y
3
3
%
y
4 4
%
5
□回回囚国
I l i I
2 1 3 4
分割の順序
図8質問のフ・一チャート(M==5)
y
s 1 1
π
y y
2,3 2
”
%
□回国国[…]
1 3 2 4
分割の順序
21
3
y
4 4
銘
I I i I
2
5
一橋大学研究年報 自然科学研究 27
図9質問のための分割の順序(M=2)
□回回□回回
l I I l i
ω 2 3 1 4 5
1 1 1・l I
(2)21435
1 1 1 1 1
③ 2 1 3 4 5
1 1 1 1 1
(4)13245
1 1 1 .l l
(5)12435
1 1 1 1 1
(6) 1 2 3 4 5
図8).
これより,等分配のばあいは,等分法に最も近い分割にもとずく質間の
手順(等準法)を採用するとき憂が最小になることがわかる.
M軍6のぱあいについても,異なる質簡の手順のすべてについてとりあ
げ,等分配のばあいのσを求め鳶(図9)。ただしフ・一チャートは省略
する.
M=7のばあいについても,同じように求めてみた(図10).
以上を表にまとめた(表2).
これより,各皿についてσの最小値を取出すと,この数値は,ある
規則的な数列になっていることがわかる,
この数列は,分数で表わしたとき,分母はM,分子は,躍=2κ+1から
2あ+1までのMについては,Mが1ますごとに,分子の差は常にな十2に
なっている.
22
問題解決の視点からみた現在・過去・未来(W)
表2字種数と平均情報量
韓9
数亙
字
種
等分法
等分法,順序法以外の法
19盟)
順序法
1
O.00
2
1.00
3
1.58
5!3=1.67
4
2.00
914=225
5
2.32
(1)1215=2.4Q(2)13/5=2,60
6
2.58
8}・616 7
(3)1415=2.80
(3)17!6=2.83
(4)18!6=3,00
(5)19/6=3.17
7
2.81
(6)2016=3.33
(1)20/7=2.86
lll}21/7一ふ・・
(4)2217=3.14
(5),(6),(7)23/7=3.29
(8)24/7=3.43
(9)2517=3.57
(10)26/7=3。71
8
3.00
(11)2717=3.86
3518=4.72
ここで,1コの文字を完全にいいあてるまでに必要な“最大質問回数”
を駄冊とすると(質問の手順は等分法か等準法を採用するとして)
M=2㌃十1から2泡÷1までの胚については
憂糀鴉=な十1
と推定できる。これを
23
一橋大学研究年報 自然科学研究 27
図10質問のための分割の順序(盟=7)
爬…
ー回[i][ヨ[ヨ回
︵8︶
︵9︶
01︶
︻61616[616E6−6[6r6−616
︵7︶
4﹃515−4i515﹃4﹁51514﹃5
︵6︶
5i4﹃315!4−21514−315−4
︵5︶
1−114−3i314︸212147313
︷4︶
(10)
313il11−1 313;3﹁21212
︵2︶
③
2−212﹃212i1−111﹃1−111
l l I I l
(1)
□
ク瀧皿=LlgM」
と書く.記号L 」は,1g形が整数なら,そのままであるが,小数値な
ら,それより大きい,最も近い整数(切り上げ整数)を意味させる.
最大限この値σ脇を見込んでおけぱ,この質問回数以内に,必ず文字
はいいあてられることになる.
さきに情報量を(C)でηlog Mで定義したが,ここで底を2にとると,
1文字当りの情報量はlgどとなるから,この値はごの最小値にほとんど
一致する.ただし等分配のぱあいについてであるが.
こうして(C)での情報量と,ここ(D)での情報量は,ほぽ一致する
24
問題解決の視点からみた現在・過去・未来(皿)
ということで両者での情報量の定義は連絡する.,
等分配(等確率発生)でないぱあい
このばあいの蚕の最下値蚕(min)や,最大質問回数転鵬について検
討する。
文字列の長さ%コとしたとき,各文字の発生確率が与えられたばあい
について,まず,異なる分割形式のすぺてについて蚕を求めて,そのな
かで最小となるσ(min)を探し出してみる.
いま,数字∫の札の発生確率をp‘(ゼ=1,2,……)とする.
忽=3のばあい
P1=316,P2=2/6,P3=1!6
で与えられたとする.
これを札1から数字の順に順序法で質問するなら
3 2 1 3
σ=一×1十一×2+一×2=一=:1.50
6 6 6 2
5
なお,等分配ではσ=一≠L67であったから,明らかに今度は“小さく”
3
なる.
この結果は,常識的にもうなづける.
絶えず発生している事件についての報道は,これを聞かされても感激度
ないし興奮度は少ない.つまり,情報がもたらす情報量は減少するのであ
る.
これより,必=3では,特定の数字の札一例えぱ1一が他の数字2
や3の札よりも出現確率が高いことを知つておれぱ,第1回目にrそれは
1であるか」と質問することでσは減らせる.
M=4のばあい
p1=4/10,p2=3110,p3=2110,p4=1110
で与えられたとする.
25
一橋大学研究年報 自然科学研究 27
これを,札1から数字の順に順序法で質問するなら
4 3 2 1 19
σ=一×1十一×2十一×3十一×3=一==1,90
10 10 10 10 10
なお,等分配ではσロ2・0であったから今度も明らかに“小さく”なる・
M=5のばあい
p、=5115,p2=4/15,p3=3/15,p4=2115,p5=1115
で与えられたとする.
これを,札1から数字の順に順序法で質問するなら
5 4 3 2 1 34
σ=一×1+=x2+一×3十一x4十一×4=一≠2.27
15 10 15 15 15 15
となるが,このばあいがσ(min)とはならない.
この他の分割にもとずく質間の手順のすべてについて検討してみなけれ
ばならない(図7,8).
このばあいは等準法でg(mm)=2.20がえられることがわかる.
M=6のばあい
P・=6/21,p2=5/21,P3=4!21,P4=3/21,P5=2/21,P6=1/21
で与えられたとする.
異なるすべての分割にもとずく質問の手順を検討してみる(図9).
順序法ではσ=2,62であるのに対して蚕(min)=2.43がえられる分割法
があることがわかる.
躍=7のぱあい
P・7/28,P2=6/28,P3=5128,P4=4/28,P5=3/28,P6=2!28,P7篇1128
で与えられたとする.
異なるすべての分割にもとずく質問の手順を検討してみる(図10).
順序法では蚕=2.96であるのに対して今度も妖min)=2。64がえられる
分割法のあることがわかる。
26
問題解決の視点からみた現在・過去・未来(皿)
さて,この程度の検討からは,一般に文字の発生確率が与えられたとし
ても,どのような分割形式を採用すれば憂(min)がえられるかという方針
は発見できない。
ただ,傾向としては,抑が大であれぱ砲が小となうような分割法形式
にもとずき質問の手順を決定するのが蚕を小さくするための方策となる,
と主張できる.
この方策を,つぎに追跡してみる。
σ(min)をうるための探索
これまでは,与えられた種数胚についてその分割形式のすぺてをもう
ら的に取上げて,それにもとずく質問の手順を適用してσを求め,その
なかから妖min)を選出していた.
ここでは,逆に与えられたp‘(ゼ=1,2,…)を使ってあるルールを適用し
てg‘を決定する.そのような質問の手順であるかどうかは,この方法で
求められる憂=Σpゆが憂(mm)にどの程度近接するかを吟味した上で,
あらためて考えることにする,
このように,p‘から導かれたg‘を使用するとき,これまでの9iと区
別するために4‘を使用する。
なお,これ以後でg、を,ご(min)がえられる分割形式とそれにもとず
く質問の手順で行われたときの値とする・
(i) 4乞=L11抑」 を採用するばあい
たしかに,この関係はp‘が大になれぱφは小さくなるので,前出の
方策に見合うルールと認められ’る.
これを採用したぱあいのφとg‘とを比較してみる.
Mコ4のばあい.勉は前出と同じとする.このとき
4エ濯3,σ2鷲4,43=5,44=10・
他方ξ(mm)かえられる等分法を採用すれぱσi=1,g2=2,g3=σ4=3な
27
一橋大学研究年報 自然科学研究 27
表3発生確率と質問回数(Mニ4) ので,明らかに
σf≡L1!P‘」
σ‘>9‘(i=1,2,3,4)
づ
1
2
3
4
4!10
3!10
2110
1/10
である(表3).
P‘
1P6
M=5のばあい。勉は前出
.50
.33
.00
0.00
∫
3
4
5
0
と同じとする.このとき
1
2
3
3
グ1=3,σ2=4,43=5,ぜ4==8,
9一
9乞(2)順序法 45=15
表4発生確率と質問回数(M=5) やはり
4¢〉91
乞
1
2
3
4
5
(づ=1,2,3,4,5)
4115
3115
2115
P‘
5!15
1/15
1P‘
.00
.75
.00
.50
5.0
である(表4).
‘
3
4
5
8
5
2
2
2
3
3
躍瓢6のぱあい。P‘
9¢
は前出と同じとする.
9‘:(1)
このとき
表5 発生確率と質問回数 (M=6)
ゼ
1
2
3
4
5
6
4121
6!21
5/21
3/21
2/21
1/21
1P‘
.50
.20
.25
.00
0.5
1.0
‘
4
5
6
7
1
1
2
2
2
3
4
4
Pε
9‘
9‘:(3)
づ・=4・ぜ2=5,43=6,44=7,づ5=11,σ6=21
やはり4‘>9‘である(表5).
だ=7のぱあい,p‘は前出と同じとする.このとき
4・=4・ご2=5・ぐ3=6,σ4=7,45=10,ぐ6=14,47零28
やはりグ‘〉9‘である(表6).
以上の数値例から,このような色の決定法は,その結果のもつ性質か
28
問題解決の視点からみた現在・過去・未来(、肛)
表6発生確率と質問回数(M=7)
‘
P蛋
1P5
‘
9‘
1
2
3
4
5
6
7
7128
6/28
5!28
4128
3128
2!28
1/28
.00
.67
.60
.00
.33
4.0
8.0
4
5
6
7
0
4
8
2
2
3
3
3
4
4
9‘:(3)
らいって許容できるものではない.
(ii) σFLlg1!p‘」を採用するぱあい
このようなφの算出方式も,前出の方策を満たす.
これを採用したぱ
あいの4‘とg乞とを比較してみる(表7).
M=4のばあい.勉は前出と同じとする
このとき,
表7発生確率と質問回数(確率は前出)
(ど=4)
3
σε
112
3
4
2
3
4
2
(忽=5)
乞
司
1
2
3
4
5
2
2
3
3
4
3
4
313
51
6
4
5
(覆=6)
。Cσ
■9
1
2
2
3
(胚コ7)
乞
6‘
1
2
3
4
5
6
7
2
3
3
3
4
4
5
29
一橋大学研究年報 自然科学研究 27
づ1=2,グ2=2,ぐ3=3,44瓢4
となる.’
4(mm)がえられる順序法のg盛と比較すれば
4‘>95(名=・1,2,3,4)
である.
ハ4=5のばあい.勉は前出と同じとする
このとき
ぜ1=2,σ2=2,σ3=3,ぐ4=3,45=4
となる。
蚕(mm)がえられるぱあいのg‘と比較するなら,今度は
4‘≧9ε(¢=1,2,3,4,5)
となる.
忽=6のばあい.p‘は前出と同じとする
このとき
グ1==2,グ2=3,43=3,44=3,ぜ5=4,σ6=5
となる.
ξ(min)がえられるぱあいのg‘と比較すると,今度も
4‘≧9言(3=1,2,3,4,5,6)
となる.
躍=7のぱあい.鍛は前出と同じとする
このとき
φ=2,42=3,43=3,44=3,45=4,46=4,47=5
となる.
σ(min)がえられるぱあいの⑳と比較すると,今度も
4‘≧9‘(乞=1,2,3,4,5,6,7)
となる.
30
問題解決の視点からみた現在・過去・未来(V皿)
以上の数値例から,このような性質をもつ4‘の決定法は,かなり妖min)
がえられるばあいのg‘に接近することがわかる.
いいあて法の構造
σ(min)がえられる分割形式によってえられるg‘にくらぺてL1/p‘」や
tlg1/p‘」から求められるグ‘が一般に4‘≧g‘であるということは,4‘が
えられるような質問形式では,“ムダ”な部分が含まれていることを予想
させる.
そこで,質問の手順を示すフローチャートをあらためて描いてその性質
をチェックしてみよう.
例えば,κ=4で(勉は前出)∋等分法,順序法での手順と,グ‘=Llg1/p‘」
で表わされるぼあいの手順をならぺてみる(図11).
ただしこれらフローチャートで質間の内容は省略した.これを樹木図と
よぶ.
これをみると,等分法や順序法では,質間(・印で示す)のあとは,必
ず枝路は2つに分岐しており,いずれ,も質問に“ムダ”がないことがわか
る.いっぽう,これに対してLlg1/pd法では,質問してもそのあと2つ
の枝路に分岐しない経路がいくつか含むことになり,これらが質問の“ム
ダ”に該当する.
なお,どの手順を採用するにせよ,それらを表わす樹木図について,g‘
億最初の質問(・印で示す)のあと,数字札に到達するまでの線分の本数
に一致する.
一般に,このような樹木図で表わしたぱあい,質問回数g¢については
ヱ
Σ2一¢‘≦1
‘=1
が成り立つ.
ここで不等号くは質問にムダがあるとき,そして等号=は,ムダが
31
一橋大学研究年報 自然科学研究 27
図11質問の樹木図(M=4)
(等分法) 1
2
S
3
4
噸序法)
S
●
1
2
3
4
(L¢91/ρ】法)
S
1
2
3
4
ないときに該当する.
数値例: 前出のM=4のぱあいについて.等分法では,
4 1 1 1 1 4
署2一処ヲ壕+討評τ=1
また,lll頁序法でも
4 1 1 1 1
揖2一処ヲ与壕+ヲ=1
となり,たしかに“ムダ”がないことを示唆する・そして
L191!P‘」法では
・32
問題解決の視点からみた現在・過去・未来(V皿)
喋 1 1 1 1 11
揖2−9‘苛+ヲ+ダ夢篤く1
となり,“ムダ”のあることを示している,
さて,質問にムダがないときの判定式
ぴ
Σ2一¢‘=1
↓雷1
これに発生確率の条件式
び
ΣPF1
乞=1
を組合わせる.つまり,左辺どうしが等しいとおき,さらに,ここでご=
1,2,……の各項について,それぞれ等しい,つまり
2−9‘=P‘ (乞=1,2,……)
とおけるなら,
1
9‘=19−
Pゑ
なので
1
ヶ(min)=ΣP乞9FΣPゑ19−
Pゑ
と求められるはずである.
ただしg‘は回数で整数だからp‘はそのような条件をみたすときに限る・
しかし一般には
2−q‘キP‘
としなければならない.このとき,
1
σ‘≒19一
ρ‘
このばあいはp‘を既知としてもg‘を導くことはできない。このとき
1
ΣP‘lg一…σ’(mm)
P‘
33
一橋大学研究年報 自然科学研究 27
とおく.,
1 1
ここ・でp‘が小さくなれぱlg一は急増しLlg一」なる整数に接近する、
P‘ P‘
他方,胚が大になれば,一般に働が小さくなる傾向にあるから,こ
のときσ’(min)はσ(min)に接近することになる.
数値例:前出のM=4,5,6,7のばあいについてσ’(min),蚕(min)そ
して両者の相対的なズレ伽…{憂(min)一σ’(min)}@(min)も求めてみた
(表8),
これより
η3>η4>η5>η6>η7
であることがわかる,¶
この傾向は,Mが大きくなれぱσ’(min)がσ(min)に接近するとい
う,さきに予想した傾向を裏づけている.
妖min)をうるための分割形式
(0) 第0次接近
Σg乞を最小にすることで満足する.そのためには等分法を,それがで
きないときは等準法を採用すればよい.
(1) 第1次接近
P‘が大になるほど9‘が小にな鉢うな分割形式を採用する・具体的に
は
9‘=Llg l/P‘」
となるように選ぶ.
この程度では,まだ質問にムダがあることは,すでにM=4のぱあい
でみてきた.つまり妖min)がえられる保証はない.、
(2)第2次接近
34
問題解決の視点からみた現在・過去・未来(皿)
表8発生確率と質問回数
(躍=4)
.名
2
1
3
5
勉191/P乞 .5287 .5210 .4643 .3321
P’(皿in)=1.85
9(miロ)=珈‘9F19110菖190
η4…9一σ’19’呂0、0270
(ハf=5)
‘
P‘191/P信
1
.5282
2
.5086
3
.4643
5
4
3,874
.2600
9’(min)=2.15
9(min#Σ♪‘9‘=33115=2.20
η5=0,0227
(胚冨6)
客
P‘191/P‘
1
。5164
2
.4928
3
、4557
5
4
.4012
.3226
6
,2091
9(min)=2,40
哩(min)=51/21=2.43
η6=0.0125
(盟=7)
‘ 1
P51911P‘ .5000
2
。4760
3
。4442
4 5 6
.4012 .3450 .2721
7
.1716
9’(min)呂2,61
g(miI1)ニ74/28=2響64
η7冒=0.0115
文字の発生が等確率ならΣgεを最小にする等分法,それができなけれ
ば等準法を採用してσ(min)がえられた.そこで,等確率発生でないぱあ
いでも,p‘をいくつかまとめたサブグループどうしを,同じ確率になる
ように組合わせて,そのあと第0次接近を適用する.
くわしくは:一最初の2分割は,各サブグループの発生確率を0.5に
近くなるよう調整し,つぎの分割は,その各サブグループを再び,この半
35
一橋大学研究年報 自然科学研究 27
分の2。05づつになるように調整する.
具体的な手順1 前出のM=7のばあいに適用してみる.
数字札1から7を2分するのに,まず前半と後半の2つサブグループに
わけ,それぞれのグループの確率の和(合成確率)が等しくなるようにす
る。そのためには,確率の大きいほうから累和を求めておいて利用する.
つまり,累和が0・5近いところで2分する.2分されたサブグループは,
それぞれ再ぴ同じ要領で2分する。つまり前半のサブグループは確率の累
和O,25付近で,後半のサブグループでは0.75付近で分割する.以下,
それぞれのサブグループをまた2分していく.こうして確率の累和の切れ
目は,前半のグループで0。25±0.125,つまり0.125およぴ0.375となり,
後半のグループで0。75±0.125,つまり0.625および0.875となる.
この方針にもとずいて実施した分割と,質問の手順を示す(図12).
この手順は,σ(min)をうるときの手順に一致している.
なお,この分割形式を分確法とよぶ.
(3) 第3次接近
これは,第2次接近の改良した手法である。
第2次接近では,字種の全体を等確率に近い2分割することから始めて,
等確率をめざしつつ細分割を続けていくのに対し,第3次接近では,逆に,
小さいほうの発生確率から等確率に近くまとめて,たえず等確率をめざし
ながら全体をとりこんでいくという手法である.
具体的な手順: 前出のM=7のばあいに適用してみる.
①数字札を確率の大きいほうから順にならべる.
②確率の小さいほうから2コをまとめ1枚の札とみなし合成確率を求め,
その結果の数値を使って再ぴ大きさの順序にならぺかえる.それを合成確
率が1になるまで繰返し続ける.
③合成確率1に近いところから,2分された番号のサブグループの一方
36
問題解決の視点からみた現在・過去・未来(、咀)
図12質問の手順(M=7)
盛一 力f
累和
分確法
.一σぎ
叩
一 ?
7/28
回6/28
13/28
ツ1
□7/28
’夕
%
2
1
2
1
1.2
回5/28
ツ
%
lyl
国4/28 22/28
3アz
18/28
2
3
3
4』
3
1
1
3,4.階.
銘
回・/28 28/28
一’
5
3
4
6η
回2/28 27/28
y
5%
25/28
6y ,
回3/28
7 4
こでは線の下に属するほう一一一から質問していく・yesなら2分
した下の線を1ステップ逆にたどる.noなら上の線を1ステップたどる
(図12).ごの分割形式を合確法とよぶ,
ぼ
この例(M=7)で与えられた色の系列では,第2次接近の分確法によ
っても第3次接近の合確法によっても,分割形式が異るだけで質問回数
4‘は一致する.
なお,この第3次接近による合確法は,常にσ(min)がえられる分割
形式であることが“数学的帰納法”・によって証明されている.
(事例1)ヒト(日本人)の血液型をいいあてるばあい.
A,耳O式の血液型分類によると,日本人は℃『型声¶31.5%.A型が
37
一橋大学研究年報 自然科学研究 27
図13質間の手順(M=7)
分確法
カ‘
16一28
’国7/28
28
28
f
回6/28
12
28
国5/28
9
28
巨]4/28
回3/28
6
3一28
回2/28
28
回・/28
侮.多
π
夕
y
38
S聞π
y釦%y
4 4 3 2 2 3 3回回回回□国国
鵠
問題解決の視点からみた現在・過去・未来(畷)
37,3%.B型が22.1%.AB型が9.1%というデータがある.古畑種基
『血液型の話』岩波新書 1962.
これはπ=4のばあいにあたる.いま%の大きいほうからつまりA,0,
B,ABとならぺかえてコード番号をつけて発生確率を簡単に
p、=4/10,p2=3/10,p3=2/10,p4漏1/10
とおけば,前出した順序法の例と一致してヶ(min)=1・9がえられる.こ
れはたしかに等分法のぱあいヶ=2・0よりは小さくなるが,その相違の程
度はわずかである.
(事例2) 氏名をすぺてrカナ」で表わしたぱあい
rカナ」イ・ハ48文字一のうち,ヰ,ヱは現代かなづかいでは使わ
れない.またヲは助詞として使うだけなので,これらを除くと45文字と
なる.
「カナ」の発生確率の調査は,伊藤栄一氏が第一生命で,保険に加入し
ている人の氏名について行われたものによる(表9).
これを使い,第2次接近(分解法)で憂を求めると5.11となる.、
第3次接近(合確法)で求めると5.09となる,
1
なお,軌幌=Σρ‘19一二5.05でありちなみに1945=5。58である.
P‘
4.情報の量の定義と基準化
(A) 出にくさの指標
実験者が,つぎつぎと数字や文字をもち出してきて被験者にいいあてさ
せるという状況は,被験者からみれば,実験者は“情報源”に相当する.
そこで一般に、情報源から発生する文字をいいあてるための平均質問回数
σを,文字がもつ‘‘知りにくさ”からみた平均情報量(エント・ピー)
と考える.ただしσの最小値ξ(mm)を念頭におくことにするので,こ
39
出現率% 累和%
ヒ
14.8
.251276
モ
一9.8
.216096
ノ
24.5
.207326
工
29.1
.204342
口
33.6
,201327
ケ
37.6
.185754
ソ
41.6
。185054
ユ
49.4
.179279
二
49.2
.1∠9279
セ
92.5
.162406
ホ
55.7
。158905
ノレ
58.8
.155359
ム
61.9
.155359
テ
64.8
.148126
ノ
67.5
。140694
メ
69.9
.129140
へ
72.7
.125171
ネ
74.3
.117043
レ
76.3
。112877
ヌ
78.2
.108639
79.9
.099931
81.5
.095453
83.1
,095453
84.7
.095453
チ
0.4
O.1
86.2
.090883
87.9
.081449
88.8
.08τ449
60.0
.076570
91.Z
.076570
92.3
.071570
93.3
.066439
94.2
.061163
95.0
.055726
95.8
。055726
96.5
.050109
97.1
.044285
97.6
.038219
98.1
.038219
98.9
.038219
99.0
.031863
99.4
.031863
99.8
.031363
99.9
,009966
0.1
1.6
1.6
1.6
フ
1.7
ア
1.9
ス
一P19P
0.4
2.0
ラ
0.4
2.1
ワ
0.5
2.3
ノ、
0.5
0.5
2.4
ツ
0.6
2.7
ナ
0.7
2.9
ン
ヤ
0.8
3.1
コ
ト
0.8
3.1
サ
3.2
ミ
3.3
キ
3.8
オ
3.8
ク
0.9
4.0
イ
1.0
4.0
ヨ
1.1
4.5
マ
1.2
4.6
ウ
1.2
4.7
タ
1.3
5.0
.302293
1.3
6.3
ナ
1.5
カ
力 出現率%累和%
8.5
8.5
シ
.一
19P
カナ
表g rカナ」の出現率(伊藤栄一氏のデータ)
100.0
.009966
Σ5.054852
40
問題解決の視点からみた現在・過去・未来く冊)
れの基準値としてΣp‘191/p一を採用することにする.
情報源から発生する文字列で,各文字の発生確率は,その文字の‘‘出や
すさ”の程度をあらわす.つまり発生確率が大きいほど,出やすさが大き
いということになる.今度は,“出にくさ”の指標を考える.
(1) 発生確率の“逆数”を採用するばあい・
発生確率Pの範囲は
0≦P≦1
これに対応して,逆数1/pは
1
00≧:一≧1
P
となる。このとき出にくさの指標は1からooまでの範囲にひろがる,そ
こで,この範囲を“縮退”させるために対数をとる.対数を底を10,θ,2
にとったときをそれぞれ単位(decit),(nat),(bit)をつけて“出にくさ
からみた情報量”とする.
文字列の畏さをπとしたとき.
総情報量1は
冴 1
1篇Σπ‘lg一 (bit)
¢=1 鍛
ル
ここで町は乞番目の字種の文字列の中のコ数,またΣ窺二ηである.
こニエ
これより1文字当りの情報量,つまり平均情報量(エント・ピー)Eは
1 澗
E=一1=ΣP‘191/P‘
π 箪=1
となる.
こうして,エント・ピーは,前出の“いいあてにくさ,知りにくさ”か
らみた平均情報量一つまり平均質間回数の最小値一一と関連づけられる.
“出にくさ”で定義した情報量
41
一橋大学研究年報 自然科学研究 27
一般に,情報は
① いつ役に立つかわのらない情報(データ)
② そのうち役に立つ情報(知識)
③ いますぐ役に立つ情報(情報一狭義の一)
にわけられるとする見方がある.
この見方は情報は“役に立つ”という観点から価値づける態度を反映し
ており,“すぐに”役立つのが最高の価値というイメージで,狭義の情報
とよばれているようである.
この“役に立つかどうか”という観点は,たしかに,情報の価値を計量
する1つの観点ではあるが,きわめて人間的であり,しかも“主観的”な
立場での評価であるといわねばならない.
このほかにも,情報を評価する観点ないし立場はいろいろ考えられよう.
“役に立つ”観点は,ある‘‘目的達成”のためにという前提が条件となっ
ている。その目的は種々あっても基本的に共通しているのは目的志向であ
り,そこには‘‘打算”と‘‘理性”が介在する。
他方,同じく人間的ではあるが,もっと根元的な‘‘生きること”と直接
にかかわる“直感的”で“生理的”ともいえる情報の価値づけ,そしてそ
れを計量化する方法もある.
それは,A,トフラーのいう「目新しさ」の観点である。A.トフラー
『未来の衝撃』実業の日本社 1975.
さきの“出にくざ’の指標をみたときの情報量は,この“目新しさ”の
指標として採用できる.
これの観点は,1コの文字や数字などだけでなく,まとまった文字列
(用語,語い)さらには,概念などを評価する際にも適用できる.
① 事実現象に関する情報の例
@ 犬が人をかんでもニュースにならないが人が犬をかめばニュースに
42
問題解決の視点からみた現在・過去・未来(W)
なるというニュースの意味についての事例説明は,ニュースバリューとい
うものが,事象の発生確率と関連していることを想像させる.つまり,発
生確率が小さいと思われている事象ほど,その事象が発生したとき,ニュ
ース性は高いと判断されていることを予想させるからである.
⑤狼少年のはなし.「狼がくる」と最初に伝えられると,あわてて被
害を受けないような対策や行動を選択する.影響を与える効果は大きいか
ら情報量は大きい.しかし,実際には“来なかった”ことが度重なると
‘‘
たか”“きたためしがない”としてもはや何の対策も講じないように
なっていく・行動の面でも精神面でも,これまでと違う変化があらわれな
くなってしまう.情報としての効果は失われ,てしまったことになる。
たとえ聞く度ごとに狼が実際やってくるぱあいも,対策は万全になって
いき,最初に襲われたときのような恐怖感や不安感は失われ’て冷静に対処
するようになっていく.やはり情報量は減っていくとみてよい.
② 意識現象に関する情報の例
r私,アナタが大好き」というコトバを若い女性から初めて聞かされる
とき大感激するだろうが,その女性と結婚して一緒に生活するようになっ
てもあいかわらずいい続けられると,また始まった。いい加減うんざりだ
と受止めるようになり,やがては聞いても聞かぬふりをするようになって
しまう,同じセリフが同じ相手から繰返し聞かされると情報としての価値
は減少する.そして相手が違うとなると,同じセリフが再ぴ新鮮さをもつ
ようになり価値は高まる.
このように,同じコトバ(セリフ)でも聞き慣れてしまうと,それがも
っ情報量はへっていくとみている.これは,情報が,事実現象,情報現象,
意識現象いずれについて記述するのに使われたばあいでも,それが出現す
るかどうか,あるいは出現する度合いにかかわらせて評価する立揚をとる
ことを意味する.
43
一橋大学研究年報 自然科学研究 27
つまり・情報が表わす現象の“稀少性”に価値をおく評価法で,これの
程度の指標として情報量が採用できることがわかる.
渡辺紳一郎氏は・r切手の値段」というエッセイの冒頭に,経済学概論
で習うことだが,r価値」を決定する1つの原因としてr稀少性」という
ことがある……これを純粋な形で示しているのは蒐集家における古郵便切
手の値段である。美しい絵だとか,立派な刷りだとかによって値がきまる
ものではない・完全に稀少性のみによって決まるのである。一・…と述べて
いる、渡辺紳一郎『絵本 博物誌』四季社 1958
各国語のエント・ピー
文字列における各文字の出現が,字種をMとして,
(0) 等確率とするときを0次近似のエンニ・ピーとよぴ珊で表わす
ハf 1
玩=ΣP‘lg一=lg盟
名i1 勉
(1) 各文字が独立に出現するとして,各文字の出現度数を出現確率と
みたときを1次近似のエント・ヒ・一とよび珊で表わすと
澗 1
H・=ΣPづIg一
琶i1 ρε
となる.
これまでの例では,このような出現確率を念頭において情報量やエント
ロピーを扱ってきたが,文字列の中の文字を単独でなく,2連字,3連字,
……
ひとまとめにして,それらが独立に出現するととらえたぱあいのエ
ントロピーも考えられる,
(2) 2連字が独立に出現するとしたときを2次近似のエント・ピーと
よぴ砺で表わすと
44
問題解決の視点からみた現在・過去・未来(四)
1擢= 1
E2=諾P乞(2》19評
ここでpε(2)は2連字の¢番目の出現確率である』
(3) 3連字をとったとき,3次近似のエント・ピーとよぴ,π3で表
わすと,
1κ3 1
恥万、署P¢(3)’gア
ここでp乞(3)は3連字の¢番目の出現確率である.
さらに,η連字についてのπ次近似のエント・ピーも,形式的には,
上記の拡張として数式表現はできるものの,冗=4,つまり4次以上にな
ると,その連字の出現度数をあらためて調査し直さねばならず厄介になっ
てくる.
(4) 高次エント・ピー
M=27(英語)では,4連字の異なる字種はM4÷5.3×105(廻50万),
5連字となるとM5÷1.4×107(1,400万)となる.
M=54(日本語)では,4連字でム44÷8.5×106(850万),5連字でκ5
・≒4.6×108(廻5億)に達する.
C.E,Shannon(1949)は,実験的な方法でH凶を求めることを考えた.
これは,1種のrいいあて法」である。
英文章を始めの文字から1字づつ「この文字ですか」といいあてさせる.
正しければyesと答え,誤りであればnoと答え,いいあてるまで繰返
させる.こうしてすべての文字について問いの回数を全文字数で割ってエ
ント・ピーとする.実際に行われたのは文字数η=102で,質問の回数が
198であったから,エントロピーは198/102=1.94(bit/文字)となった.
ただし,つぎの文字が明白なばあいも質問回数に数えるので,真の値は,
これより小さいと見積られる.上記の数値は“上限値”である.
45
一橋大学研究年報 自然科学研究 27
図14英字エント・ピー
Shannon,C,E,Bell System Tech,J。5050(,51)
5
4
上 限
ビツト
下 限
1
一 − 一
0
0 1 2 3 4 5 6 7 8 9101112131415100
文字数
それは,被験者が自国語について,①使用回数や②相互関係を直観的に
知っていると仮定しているのでふつうの人間が不完全な言語知識しかもた
ないことを考えると,質間回数はその分だけ増加する傾向があるからであ
る.
C・E・Shannonは,その後(1951)高次近似のエントロピーを間接的に
推定する「予想ゲーム法」も考察した.
ある小説から15文字からなる系列を100組ランダムにとり出した文字
列についてこの法を適用してエント・ピーの上限値およぴ下限値を実験的
に求めている.またこの結果を外挿してHlooの上限値を1.3.下限値を
o,6(bit/文字)と推定している(図14).
露語ではど=32でH8駕L36がえられた,近似を高めていくとH15で
安定しそれ以後はほとんど小さくならないことがわかった.これよりπ・・
46
問題解決の視点からみた現在・過去・未来(W)
=1・o−1・2(bit/文字)と推定された.
N・バートンとJ・リクライダーはShannonの法で実験して,ある文
字がでたあと1000番目にどんな文字がでるかは予言しにくい.そして文
字相互の結びつきは約30字の範囲までであると推定している,
これは一般の欧語についても成立しよう.
ア.エヌ。コルモゴ・フらは,シャノンの「いいあて法」を改良した.
これを,あまり知られていないゴンチャロフの作品から取出された文字
列に適用した.
この作品は①平均的な散文である,②読むのに特に困難ではなく,特殊
な言いまわしもない,ということで選ばれた。これより露語でもπ。。÷1
と推定された。
以上の考察から各国語のエントロピーについて,一般的にいえることは,
恥はアルファベットの字種Mが大きくなるほど大きくる.
E評はNが大きくなるほど小さくなっていく傾向がある.一般に
Eo≧π1≧H2…… ≧0
このような傾向をもつことは,先行文字について知るほど,つぎの文字
はいいあてやすくなることからなっとくできる.
E。。は計測することは困難である.正確な値は,どの国語についてもわ
からない,しかし十分な確信をもって,主要ヨー・ッバ語では,ほぼ一致
する値,約1.oであるといえそうである,
連字について
文字9で始まる単語を,三省堂編『初級コンサイス英和辞典』で引く
と
quack(あひるがガーガー鳴く声,いんちきな)に始まり,quste(引用
する〉に終る・36コの単語のすぺてがqのあとにuが続く.語頭でな
47
一橋大学研究年報 自然科学研究 27
くてもsquirra1(りす),conquer(征服する)など,やはりqのあとに
uが続く.
語頭となる文字のつぎにくる文字の分布は,ふつうの辞書で調ぺれぱわ
かる.
そして,語尾の文字の前にくる文字の分布は逆引辞典で調ぺられる・
これは,単語の末尾をそろえ,末尾から逐次アルファベット順にならぺ
た辞典で,例えば,郡司『英語学習逆引辞典』開文社によると,一9で
終る単語は514コ,この前の文の文字の内訳は,aが12,eが3,gが
1,iが8,nが465,0が11,rが1,uが13となっており,nが群
を抜いている.だからnがくればaと続く確率は90%である.
文字の連接は2文字にとどまらず,あとの文字にも波及する.quのつ
ぎは必ずr母音」である.thのつぎはeがくる確率が高く1やxは続
かない.
文の種類とエントロピー
これまで文字列は,一般的なふつう文から取出して考えてきた.しかし
文の種類(ジャンル)が異なればエント・ピーに平均的な差異が生じてく
ると予想される.
(i) ふつう文と技術文
ふつう文のエント・ピーを研,技術文のエント・ピーを砧とすると,
一般に
塒>瓦
と予想される.
技術文では ①語いの種数が少ないとか,特殊な通用語や表現が多いか
らというのがその理由とされる.
どの国の言語であれ,専門の技術文のほうが芸術,文芸文より“はるか
48
問題解決の視点からみた現在・過去・未来(皿)
に”
みやすいのである.
ただし,技術文も特殊になると例外がある.『
① 特殊用語が,高密度の意味内容(学術用のコトパー例えぱ現代数理
論学で使われている記号的なコトバー)をもたされて使われるばあいや.
② 特殊用語が,ふつうの人に解読されにくいかうくようする(泥棒の
使う陰語一ごく短かいコトバだが非常に多くの意味をもつ)ことを目的
として使われるばあいなど。
(ii) 文学的な文章
① 文章型が異なるとエント・ビーも異なる.(文学作品のジャンルが
異なれば,それぞれ特有な表現法が採用されるから)
② 1つの文学作品でも,部分的にはエントロビーが異る.(対話文と
描写文など)
③ 筆者が異なればエントロピーは異なる,よく知られた型どおりの記
述一文学作品では自然描写の部分一ではエントロピーは小さくなる.
これに対し,意外な内容に富み,型通りでないコトバが使われるならエ
ントロピーは大きくなる.
特にエントロビーが大きくするには,内容を複雑にし,訳がわからない
文章にすれぱよい.
④ 小説と詩では,詩のほうがコトバに補則的な制限を課するので,つ
づく文字や単語をいいあてやすく,それだけエントロピーは小さくなる.
しかし他方,詩は,月並みでない内容を盛りこませるので,結果的には散
文と同じ程度のエントロピーにもどるという.
話しコトバのエントロピー
これまでは,文章,つまり書きコトバを前提にして,そのコトバが意味
をもつばあいを考えてきた.
49
一橋大学研究年報 自然科学研究 27
会話や話しコトバでは,話す際の抑揚(イントネーション)など意味的
でない部分も含まれており,これらも情報をもたらすと考えねばならない。
これを手がかりにして,知人の声を聞きわけたり,話し振りからその人
の性格や気質を知ることもできるからである.これらをr意味的でない情
報」とよび,話しコトバにうつしとれるr意味上の情報」と区別すると,
両者が混在する一般の会話で,両者が“矛眉”していたとすると,人は,
前者を信頼するといわれている.
直接,相手と面と向っての会話では,声以外に,顔色,表情や態度から
も情報が伝わってくる.r目は口ほどに物をいう」のである。
いま,意味的でない情報量をH4,意味上の情報量をEβとすると,こ
の比1■4/砺は,話す速度に依存することが知られている.
(a)非常に速いばあい:声の聞きわけがしにくく,抑揚のニュアンス
が追跡できなくなる.それは「意味」を理解するのが精いっぱいで「意味
ではない」部分の解読まで処理が及ぱないためで,このときはH4が小さ
くなるのでπ■砺≒30%と小さい,
(b)ふつうのばあい:H4/Hβ=75%と大きくなり,
(c) ゆっくりのぱあい=E4/EB=130%に達するといわれている,
文字と単語のエント・ピー
文章の総情報量1は,文字のコ数をπ,文字のエント・ピーを昂と
して1=π昂いっぽう単語のコ数を窩,単語のエントロピーを瑞とす
れぱ1=鵬丑ω
ここでs≡π1彿は,1単語当りの平均文字数で,英語では4。1∼4.5字,
露語で5。3字,独語で5.9字,ポリネシア語で3・2字と求められ’ている.
立日
名 50
音楽 に お け る
のエ
ン
トロ ピ 旧
問題解決の視点からみた現在・過去・未来(VII)
音楽情報は,①メロディ ②リズム ③ハーモニィの3つの要素から成
立つとされる.
①はrふし」で,音の高さの変化が主な印象となるが,音の長短や強弱
も関与する.
②は音の長短の“律動”と,音の強弱の“拍節(拍子)”を取出したも
ので音楽の進行に“力動さ”や“釣合さ、、を与える.
③は“協和”のことで,音楽に‘‘多彩な変化”を与える・
このうち,メ・ディの音の高さだが,これはデタラメにならべられるも
のでなく,音楽的な訓練をうけると,未知のメロディでもつぎの音の高さ
が予想できるといわれる.
いま音の高さを音名でb,♂,d,θ,.F*,σ,併,五,.8,び,D,E,の12種
について,エント・ビーを求めると
Ho=1912=3.58bit
171==一ΣPε19P‘=3,43bit
がえられている.
(B) 相対エントロピーと冗長度
各国の言語のエント・ピーを比較するばあい,字種ハfが異なれぱ,O
次近似のエントロピー珊からすでに異なるので,実際のエントロピーど
うしを直接くらべるのは適切ではない.
そこで,それぞれの言語でエントロピーが最大値となる玩で基準化し
た相対エントロピー昂を採用する.つまり
E7≡…Hノ∬o
ここでπ。の範囲は
1≧Er≧0
となる.そして
51
一橋大学研究年報 自然科学研究 27
丑≡1一πr
で定義される量を冗長度とよぶ.
ここでE。に注目して文章の特性を指摘してみよう.
(i) π・=1のぱあい=文章を構成する各文字が独立で等確率発生の状
況を意味すち。あいさつのときのような,よく使われるいいまわしなど一
切含まれないばあいである.それどころか,異なる文字列がそれぞれ異な
る意味をもつことを想定しなければならない.つまり文中の1文字が誤っ
て別の文字に書かれると,全く別の意味をもつことになる.
だから,このような文章では,中の1字が抜けおちたとすると,そこへ
入れるぺき文字は,アルファベットの字種だけあり,それに応じて異なる
意味の文ができあがることになる.
(ii) 研=oのばあい=文章で,ある文字のつぎの文字は,その前にで
た文字,文字列によって完全にきまってしまうばあいである.文中の1文
字が抜けおちても,そこへ入れるぺき文字は,自動的,機械的に決まってし
まい選択の余地がない.それ以外の文字を入れると文章は意味をなさない.
数学における数式の変形や論理記号式での変形がこれにあたる.つまり
数学という学問は,式をたてるまでが情報として有効な領域であり,式の
変形(演算や計算)は冗長度100%の領域であるということになる,
(iii) 実際のπ7(1>E.>o)のばあい:文中にいくつかの文字が抜け
おちていてもそこに入れるぺき文字は,数回の試行錯誤を経て,適切なも
のが見つけられ文の意味が通るようになる.このように適当な冗長度があ
るのでク・スワードや暗号文などの解読も可能となる.、
各国語の相対エントロピー
日本語ではM=54として,
Ho=5.75,π㎝=1.8にすれば
52
問題解決の視点からみた現在・過去・未来(V皿)
E7=1.815.75=0・31
英語ではM=27として
温o=4。75,E㎝=1.3とすれば
E7=0.27,またH。。=1.0とすれぱ
E7=0。21 となる.
露語ではM=32として,
Eo=5.00,π。,=1.2とすれぼ,’
Eγ=0.24,またE㎝=1.0とすれば
Eγ=0.20 となる。
このように,日本語,英語,露語については,いずれも研÷20《略O%。
R≒80∼70%の範囲に収まっているとわかる.
その他の国の言語についてもほ響同様とみられる.
それは,人間が“話し”の流れを知覚する‘‘生理学的笑な過程での特性
と結びついており,上記のようなErないしEが“最適値”なのであ
ろう.冗長度が大きいようにみうけられるが,人間の頭脳のはたらきとの
関連からみて,この程度の冗長度は“不可欠”なのだといわれている.
5,情報量からみた情報の伝達
情報の伝達は,3つのレベルで検討できる.
(i) 文字,数字など記号列を構成する要素一記号一をいかに‘‘正
確に”伝えるか.つまり伝達の技術的側面.
(ii) 記号列が,伝えたい意味内容を明白に誤らず表現しているか。つ
まり語義的側面.
(iii) その記号列の意味内容が,発手の意図した通りに,どこまで受手
の意識の変革や行動の選択に有効な影響を与えたか.つまり効果的側面
53
一橋大学研究年報 自然科学研究 27
人から人へと話しコトバが“ナマ”のまま伝えられていくr耳うちゲー
ム」を経験してわかるように,最初の発手から出た話しコトバの列が最終
の受手に伝わるときには,かなり変化してしまうのが普通である。たとえ,
発手と受手の2人だけの情報伝達の揚面であっても,その問に介在する通
信環境が悪ければ話しコトバは加工,変形をうける。
地下鉄の車内や街の盛り揚では,外部から雑音が混入してくるし,話し
コトバの一部は洩れたり消失することがおこる.そこで
① 話す速度をおそくして,聞きわけるのに時間をかけても間に合うよ
う余裕を与える.
② むづかしい語句を使わず,理解するための負担を軽くする,
③ 同じ意味の語句のいいかえを行い,聞きなれたチャンネルが成立す
るのを助ける.
さらに悪い状況下,あるいは,極度に伝達の正確さが要求されるときは,
④ 語いや単語をスペルに分解して伝えるためrコード用語」を使うな
どのくふうがされ’る.
(A) コード用語のいろいろ
日本語の50音,数字,英字アルファベットのぱあい(表10)
第2次大戦中,米国陸軍が使用したスペル用単語および国際民間航空
機関(ICAO)が開発したスペル用単語(表11)。
フランス語のABC確認用語(表12).
スウェーデン語のアルファベットおよび数字(表13).
送る文字数珊コ,この各文字を,その文字を含む単語(コード単語)
に変えて送るときの総文字数を瓦また送る文字の情報量をEo,コード
単語にしたときの情報量をEとすると瓦01τo=皿
が成立つから,
54
問題解決の視点からみた現在・過去・未来(田)
表10 コード用語(日本)
朝日のア
オワカのオ
切手のキ
サクラのサ
景色のケ
﹃ソロバン の ソ
スズメのス
チドリのチ
手紙のテ
名古屋のナ
イ・ハのイ
ヱピスのヱ
ワラビのワ
リンゴのリ
レンガのレ
吉野のヨ
大和のヤ
明治のメ
ミカンのミ
保険のホ
富士山のフ
はがきのハ
ネズミのネ
日本のニ
トンボのト
ツルカメのツ
タバコのタ
世界のセ
新聞のシ
子供のコ
車のク
かわせの力
英語のエ
んゑわれりよやめみほふはねにとつたせしこくかえい
オシマイのン
■−
始めのエー
シネマのシー
イーストのイー
グラムのジー
アイスのアイ
京都のケー
ミルクのエム
大阪のオー
スポーッのエス
キューピーのキュー
ユニオンのユー
早稲田のダヴリュー
エンドマーク
ワイシャツのワイ
サン・、ミッツ
イチ。ヒトツ
ナナ︵シチといわない︶
ヒャク・イチマルマル
キュウ︵クといわない︶
,−
ビールのピー
フランスのエフ
デパートのデー
レターのエル
ホテルのエイチ
ジャパンのジェ蓼
ピースのピー
日本のエン
ラジオのア;ル
クリスマスのエックス
東京のテー
ヴィクターのヴィ
終りのゼット
ヨン︵シといわない︶
フタ︵二といわない︶
ハチ
ロク
ゼロ・マル
トゥ・イチマル
55
沼津のヌ
飛行機のヒ
野原のノ
マッチのマ
平和のヘ
無線のム
モミジのモ
弓矢のユ
ラジオのラ
留守のル
ローマのロ
井戸のヰ
尾張のヲ
ゴ
zxvtrPn】 hfdb
〇十八六四二
9eca
&ywusqomk
百九七五三一
上野のウ
をゐろるらゆもむまへひのぬなてちそすさけきおうあ
一橋大学研究年報 自然科学研究 27
表11 コード用語(アメリカ)
(a)
米国陸軍
Able
Jig
Baker
Dog
Easy
FOX
King
Love
Mike
Victor
Nan
William
Oboe
X−ray
Geoge
Peter
Yoke
How
gueen
Roger
Zebra
Charlie
Item
(b)
Sugar
Tare
Uncle
国際民間航空機構
Alpha
Bravo
Golf
Hotel
Mike
Novenber
Tango Zulu
Charlie
India
Oscar
Uniform
Delta
Juliet
Papa
Victor
Echo
Kilo
guebec
W三skey
Foxtrα
Li皿a
Romeo
Xτay
Sie∬a Yankee
表12コード用語(フランス)
Anatole(アナトール)
Eug壱[1e(ユージェヌ)
Berthe (ペノレト)
Emile (エミーノレ)
C61estin(セレスタン)
Fangois(フランソワ)
D6sir6(デジレ)
Gaston(ガストン)
Henr董(アンリ)
Raou1(ラウノレ)
Irma(イルマ)
Suzame(シュザンヌ)
Joseph(ジ日セフ)
Th6r6se(テレーズ)
K16ber(クレペール)
UrSUle(ユノレスノレ)
Louis(ノレイ)
Victor(ヴィクトーノレ)
Marcel(マルセル)
William(ウイリアム)
Nicolas(ニコラス)
Oscar(オスカー)
Xavier(ザヴィエ)
Yvonne(イヴ才ンヌ)
Pierre (ヒoエーノレ)
Zoe (ゾエ)
Quinta1(カンタノレ)
56
問題解決の視点からみた現在・過去・未来(V皿)
表13 コード用語(スエーデン)
A・Adam K−Kalle U−Urban 1。Ett
B・Bertil L−Ludvig V−Viktor 2−Tvaa
C〈)esar M−Martin W−Wilhelm 3−Trea
D−David N−Niklas. X・Xerxes 4・Fyra
E−Erik O−010f Y−Yngve 5−Femma
F−Filip P・Petter Z−Zata 6−Sexa
G−Gustav g−guintus A−Ake 7・Slu
H−Helge R−Rudolf A−Arlig 8・Atta
I−lvar S−Sigurd 6−6sten 9。Nia
J−Johan T−Tore o・Nolla
これより 冗長度Rは,
ハ流o
R=1−E/πo=1一一
N
数値例
ICAOのばあい,「STOP」の4文字は,スペル用単語ではrSierra Ta・
ngo Oscar Papa」と20文字になる.これ,より
R=1−4/20=0.8
また,スェーデン語のばあいAbiskoの6文字はrAdamBertilIvaf
Sigurd Kalle Olof」と29文字にする,これより
R=1−6/29÷o.8
いずれも,ふつう文がもつ情報量のレベルまで冗長度を高めていること
がわかる.
一般に,誤りが起りやすい状況の下や雑音がある中で,何が何でも情報
を伝達したいばあいは,上述のように‘‘冗長度”を故意にふやしている.
もっとも,雑音の中でも意識を集中すれば自分が聞きとりたい情報だけ
をある程度うまく聞きわけられることがある.これをカクテルパーティ効
果とよぶ.
逆に,誤りが起りにくい状況や条件の下では冗長度を故意に減らすこと
57
一橋大学研究年報 自然科学研究 27
錨叢桧畏nユp召轟珊総器L・腿鑑皿欝欝
表14航空会社の略語
(Lufthansa Timetable Japan ol Ju1−250ct86
より)
Airlines
盤謡証側駕慧解諺齢剛器軸㏄qc・9説卿
Gulf Air Company
Fluggesel!schaften
Somali AIrlines
America West Airlines
American Airlines
Air Canada
Air France
Hloliday Express
Iraqi Airways
Iberia
Air Alg6ria
Air India
In(1ian Airlines
US Air
Iran Air
Aeromexico
Air Inter
Anselt Airlines of Austraralia
Japan Air Lines
Inex Adria Airways
Jugoslovenski AerQtransport
Jersey European Airways
Korean Air Lines
Aviaoo
Aerolineas Argentinas
Alaska Airlines
Royal Air Maroc
Avianca
Kenya Aicways
Finnair
Kuwait Airways
LAL de Chile
Alitalia
Luxair
Lufthansa
British Airways
British Midlan−Airways
Aero Trasporti Italiani
British Caledonian Airways
Braathens S,A.F.E.
Samahinya Libyan Arab Airlines
Polskie Linie LQtnicze
Crossair
CAAC China
Balkan Bulgarian Airlines
Air Atlanta
Mal6v Hungarian Airlines
China Airlines
Continental Air Lines
Middle East Airlines
Malaysian Airline System
Egyptair
Cathay Paci且c Airways
Cyprus Airways
Dan Air Services LTD
Delta Air Lines
Compania Mexicana de Aviacion
Roland Air
01ympic Ainvays
DW DLT Deutsche Luftverkehrsgese11−
AE
GE
1E
9E
TE
UG
AG
E
E
AO
CO
KS
L
O
O
OZ
OA
PI
PK
PR
P
NUrnberger Fhgdienst
NW Northwerst Orient Airlines
Air Cal
Ceskoslovensk6Aerolinie
schaft mbH
Eastem A量r Lines
Olt−Ostfriesische Lufttransport
GmbH
Japan Asia Airways
Aer Lingus
Austrian Airlines
T.A.M。E.Ecuador
Ozark Air Lines
Ethiopian Ailines
Pan American World Airways
Ecuatoriana
Pie(1mont AviatiQn
Pakistan InternationaK Airlines
Philippine Airlines
Garuda Indonesian Airways
Guernsey Airlines
58
問題解決の視点からみた現在・過去・未来(W)
PS Paci五c Southwest Alrlines
PU Pluna
PW Paci且c Western Airlines
gF Qantas Airways
RA Royal Nepal Airlines
RC Republic Airlines
RG Varig
RJ Royal JQrdanian Airlines
RO Tarom Ramanian Air Transport
SA South Afriican Airways
SC Cruzeiro
TE Air New Zealand−lntemational
TG Thai Airwaysys Intemational
TH Thai Ain蔦・ays LTD
TN Trans Australia Airlines
TP TAP Air Portugal
TR TransbrasiI
TU Tunis Air
TW Trans World Airlines
UA United Airlines
UK Air U.K.
UL Air Lanka
SD Sudan Airways
UM Air Zimbabwe
SK Scandinavian Airlines
SN Sabena
SO Austrian Air Service
VA Viasa
VG Regional且ug GmbH
VO Tyrolean Ainvays
SQ Singapore Airlines
VP VASP
SR Swissair
SU Aerofiot
SV Saudi Arabian Airline
WA Westem Airlines
WO World Airways
WT Nigeria Airways
がある.
新聞の3行広告や,不動産業者のアパートやマンシ日ンの間取りや設備
内容の広告などに特徴的にみられる.
略語,略号は広く一般的に使われ,ている。
航空会社の略語の例(表14)。
さきの送る文字数N。と,その文字を含むコード単語にした総文字数
Nとの関係式がここでもそのまま使える。こんどは
①N。μ▽:使われている文字数Nの何割でよいかを表わす
② (N一瓦。)/N≡R;使われている文字数Nに対して縮められた文字
数の割合(消失率)を表わす.
数値例
① 新聞広告における20字は,これをふつう文に解読したら90字に
近くなるといわれる.これよりNo=20,N=90とすると
R=1−20/90≒0。78
59
一橋大学研究年報 自然科学研究 27
これは一般の文章の冗長度R=0.8にくらぺて小さいから,ふつうの文
章に“復元可能”なはずと了解される.
② ジュール・ヴェルヌの小説『グランド船長の子どもたち』の中に,
船長がビンから取出した“書付け”の文字250コのうち150コが海水で
洗い流されていたという一節がある.このぱあいハら=250−150=100 亙
=250だからR=・1−100/250躍o.60これもo.8より小さいから復元可能
である.
③ 航空会社の略語(前出しの表12)についても,全会社のフルネー
ムをふつう文とみてのべ文字数N=1760,これをすべて略号に直したもの
を短くした文とみてのべ文字数妬=117×2=234を使ってR=1−234/
1760=0。87となる。これは0.8を上まわっている.略語による“短縮化”
は極度に進んでいる.
一般にふつうの文の短縮は,言語を“符号化”するものであり,新しい
簡潔な言語を確立したことにはならない。表現としては短縮され文字数が
減少してはいても,頭脳で処理するにあたっては自然言語に翻訳してその
意味を理解しているのであるというのがその理由とされている,
(B) 2元符号語による文字の伝送
文字列で表わされた文章を通信回線を使って電気信号(ON−OFF)に直
して伝送するぼあいを考える。
まず,情報源から発生する文字列は,情報源符号器(Source Encorder)
により2元符号に変換(符号化二コーデインゲ)させて通信路にのせる.
受信側では到着した2元符号を受信復号器(Source Decorder)に入れ復
号化=デコーデインゲ)してもとの文字列に変換し受信者に届ける.
従って,符号化は,あとで復号化が可能であるよう行わなけれぱならな
いが,さらに符号語を受け終った瞬間に,符号語が終りであることが検知
60
問題解決の視点からみた現在・過去・未来(W)
されるとき(瞬時)復号可能という.
復号可能な符号語をつくる法
符号化した際の符号語はその特徴により2つのタイプにまずわけられる,
(i)符号語の長さを一定にそろえる・
アルファベット文字1コを常にある一定の長さ乙の符号語に割当てる
ぱあいである.このとき受信側では,長さZごとに区切れば復号化できる・
(ii) 符号語の長さを一定にしないばあい。
符号語の長さは符号の樹木図(符号樹)を使って割当てるとわかりやすい.
始点sから出る線分を最初の0次節点で2本に分岐させ,上の枝に0,
下の枝に1を割当てる.それぞれの先端(端点)を1次節点として再び2
本に分岐させ,前と同様に上,下の枝に0と1の符号を割当てる.以下,
これで必要なコ数(字種)の端点ができるまで続ける.変換される符号語
は,これら各枝の符号をすぺてつなぎならべたものとする・その際,分岐
させる枝はすべて同じ次数の節点まで伸ぱす必要はない.字種M=4の
ばあいについて,いろいろな符号語のセットがつくれることを示す(図15)・
1では符号語は長さ1,2,3,3である.Hでは長さ2,2,3,2である。皿
では長さ2,2,2,2で等長符号語になる.IVでは長さ1,3,3,3である.以
上,1からWまでは,すべて端点まで使った符号語なので,すぺて復元可
能となる.Vでは長さ1,2,2,1だが,最初と最後の符号語0と1は途中
の節点で打ちきって符号語をつくっているので復元不可能である・
文字A,B,C,Dをこれらの符号語の上から順に割当てたとして,いま
符号列
01101110100
を受取ったとする.
1,皿は端点符号語がペアで使われているから完全に復元可能・ペア符
61
一橋大学研究年報
図
自然科学研究
始占︷
15符号語のセットの例(ど=4)
次節点
〇 1 2 3
符号語
0
27
号語で構成される端点符号語
は“完全である”という。H
では復号できない部分がでて
くる.それは端点符号語がペ
S
10
1
110
111
アで採用されていないからで
ある.IVもペアで使われてい
ないが,偶然この符号列は,
うまく復号できる.Vはどこ
00
S
ハ︾−
II
1
S
皿
S
1
0 1
10
00
11
0
0
0
1
1
などがわかる.
一般にγ元符号(γ=2な
ら符号は0と1)を使って字
種躍の文字に対応する符号
語をつくるぱあいその長さを
どbδ2,……勉とすると,これ
ら符号語が復号可能であるた
0
めの必要・十分条件は
01
1
1
1
1
1
字列に復号されてしまうこと
11
100
IV
で区切るかによって別々の文
ど
Σゲこ‘≦1
乙言1
ここで等号=は符号語が
“完全”なばあい,不等号く
はそうでないばあいである
’
ノ
(符号長に関するKraftの定
S
理).
V
、
、
62
問題解決の視点からみた現在・過去・未来(皿)
(C) 通信の質の確保
情報源符号器と受信復号器の間の通信路を2元符号語が伝送されるとき
に,一般に雑音が混入したり,また符号の一部が洩れたり消失したりして
符号列が変形をうけることを予想しなけれぱならない.こうした符号列を
乱す原因を雑音(広義)とよぶ.そこで
(1)雑音がなければ符号器から符号0が送り出されるならそのまま復
号器に符号0が到達し,1が送られるなら1が到達する.
いま,符号器側を妖0,1),復号器側を写(O,1)で表わすと,
FOで常に写=0,F1でr1となる.従って受とった符号FOな
ら¢=0,Ψ=1ならF1と判定すれぱよい.
これを条件付確率p(Ψ1¢)で表わすと
p(0『0)=1,p(111)ニ1で
p(110)=0,p(011)=0 となる.伝達はr確定的」である.
(2)雑音があると,¢=0であっても必しも穿=0でなく写=1となる
こともある。の=1であっても写=0となることもある.
条件付確率で表わすと
P(oiO)<1,P(111)く1
P(110)>0,P(ol1)>0
となる.伝達は「確率的」な性質をもつことになる.
通信を「確定的」にするには,雑音を“完全”になくせばよいが,これ
は現実には無理なので,一般には,誤りがあったとき,①それに気づかせ
ること(誤り検知)ができるか②どこが誤っているか指摘(誤り訂正)で
きるようにくふうする.
このようにして通信の「質」を確保する.
誤り検知または誤り訂正させるというのは,それ自体1つの情報である
63
一橋大学研究年報 自然科学研究 27
からそれだけ余分の情報を追加して送り届けねばならない.ここでは情報
は2元符号で送られているから結果的にはこのために符号語をさらに付加
することを意味する.
誤り検知や訂正の機能をもたせるために送信側に通信路符号器(Cha−
nnel Encorder)をまた受信側に通信路復号器(Chamel Decorder)を付
加する,
(i)誤り検知
文字A,B,C,Dの字種κ=4からなる文字列を情報源符号器により
等長の2元符号語00,01,10,11に変えたとして,そのあと通信路符号器
で,00には0,01には1, 10には1,11には0の1ピットを追加す
る.もとの2ピットを情報ビット,追加の1ピットをチェックビット,両
者あわせて送り出しビットとよぶ,
チェックビットを0にするか1にするかは,送り出しピットに含まれる
“1”のコ数を合計したとき偶数(0を含む)になるように決める,これ
を偶数パリティとよぶ.
これより,受信側の通信路復号器が,到着した符号語の3ビットのなか
かの‘‘1”の合計の奇,偶を調ぺる.調ぺるには奇偶カウンターを使う。
そして偶数ならOK!とする.
これがパリティチェック法である.ただし到着した符号語に誤りが2ビ
ットあるとこの方式では見外すことになるが,この事態が発生する確率は
実用上は無視できるほど小さい.
実際には,符号語は十分長いから,これをたコづつに区切りブ・ック
化し,そのあと1ピットを追加して偶数パリティにして送り出している.
このとき送り出しピットの伸ぴは(あ+1)魚となる.
(ii)誤り訂正
前出の字種盟二4のぱあいで考える.今度は通信路符号器で00には
64
問題解決の視点からみた現在・過去・未来(顎〉
000,01には110,10には101,11には011と検知のぱあいよリチェ
ックピットを2ピット追加して送り出しビットとする.ここでチェックビ
ットを0にするか1にするかは,情報ピットから始まる5ヒ’ットを¢1,z2,
¢3,鈎,¢5と記号化したとき,チェックピットの1番目¢3は苅,¢2,の3の
ブロック(ブロックS1)が偶数パリティになるように,以下,鈎は範,
¢4(ブ・ソクS2)が,¢5は苅,¢5(ブ・ックS3)が,それぞれ偶数パリ
ティになるようにする.
さて,受信側での訂正の原理と方法はつぎの通り.
受信側でブ・ックS1,S2,S3にそれぞれ対応させて奇偶カウンターをお
く。誤りなしに届くとどのカウンターも常に“0”を表示するが,例えぱ
¢1が誤まるとS1とS3が“1”を示す.これを101で表わせば,以下,
の2・の3・編¢5がそれぞ麹誤ると110,100,010,001と異なる3ケタの符
号語(症候群)で表示されることになる.
さて,奇偶カウンター3コなら症候群の異なる符号語は23=8種だが
このうち000は“誤りなし”なので除けぱ,送り出し符号語にして7ビ
ットまでの訂正が可能なはずである.
一般に,情報ピット,送り出しビットの長さをそれぞれL,πとすると.
誤り訂正ができるめには2(酔L)一1≧πでなけれぱならない.このような
符号語をCode(私L)で表わす.
訂正符号との対応をよくするためのチェックビットのつけかた
例:Code(6,3)のぱあい
の5ニの・㊦鞠
諾6=詔2㊦記3
¢4=ω5㊦の6
とする・ここで㊦はケタ上りなしに加えることを意味する.するとS3,
S2,S1の症候群が表わす符号語の2進数が誤り符号語の“番目”を指示する.
65
一橋大学研究年報 自然科学研究 27
このほか,パリティチェックを2重にする法も利用される.
L=16で訂正可能であるためにはCode(21,16)で,チェックビットは
5コとなる.
いっぽうこの16ビットを4×4のマス目にならぺ,各行,各列で偶数
パリティになるよう1行目からの17……の20,また1列目から謬21……の24
の8コのチェックピットを付加すると,さきの5ピットより3ピット多く
なるだけで,情報の16ピットを2重にチェックすることができる.
ここでは,通信を誤りなく送り届けるための考え方をみてきた.誤りな
くFつまり“正確さ”という概念は,情報の“質”的な側面を代表してい
るように思われるが,文字列を2元符号語に変換して送るぱあい,チェッ
クビットを付加するという“量”的な支援によって“正確さ”ないし“質”
が保持ないし確保されるということは注目に価する,
6.符号当りの情報量
文字の符号化にあたっては,文字の発生確率を考慮して,確率の大きい
文字ほど長さの短い符号語(最短符号語)を割りあてるHu貸manの手法
は最短符号語の条件をみたすものである.
いま,M種の文字
αよ,α2,●…”,α』f
を含む文字列で,各文字の発生確率が
P1,P2,’”。”伊Pκ
であるとき決められた最短符号語の長さを
(注)H岨manの符号化とは,前出の「いいあて法」でぴ(min)をうるための
分割形式で紹介した第3次接近と同じ構造をもつ手法である,
66
問題解決の視点からみた現在・過去・未来(V皿)
Z1,Z2,……,Zヱ
とすると,
1文字当りの平均符号長zは
乙=・ΣP乞Z5 bit
であり,また,
1文字当りの平均情報量πは
11=ΣP乞191/P‘ bit
となる.これより1符号語がうけもつ平均情報量はEμとなる.
ここで分子Hは確率が与えれぱ決定する関数,分母は,確率が与えら
れていても符号語の長さによって異なる関数である.
(i) いま砥ゼ=1,2,……,κ)に最短符号語が割当てられたとすると
(Elz)=1であるから,それより長い符号語が割当てられるなら,一般に
・即≡β(<1)
とするためのど‘の分布は
E/Zを最大化する条件一Lagrangeの未定係数法を適用して解くこと
ができて
1 1
乙¢=一lg一
β P‘
がえられる.
(i三) 他方らの分布が与えられたぱあいもHμを最大化する条件は同
じであるから
上式から抑を求めると
P‘=2一μ・
がえられる.しかし,今度はβ.がまだ決まっていないから,これだけで
‘まp‘の分布はきまらないがp乞に関する性質
ΣPF1
67
一橋大学研究年報 自然科学研究 27
を適用すると
Σ2一ρ‘‘=1
となる.
可
そこでβのかわりに
2β…≡甲
を未知数とした
ΣlV唾=1
の高次方程式にもちこむと,この形式の高次方程式は,“正根がただ1コ
だけ存在する”ことが証明されている(Frobenius).
なお・5次以上の代数方程式は一般解が求められず,数値解(近似的に
はグラフ解)で求めるしかない.
いずれにせよ,IVが求められるから,これより
109研
β=19砂r。92
また勉の分布は
P霊=2一彦‘19▽=10一‘‘b9躍
より求められる.
計算例
前出盟=7のぱあいの最短符号語の長さ‘1=2,Z2=2,Z3=3,♂4=3,Z5=3,
Z6翻4,Z7=4を使ってp‘を求めてみる.
方程式は
2r2+3τ7−3+2r4=1
これは容易に解けて
躍=2.00
これより
β瓢19四=1.00
68
問題解決の視点からみた現在・過去・未来(W)
こうしてπ1zの最大値は1.ooとなる.
これは抑が与えられたとして求めた最短符号語を使った融=0.99串
よりわずかだが“大きく”なる.
帳(・/28)(・/b♂)[7bg箏+6bg㌘+
28 28 28 28
5109一+4109一+3109一+2109−
5 4 3 2
+・bg箏]一λ61
7 6 5 4 3
Z=一×2十一×2十一×3十一×3十一×3
28 28 28 28 28
2 1 74
十一X4十一×4==一=2,64
28 28 28
2.61
’. .E/彦≠一÷o.99
2.64
この最大値がえられるときのp‘を前出の与えられたp‘を区別するた
めに画を使うと
多、=φ2=2−2=0。2500
多3=多4吻5=2−3=0.125
β6=φ7=2−4=0.0625
がえられる.
さて,(研Z)maxになるばあいは,
p‘と薩の間には,
19P‘==一βz‘
の関係があるから,ヨコ軸に正,タテ軸にPの対数をとった,片対数グ
ラフでは(z信,p‘)は(o,1)を通る右下りの傾斜βの直線上にのる.
(A) 情報伝送速度
文字は符号語に変換して送るから,文字の送る速度は,各文字に割当て
69
一橋大学研究年報 自然科学研究 27
られた符号語の長さと符号語1コ送る速さできまる,
しかし重要なのは,文字の送る速度,つまり単位時間当り送れる文字数
でなく,単位時間当り送れる‘‘情報量”であるとして,これを情報(量)
伝達速度という.
情報源からの情報の発生や情報を記録するばあいについても,それぞれ
惰報発生速度および情報記録速度が同じように定義できる.
いま,送らねばならない文字の字種をMとし,各文字の発生確率を
p1,p2,……,p亙とすれば,文字1コ当りの平均情報量Eは
E=ΣP¢lg1/P乞 (bit/コ)
各文字の伝道時間をむ1,‘2,……,嘘とすれば,文字1コ当りの平均伝送
時間‘は
ε=ΣP画 (s/コ)
これより情報伝送速度は
7…11/む (bit/コ)
となる.
さて,各文字を符号語に変換したときの長さを乙1,Z2,……,Z∬(bit!コ)
とすると,各文字の伝送時間‘乞は符号語の長さ薩に比例するとしてよく
碗=τ哉
ここでτは単位長さ(1bit)の符号語を送るに要する時間で,送る手
段によってきまる定数(slbit)である.
これを使うと情報伝送速度は
V=H1τΣP‘晦
ここで 1/τ≡η(bit/3)
とおけば,これは単位時間当り送れる符号語のbit数となる.bit通信速
度とよぶ,
さらに; Σ’p‘砺=6(bit)
70
問題解決の視点からみた現在・過去・未来(W)
と1文字当りの平均符号語の長さを使うと
情報伝送速度は
7=”(H/z)
となる.
伝送速度Vを大きくするくふう
これには2つの考え方がある.
(i)bit通信速度びを大きくする。
これは送る手段によって決まる.
例えぱ,テレタイプでは50,ファクシミリで1万,テレピでは1000万
(bit/s)など.このように⑳は勝手に変えるわけにはいかない.
(ii)Eμを大きくする.
これは最短符号語を採用すればよい.
一般に(珊乙)=β(≦1)を採用したときの伝送速度7mxa=伊βを通
ヱ らエ
信路容量という.
なお,通信路容量がかえられる条件から求められた(Z‘,p‘)のセットを
最速符号語とよぶ.
計算例
(1) 字種胚=2,符号語の長さZ1=1,呂2=2としたときの最速符号語
となるp1およぴ勉を求めてみる。
まず方程式 r−1+r2需1
を解いて IV=(1±4了)12≒1.618
これより β・=109『/1092=0・69
従って pFIO−11。gw=0.62
P2=10−210gw=0.38,
また レmax=0.6%
71
一橋大学研究年報 自然科学研究 27
(2) 字種κが2より大きく10より小さいぱあいで乙‘が1から10
までの異なる長さが割当てられるばあいについて,rおよぴp‘を求める
には算出表が利用できる.国沢清典『ORのための情報理論入門』日科技
連 1978
例=M=10で,Z一==1,Z2=2,Z3=3,Z4=4,……‘10=10のぱあい,この算出
表を使うと17=1,9990,β≒0.99928≒1.0と求められる.
(B) 伝送速度の概念拡張
情報伝送速度を最大化するためにEμを最大化することで解決した.
このなかみは
分子:Eで1文字がもつ平均情報量,
分母:.耳で1文字がもつ平均符号長,
であった。見方を変えれば,
情報量は文字のもつ“情報的”属性量であり,
符号長は文字を伝送する際の“コスト的”属性量である.
符号は長くなるほど,送るのに時間がかかる,つまり“時間的コスト”
が余計にかかる・また符号語をレタリングではりつけて郵送するばあいで
も1符号語(0や1)の単価が同じならやはり符号が長くなるほど“金銭
的コスト”が余計にかかる.
つまり最大化の条件とは,コスト当りの情報量を最大にする問題を解い
たことになる.
文字列のぼあい
文字列で,1字づつ質間回答法によって知っていくばあい,1回の質問
に答えてもらうのに料金o円支払うとすると,ある文字α‘を知るため
の質問回数をg‘として,伽を知るに要するコスト写‘は
駒=09‘円
72
問題解決の視点からみた現在。過去・未来(U)
文字列のすぺての文字が入手し終った時点で,単位料金当り入手した情
報量は,この文字列がもたらした全情報量を,支払総額で割ったもので,
これは平均情報量Hを平均料金Ψ=Σ’p磁・=αΣp紹で割った値に一致す
る.つまり,料金当りの情報量は
E H
一= bit/円
Ψ oΣP‘色
いま,全文をできるだけ安上りに入手するためにHuHmanの手法に従
って質問するなら質問回数g琶は符号語の長さ6‘に数値的に一致し,料
金当り入手する情報量は最大になる.
同種商品のぱあい
文字列のように有限の字種を含む文字がつぎつぎに発生する,または送
られてくる時系列的な確率現象に対して,空間的な確率的現象にもこの考
え方が使える.
いま,文字を商品におきかえる.すると字積は,同じ機能をもつ商品の
“異なる銘柄”に対応させられる.すると各銘柄の商品が出まわっている
程度を,各商品の存在確率で表わすと,この状況は空間的な確率現象とみ
られる.
一般の商品は大部分が同種で異なる銘柄という形式になっている一ことは,
酒,タバコ,香水,などでふつうにみられる.これらは,普及品から高級
品という区別で理解されている.
さて,同種の商品で異なる銘柄κ種あるとき,それらの商品の出まわり
かたを存在確率としてp・,p2,……,p擢,それらの商品の価格をΨ1,写2,……,
伽とすると,これらの全商品の市場における存在を情報量的にとらえる
と,全情報量に対する総価格の比,つまり価格当りの情報量を求めて
丑 丑 bit
Ψ ΣP伽 円
73
一橋大学研究年報 自然科学研究 27
をこの商品の評価する際の指標にできる.
レタリングのばあいは1文字に対してある長さZ名の符号語を割当てる
ので,そのコスト凶がここでのコスト駒になる.
さて,一般に,商品の価格の決定には,その晶質,デザイン,使い勝手,
耐久性,……など,いろんな要素が反映するであろうが,ここでは,商品
もその基本的な評価の観点として,出にくさ,出まわりにくさ,手にはい
りにくさ,誰もがもっていない程度……などつまりは稀少性の指標とみら
れる“情報量”を重視するのも商品に対する態度の1つの基本となろう.
それは,人の購買行動は,個人個人としては,好みや要求のままに銘柄
を選び価格も安いもの,高いものを購入しているのだが,全体としての売
行きの結果をみると,全情報量に対して総価格を最小にするように行動し
ているという仮説が,多くのばあい基本的に成立することが知られている
からである。
それは,r価格当り情報量を最大化する」という仮説である,もっとも,
これを人々の選択する行動に関する仮説としなくても,人間が行動を選択
するぱあいこの仮説を1つの“基準”とみなし,これにもとづいた試算結
果を,実際の購買行動と比較する形で理解し,解釈するという使い方にも
役立つ.
いま,ある同一商品群について珊写…≡αを求めておくいっぽう,1翅が
最大になる条件を求めてlgllp‘=β馳のとき(HIZ)max=βであることか
ら,価格当りの最大情報量が求められる.つまり,
(i)p‘を既知(与件)とすれば,それに見合う価格駒の審査が可能
になるし
(ii)脇を既知(与件)とすれば,それに見合う,望ましい存在確率
p‘が算出される.
なおここでβ=αとおいて解けば,両者とも,全商品を考えたときのE
74
問題解決の視点からみた現在・過去・未来(四)
および創となり,これらは同じで“変更がない”のであるから,これに
もとずいて
(i) 販売者側では,働の実績から,それに見合う新価格駒をつける
のが客へのサーピスであり
(ii) 購入者側では,勉の実態を調査して,現行の価格体系駒を批判
するのが消費者活動の第1歩となる.
さらに,この考え方を拡張すれば,商品の種類が異なっても,それぞれ
の種類の商品が,それぞれ各種の銘柄をもち異なる出まわりかたをしてい
るなら,単位価格当りの情報量の逆数をとって,それぞれの商品群につい
て,bit当り何円かという,情報量当りの換算価格が求められる。これに
よって商品をすぺて情報量で共通化して,商品群の価格比較をする際にも
利用できる.
これより割高の商品群とか割安の商品群などと換算価格として明示でき,
商品群のランクづけができる.そして,そのような価格差が生ずることの
原因や理由を考察するところまで踏みこめることになる。
計算例
(1)本の価格
ある本を限定豪華本として2000部刷る.これの普及版を10倍の2万
部刷る.
すると市場に出まわる確率は
豪華本について 窺=2000122,000=2122
普及本について pF20,000/22,000冨20/22
これよりそれぞれの価格筋,駒の比は
筋1091/P為1.04
一= =一÷25,16
駒 log l/pI o.04
そこでッF1,000円とつければ筋≠2。5万円の定価が適正であると求め
75
一橋大学研究年報 自然科学研究 27
られる.
(2) レタリングの適正価格
あるメーカのある大きさ(サイズ)のレタリングをとりあげる.
銘柄はアルファペットで
ABCD……Z
, , , , ,
また,使用確率は文章での発生確率をそのまま流用して,
P42Pβ,”””,Pz
このとき
価格は,字種によらず同一価格でありこれを写o(円)とすると,現状に
おける価格当りの情報量αは
E E 」肛
ぴニ ニ ニヘ
写 ΣP‘9‘ 90
となる.
いっぽうβ≡(別雪)m。xは,モールス符号語の長さについて求められた
βをそのまま採用するとβ≒0.$であるから,これよりΨ‘=(1!β)191!p‘
から基準価格が決まるが,ここで売上総額を同じにするためにβニαとし
て,適正な価格体系は
μ‘=(1/α)lg1!P‘
を採用して決めるのが合理的だということになる.
いまM=26のぱあいH1=4。12として,レタリング1枚写o=50円と
すると
50 10911P‘
Ψ‘ ’
4.12 1092
そこで例えぼ
発生確率が最大の文字θについてp6=0.11,最小の文字2について
p8=0.0018を使ってみると,文字θの価格は3.50円に,また3価格は
76
問題解決の視点からみた現在・過去・未来(W)
110.65円にするのが適正であるということになる.
50円を基準にすれば,よく使われる文字8は,現行の価格の約1114
にすぺきだし使われかたの少ない文字∼は2.2倍の高い価格にしてよい
と提案できる.
(3) レポートの評価
教育の現場が行われるテストやレポートの目的としては,
① 現解力,論理九推理力などを調ぺるタイプのもの(自然科学系)
② 情報の要約力,解釈力などを調ぺるタイプのもの(人文・社会系)
のほかにも
③ 手法・技法の適用(応用)能力を調べるタイプのもの
などがある.自然科学系の問題でも,期待する解答としては,
⑨ 正解が1種しかないもののほか
⑤ 正解が数種あるばあい,さらには
◎解の目標や条件をコトバで設定して,発想やアイディアを要求する
もの,まで考えられる.
発想やアイディアとなると,どれだけ異なる種類の解答がとぴ出してく
るか全くわからないし,またそれらについてどう評価するかは容易ではな
い.一般にはその道の専門家の判断にまかせることになるが,専門に分化
されていない領域のテーマのばあいどう扱うかは難問である.
こんなぱあい,解答を内容によって分類して,各分類に属する解答の
“少ない”ほうを高く評価するという観点が設定できる.つまり情報量最
大化の基準を採用するわけである.
これの事例として,文章をタテ書きするばあいの4種,ヨコ書きの4種
について,これらを区別する適切なrネーミング」を学生から募集してみ
たことがある.
提出枚数238に寄せられた代表的な呼称を,つぎの4種類に区分した.
77
一橋大学研究年報 自然科学研究 27
① r右行下降式」で代表されるもの(右向き下降,右走降下,東進南
移,右読み下,……などを含む)32枚
② r右下式」(ライトダウン,ES,RD東南,左右上下……などを含
む)66枚
③ 「“横”右式」(左上横,左横下……などを含む)50枚,
④ 「その他」これには,英文式,英語式など,「語学・文章」系の命
名や,プッシュホン式,タイプライター式などr機械」系の命名や,3時
30分式とか+一式など「数字・記号」系ほかなどが混在していて50枚
となった.
これ’ら4種類に区分されたときの所属枚数を使って求めた一logρをそ
のまま評価値としてみると①が87点,②56点,③42点,④68点とな
る.④の取扱いには問題が残るとしても,点数をそのまま順位づけて①を
をA,②をC,③をD,④をBとおいてみることはできる.岡山『テ
ストにおける出題のタイプと成積評価の検討』日本科学教育学会 1982
論文を評価するのに,論文を読んだとき編集者の‘‘驚き”の程度を表わ
す数値の自然対数をとっは指標をとり入れた評価値の決定法がPhysics
Today1967年7月号に発表されている.ここで驚きの程度と評価の指標
との関係の1例をあげると
一先30年前にわかっていたことだ
0:だからどうだというのだ
1=説明が足りんね
2:この議論にはついていけん
3:疑わしいね
4=本当かね
6:他の雑誌に投稿したほうが
7=天才かな,それとも.
78
問題解決の視点からみた現在・過去・未来(W)
といったぐあいである.
これは,科学上の業績を評価する目安として,Gillmanが最小限の驚き
を表わす基準値を導入しようとした先駆的研究を発展させたものであると
断っている.
(C) 予言の情報量
事象が2種のαとゐだけに分類され,このいずれかの事象が繰返し十
分長く発生するとする.
これを記録すれぱαとδからなる2元記号列となる.以下,この記号
列で考える.
いま,記号列の長さをN,このうちαが発生したコ数を1V。,わが発
生したコ数を脇とすると,αが発生した確率p=瓦μΨ,6が発生した
確率g=脇μ▽(=1−p)
ここで1▽=1%十瓦δ
記号列がもたらすエントロピーEは
1 1
H=P19一=919−
P σ
いま,これらの記号発生に関して,すぺて“予言”が行われたとする.’
①αと予言した五回のうち,あたったぱあいをπα,はずれたばあい
をπ4とすると的中率α=π¢但,(且=π。+πα’)で予言αがもたらすエン
ト ロ ピー Eα ‘ま
α 1一α
Eα=αlg一十(1一α)19−
P 9
② δと予言したB回のうち,あたったばあいを砺,はずれたばあい
をπガとすると的中率β=π01β(β=物十πδノ)で予言ゐがもたらすエン
トロピー 」璽わ ‘ま
79
一橋大学研究年報 自然科学研究 27
β 1一β
Eo=〒β19一+(1+β)Ig−
9 P
これより全予言のエントロピーEは
五 B
E==一E¢十一Eひ
ハ7 ハ7
ここで予言がすぺて完全なら,
①αの予言について的中率α翻1だから EG=191/p,
② δの予言についても的中率β=1だからEゐ・=191!g
これより全予言のエントロピー瓦は
五=ハ奄,β=ハら だから
、411v==p,β/ハ7=g となり
1 1
E1=P19一+919一.
P 9
つまり事象がもたらすエントロピーに一致する.斉藤嘉博『予測』日科
技連 1970.
アンケート調査への応用
いま1V人にアンケート調査を行う.回答はyes,noの2種に限ると
する.
アンケートを1人づつ行って,その回答を記録すれば2元記号列となる.
これがもたらすエントロピー動は
1 1
E1=P19一+919一
ρ 9
ここで p=瓦♂ル,g=脇1ハ7(=1−p)
Nαは妖yes)の,1%はδ(no)のコ数である.
さて,回答者を予言者でもあるとみると,ある質問に対してαと回答
したとすると,それはαと予言して回答αを発生させたと解釈できるの
80
問題解決の視点からみた現在・過去・未来(W)
で,αの予言について的中率は1のばあいとして,その予言・回答者がも
たらすエントロピー現=lg1/p,またδと回答したばあいはその予言・
回答者がもたらすエントロビー現=lg l/gとなる.
いまピ番目の質問についてp=gであれぱ,αの予言・回答者もゐの
予言・回答者もそのもたらす情報量は1bitで同じである.ただし,その
回答の内容はyesとno・でその意味はへだたっている.つまり情報量は
同じでも回答の意味内容からみれぱ,はつきり相違する.これによってα
予言・回答者とb予言・回答者との2つのグループにわけられる.
また,別のゴ番目の質問で,再ぴp=gであれぱ,この質問の観点で
も2つのグループにわけられる.
そしてこれらの分類はいずれも,情報量的にみて“公平”なわけかたに
なっている.
さて,た番目の予言・回答者が,質問ゼでαまたはゐのいずれか,¶
別の質問ゴでもαまたはδのいずれかの予言・回答するから,その組
合わせとして,予者・回答のパタンは倣,の,加,肋の4種になる.
一般に多くの㎜コの質問について,すぺてp=gがえられるなら,情
報量的にみて等しい条件を満たしながら,予言・回答が異なるパタンによ
って最大2需種にグループわけできる.
N人の集団を,何ら分類せず,そのままにしておけば,その集合がも
たらす情報量は0であるが,これを,ある観点でX種に分類し,乞番目
の分類に属する人数を鵡とすると,
この分類によってエントロピー
よ
丑=ΣPε191!麹 (P‘=酬π)
f;1
がもたらされる.
従って分類することは集団のエントロビーを大きくすることを意味する.
81
一橋大学研究年報 自然科学研究 27
従って分類では,種数Kが同じであうてもエント・ピーが大きくなる
ような観点での分類がそれだけ有効であり,意味があるといえる・
また,エントロピーは,その分類の“よさ”を示す指標となるいっぽう
で,よい分類が保証されたとき,分類のなかみもそれに伴って注目に値す
るものとなる.
つまり単なる集団としての特性をエントロビーで吟味するだけにとどま
らず,集団を構成する各個体について,それぞれがどの特性をもつグルー
ブに所属するかを知るのに役立てることができる.
これの具体例は,あとで事例3で示す.
また乞番目の質問に予言・回答αをしたとすると,もたらす情報量
はlg1/ρ‘,また予言・回答δをしたら,情報量191/gεをもたらしたこ
とになる.
すると質間砲=1,2,……,m)に対してすぺて予言・回答したとき,も
たらした全情報量は,これら情報量の和
1謬Σ191仇+Σ191働
ゴ る
ここでΣはωと予言・回答した質問番号づのすぺて,Σはδ予
ゴ ノ
言・回答した質問番号ゴのすぺてについて加算することを意味する.
このように情報量は,予言・回答という情報の指標(以下得点とよぶ)
とみられるが,この得点は,各質問に対して,予言・回答数が相対的に少
ないグル〔プに属するほど“大きく”なる・つまり多くの予言・回答者と
違う予言・回答をするほど得点は高くなる.そして,このような傾向が著
しく表われるほど,その予言・回答者は,・その持前の“未来分析の感覚”
において精神的に“若い”とみることができる.
r若さ」をどう定義するかについては,あらためて考察し,議論を重ね
なければならないのだが,ここでは,基本的な若さの特質.として‘‘多数や
現状に対する拒否願望ないし態度”を全面にかかげておくことにする.
82
問題解決の視点からみた現在・過去・未来(粗)
得点が高いほど“若い”と
情報量計算
7
○
X
b葛
と事例4で示す,
答
ド ∼
これの具体例を,このあ
回
×
1 ○ ×
○
α‘
(事例3) 予言・回答
のグループわけ
朝日新聞社が「1970年
代の日本」を予測するアン
1
2
3
4
5
6
7
32
68
69
31
27
73
33
67
09
91
8
9
情報量
情報量
1
2
3
4
5
6
7
8
9
191/p∫ 191!p‘
191/P∫
191!P‘
鞠欄量
いうことになる.
質問コードド
.‘
乞
表1520の質問に対する回答数およぴ
質問コ
そこで全情報,つまり総
平均
情報
量
1,644
0,556
0,904
0,535
1,690
0,893
L889
0,454
0,841
1,600
0,578
0,915
3,474
0,136
0,436
1,889
O,454
0,841
1,556
0,599
0,925
1,152
0,862
0,993
3,474
O,136
0.436”
0,529
27
73
34
66
45
55
09
91
10
12
88
10
3,059
0,184
11
09
91
11
3,474
かr……に;なるか」という
0,136
0,436
12
22
78
12
2,184
0,358
0,760
種類の20コで,これにyes,
13
71
29
13
0,494
1,786
0,869
14
31
69
14
1,690
0,535
0,893
15
26
74
15
1,943
0,434
0,827
16
32
68
16
1,644
0,556
0,904
17
18
82
17
2,474
0,286
0,680
18
56
44
18
0,837
1,184
0,990
た100人である,
19
25
75
19
2,000
0,415
0,811
データは,これらの人た
20
64
36
20
0,644
1,474
0,943
ケート調査を行った,その
データが1970年1月1日
の紙上に発表された.
質問はr……ですか」と
noで回答する形式である.
調査された対象は,70年
代のにない手として選ばれ
Σ¢‘躍651
ちの回答をyesなら○印,
Σゐ‘=1349
亙=2000
noなら×印で20コからな
るOxの記号列で表わしてある.一
なお,回答のなかには○とも×とも回答せず?(保留)が16コ含まれ
ているが,1つの質問について最大3コにとどまる程度に分散しているの
で,それぞれの回答の○とxのうち回答数の少ないほうに入れて加算した.
83
一橋大学研究年報 自然科学研究 27
このようにデータを多少修整したあと,質問1から20まで順序に,そ
の○,.×り回答歎銭表15に不す..
ここで 1覧=Σ砺=・651,
脇=.Σ’わ盛=1349,1V=2000
である,
さてこのデータ(砺,b‘)(ぢ=1,2,……20)をみるとα‘=b盛というのは
みつからないが,質問8に対する回答数が最も接近している。
この質問はr自衛隊が出動する騒乱が起るか」で,○が45各(?の2
名を含む),×カ155名である,つぎに接近しているのは,質問18で「恋
人が街頭でKissするようになるか」で,○が56名,×が44名である,
なお,質問8は内容的には“硬派”の現象であり,これに対し質問18
は“軟派”の現象であるという対比,また,回答数も,前者では×がOよ
り多少多く,後者では○が×より多少多いが,回答数比は,前者と後者で
逆転するという対比を示すことなど偶然とはいえない気がするほどである,
それはさておき,エントロピーの大きいこれら2種の回答群を取り出し質
問8,質間18に対する個人の回答を,この順にならぺて
yes yes−OO……Tl
yes no一→OX……T2
nO yes一→×○……T3
no no → X X。9。”。T4
と4つのタィプにわける.そして,これら4種は,該当する質問の内容と
その回答に,回答者の予測傾向を反映しているので,上から革新派,保守
派,楽観派そして悲観派とよぶ.
ここで,回答群のもつエント・ピーをみておこう(表15).
質問8は0.99,質問18も0.99でほぼ同値.
エントロピーの最小なのは質問5,9,および11でいずれも0.44で,
84
問題解決の視点からみた現在・過去・未来(四)
大きい値の半分以下におちこんでいる.
なお,このエント・ビーをもつ3種の質問とは:一
質問5はr部課長は部下が選ぶようになるか」であり,質問9はr大規
模な戦争が起るか」であり,質問11は「マイカー族は減るか」である.
これらは,いずれもyes回答が,全回答の1割弱にとどまっているとい
うわけである.
さて4種のタイプT1,T2,T3,T4に属する人々のリストを示す(表16)・
綱山『人間の分類と評価のテクニソク』蟻塔 1975−2.
(事例4) 予言・回答のr若さ」指数
再ぴ前出の朝日新聞社のアンケート調査(’70−1−1)を利用する.
各質問砲=1,2,……,20)についての○,Xの回答数α‘とb‘のデー
タから,
P‘=α‘/1罵9‘=6‘!N
を求め,さらに1911p‘およぴlg1/g‘を求める(表15)。
これを使って,予言・回答者の20コの回答パタンと照合しながら上の
表から情報量を求めて総和をとる.こうして求めた全情報量を大きさの順
にならべる(表17).
なお,20コの予言・回答で,情報量の大きいほうぱかりが選択された
とすると全情報量は41・25(最大値)となる.さすがこの値になるような
予言・回答者はいなかった。また,逆に,情報量の小さいほうばかりを拾
ってくると921(最小1直)がえられるが,この値を示す予言・回答者は
110位に存在する,
また,これら最大値や最小値を使って全情報量を基準化して多少イメー
ジしやすい指標を導くことも可能であるが今回は省略する.
85
一橋大学研究年報 自然科学研究 27
表16 70年代をになう人,100名の回答パターン
T2
T1
井上 光晴
上野 孝
牛尾 治朗
内田 勝
梅垣 哲郎
浦山 桐郎
大田 昌秀
金井美恵子
木村三千雄
草柳 大蔵
コとノ
ンユンコ
三枝 守雄
鈴木 義雄
関根 智明
高橋 和巳
田淵 節也
堤 清二
勅使河原霞
戸田 修三
永井 道雄
橋本 道夫
藤本 陽一
松本三之介
宮本 憲一
森 一久
吉田 直哉
和田 誠
横浜市長
東大教授(医用電子
天谷 直弘
鮎沢 啓夫
池田 芳蔵
石原 俊
学)
作家
日米水産社長(山口
県)
いずみたく
作家
動力車労組青年部長
ウシオ電機社長
少年マガジン編集長
電通常務
映画督監
犬丸 直
今堀 和友
44
25
65
73
94
64
9 5
64
43
65
95
54
93
93
5 3
23
6 3
25
35
15
14
75
14
35
95
63
94
03
75
0
4
五木 寛之
井上 修
ヰ4
ー 3
74
9 4
32
83
83
45
03
94
42
24
4 4
53
05
6 4
44
3 3
84
64
23
74
64
6 4
54
4 4
3 3
9 4
3 3
83
3
5
飛鳥田一雄
渥美 和彦
通産省企画室長
九大教授(微生物学)
三井物産常務
日産自動車専務
作曲家
文部省人事課長
東大教授(生物物理
学)
岩沢 正二
宇佐美忠信
江藤 淳
琉球大教授(社会学)
詩人
国際農村青年協会長
大平 正芳
尾崎和三郎
角本 良平
上坂 冬子
高坂 正尭
(新潟県)
ルポライター
デザイナー
石川島播磨重工取締
役
スズヤ社長
慶大助教授(管理工
住友銀行常務
全繊同盟書記長
文芸評論家
自民党
松下電器報道部長
交通評論家
評論家
京大助教授(国際政
治学)
河野 洋平
香山 健一
学)
庄司 薫
菅谷 隆介
田川 誠一
田中 角栄
中内 功
作家
野村証券常務
西武百貨店社長
生け花家
中大教授(商法)
東京工大教授(教育
学)
中曽根康弘
厚生省公害課長
早大教授(原子物理
南雲 仁一
服部 盛栄
藤吉 次英
学)
東京教育大教授(日
本史)
不破 哲三
松下 圭一
矢野 絢也
渡部 正郎
大阪市大助教授(財
政学)
原子力産業会議事務
局長
NHK:ディレクター
自民党
学習院大助教授(社
会工学)
作家
日本興業銀行取締役
自民党
自民党
ダィエー社長
自民党
東大教授(情報工学)
三菱商事常務
東レ副社長
共産党
法政大教授(政治学)
公明党
警察庁審議官
イラストレーター
50名
31名
.8
6
問題解決の視点からみた現在・過去・未来(V皿)
によるグループ別リスト(全)
丁坐 .
池田 大作
石原 信吾
石山 四郎
今井 大宗
岩間 和夫
内田 忠夫
岡崎 令治
加藤 秀俊
河上 民雄
木島 昂
近衛 忠揮
坂本 義和
6
31
41
50
55
50
56
4 9
39
31
41
40
32
4 8
46
40
5 7
53
48
44
46
45
51
4 4
21
4
浅利 慶太
5
44
4 9
4 6
4 7
33
35
35
34
50
50
4 3
50
59
3
嗣一 隼 吉 実敏章浩作雄一 昇次尭
正真 藩 紀良良文敬 悌
路 井木
橋村 田 藤 田小川長々木畑 宮村妻
石市 岩 衛 小北黒小佐高高 高中我
.T3
社会党
京大東南ア研究セン
ター所長
日立製作所計算制御
部長
東大教授(国際関係
演出家
創価学会会長
虎の門病院事務部長
経済評論家
八幡製鉄常務
ソニー専務
論)
べ平連
東大教授(計量経済
学)
社会運動家
名大教授(生化学)
建築家
京大助教授(社会学)
総評弁護団
社会党
民社党
開業医
大蔵省審議官
日赤外扇部主事
電機労連大阪地協議
長
東大教授(国際政治
東芝常務
学)
佐藤 八次
下河辺 淳
外村 隆
鍋島 直紹
橋本 恕
槙枝 元文
三島由紀夫
宮崎 勇
森 秀太郎
安村 美博
防衛庁第5幕僚室長
東京都広報室長
愛育病院産婦人科部
経済企庁調査官
法務総合研究所研修
第一部畏
長
自民党
外務省中国課長
日教組書記長
作家
経企庁調査官
トヨタ自工取締役
千葉大助教授(微生
物学)
吉永小百合
渡辺 美佐
女優・
渡辺プ・副社長
五十音順・敬称
略・数字は年齢
(’70・1・1現在)
14名
25名
87
一橋大学研究年報 自然科学研究 27
表1770年代をになう人,100名の回答パターンに
よる全情報量の順位リスト(全)
中 内 功 47 ダィエー社長
29.71
吉 田 直哉38NHKディレクター
22.73
五 木寛 之 37作家
渥美和彦 41東大教授(医用電子学)
宇佐美忠信 44全繊同盟書記長
22.43
角 本 良 平 49交通評論家
上 坂 冬 子 30評論家
石 山 四 郎 50経済評論家
21.23
岩 間 和 夫 50 ソニー専務
不 破 哲 二 39 共産党
20.75
木 島 昂 41開業医
20.65
21.87
21.54
20.99
20.79
20.66
飛鳥田一雄 54横浜市長
20.57
下河辺 淳 46経企庁調査官
宮 崎 勇 46経企庁調査官
森 一 久 43原子力産業会議事務局長
20.45
永 井 道 雄 46東京工大教授(教育学)
関 根 智 明 43慶大助教授(管理工学)
19.70
高 橋 和 巳 38作家
草 柳 大 蔵 45ルポライター
19.03
牛 尾 治 朗 38 ウシオ電機社長
18.75
高 畑 敬一40電機労連大阪地協議長
北小路 敏 33社会運動家
18.73
外 村 隆 50法務総合研究所修第一部長
矢野絢也37公明党
19.77
19.74
19.31
18.91
18.69
、18.69
18.63
三島由紀夫 44作家
18.38
田 中 角 栄 51 自民党
18.27
上 野 孝 28動力車労組青年部長
18.09
内 田 忠 夫 46東大教授(計量経済学)
香 山 建 一 36学習院大助教授(社会工学)
17.51
木村三千雄44国際農村青年協会長(新潟県)
17.40
88
17.79
問題解決の視点からみた現在・過去・未来(粗)
井 上 修 49 日本水産社長(山口県)
17.33
鈴木義雄44スズヤ社長
17.27
橋 本 道 夫 45厚生省公害課長
加 藤 秀俊 39京大助教授(社会学)
17.27
尾崎和三郎 55松下電器報道部長
16.86
藤 本 陽 一 44早大教授(原子物理学)
高 坂 昭 尭 35京大助教授(国際政治学)
16.79
池 田 大 作 41創価学会会長
16.46
17.17
16.50
高 宮 昇53東芝常務
16.41
市 村 真 一44京大東南ア研究センター所長
16.40
石 橋 政 嗣 45社会党
16.22
松 下 圭 一 40法政大教授(政治学)
16.21
和 田 誠 33 イラストレーター
倉 本 憲 一 39 大阪市大助教授(財政季)
16.19
浦 山 桐 郎 39映画監督
16.08
大 平 正 芳 59 自民党
15.δ5
勅使河原 霞 37生け花家
15.51
コシノジュソゴ『30 デザイナー
15.50
金井美恵子 22詩人
15.49
河 野 洋 平 32 自民党
15.47
佐 藤 八 次 48東京都広報室長
渡 辺 美 佐 41渡辺プ・副社長
15.47
菅 谷 隆 介 53 日本興業銀行取締役
15.17
森 秀太郎 55 トヨタ自工取締役
15.08
佐々木良作 54民社党 .
14.88
今 堀 和 友 49東大教授(生物物理学)
14.77
浅利 慶 太 36演出家
14.75
石 原 俊 57 日産自動車専務
14.66
犬 丸 直 46文部省人事課長
14.65
池 田 芳 蔵 58三井物産常務
14.61
黒 川 紀 章 35建築家
14.47
小 国 実 37 ぺ平連
田 修 三 46 中大教授(商法)
14.45
16.20
15.27
,
一
89
1422
一橋大学研究年報 自然科学研究 27
梅 垣 哲 郎 50電通常務
14.07
江 藤 淳 36文芸評論家
13.96
衛藤 藩 吉 46東大教授(国際関係論)
13.96
藤 吉 次 英 56’東レ副社長
13.93
橋 本 恕 43外務省中国課長
堤 清 二 42西武百貨店社長
13.64
石原信吾 51虎の門病院事務部長
13.57
13.91
三枝 守雄 56石川島幡磨重工取締役
13.46
いずみたく 39作曲家
13.02
内 田 勝 34少年マガジン編集長
12.97
庄 司 薫 32作家
服部盛 栄 59三菱商事常務
鍋 島 直 紹 57自民党
12.97
12.97
12.89
鮎 沢 啓 夫 42九大教授(微生物学)
12.83
近衛 忠 渾 30 日赤外事部主事
12.82
渡 部正 郎 50警察庁審議官
中曽根康弘 51 自民党
12.76
12.75
我 妻 尭 39愛育病院産婦人科部長
12.74
槙 枝 元 文 48 日教組書記長
12.69
河 上 民 雄 44社会党
12.63
坂 本 義 和 42 東大教授(国際政治学)
12.46
南 雲 仁 一 43東大教授(情報工学)
12.02
小長井良浩 35総評弁護団
12.01
田 渕 節也 46野村証券常務
11.95
田 川 誠一51自民党
11.68
今 井 大 宗 55八幡製鉄常務
井 上 光 晴 43作家
U.62
11.48
松本三之介 43東京教育大教授(日本史)
11.48
中 村 悌 次 50防衛庁第5幕僚室長
岩 沢 正 二 56住友銀行常務
大 田 昌 秀 44琉球大教授(社会学)
10.97
高 木 文雄 50大蔵省審議官
10.92
90
10.99
10.94
問題解決の視点からみた現在9過去・未来(皿)
Qノ ー 4 4 Q’
4 4 凋㌣ ラ創 3
隼博弘合治
美直百令
田村谷響
ヤ
岩安天吉岡
日立製作所計算制御部長
10.80
千葉大助教授(微生物学)
10.72
通産省企画室長
10.70
女優
10,23
名大教授(生化学)
9.21
敬称略 数宇は年齢(’7ひ1・1現在)
91\
一橋大学研究年報 自然科学研究 27
92