2010年03月16日

常識を覆す話

【絶縁体に電気信号伝送 電子の自転活用 東北大グループ】
http://www.kahoku.co.jp/news/2010/03/20100311t15018.htm

常識を覆される研究なので、そのうちノーベル物理学賞も十分狙えるかもしれませんね。
という事で今日は、「電気を流さない絶縁体」に対して、何故本研究で電気信号が送れたかを説明しましょう。


200912_iceland_foreign-reserves.jpg
↑が、「通常の電流伝送」と「本研究での電気信号伝送」との違いです。
「通常の電流伝送」の方は、入力側(正極)に電気をかけると金属・半導体中の負電荷を持つ電子が引き寄せられます。この電子の移動によって電気が流れるわけで、直感的にイメージしやすいとは思います。ところが、「本研究での電気信号伝送」は負電荷を持つ電子が動くわけではないために、何故電気信号を送れるのかまったくイメージができません。これを理解するためには、「スピン波」と「磁場」の知識が必要となります。


【スピン波について】
という事で、まずはスピン波の性質について説明しましょう。電子は原子核の周りを回っている(公転している)のは皆さんもご承知の通りですが、実は電子は公転だけではなく自転もしています。(正確には自転ではないのですが、自転と考えてもあまり矛盾は出ないので、このまま自転で説明します。)この自転の事をスピンと言って、このスピンには向きが定義されています。(電子の自転が「右回り」か「左回り」か、というようなイメージ)実は過去の研究から、このスピンの向きがその物質の磁性と密接に関係する事がわかっています。
そして、スピン波とは↑の図のように、絶縁体である磁性ガーネットに電気を流すと、この磁性ガーネット中の電子のスピンの方向(自転軸の向き)が変わるわけです。このスピンの方向(自転軸の向き)の変化が、あたかも磁性ガーネット中を波のように伝わっていくので、この現象を「スピン波」と言っているわけですよ。


【磁場について】
実は、「電気」と「磁気」は密接に関係しています。というのは、「ある場所に電気が流れる=その場所の磁場が変化する」という物理法則があるからです。つまり、以下の@とAが自然界の法則としてあるわけです。

@電流が流れる→磁場が変化する
A磁場が変化する→電流が流れる


これで、ピンっと来た人もいるのではないでしょうか。
【スピン波について】で説明しましたが、磁性ガーネット中を伝わるスピン波はスピンの方向(自転軸の向き)を変えるため、反対側の電極でAの法則を利用して磁場変化を電流に変換しているって事ですね。
注意しなきゃいけないのは、あくまで「絶縁体である磁性ガーネット中で電気が流れている」というわけではなく、「磁性ガーネット中の電子スピンを介して、反対側の電極で電流を発生させてる」というわけですよ。



このメカニズムを利用して、電気回路等にいつ応用できるのかはわかりませんが、とりあえず次なる目標は「安くて相性の良い電極と絶縁体探し」ですかね。
是非とも事業仕分けで本研究の予算が削られないことを望みます……。



今日のエントリーで、「なるほど」「ふむふむ」「面白い」などと思ってくれた方で、一票を頂ける方は是非ともお願いします。↓
人気ブログランキングへ
posted by きらっち at 00:00| Comment(0) | TrackBack(0) | 科学

2010年03月04日

フーリエ変換の理解に向けてA

【フーリエ変換の理解に向けて@】(2010年02月17日)
http://kiracchi-serendipity.sblo.jp/article/35351183.html

さて、前回は(離散)フーリエ変換のイメージを書いたのですが、今日は前回言いたかったことを式で表すのではなく、グラフ(絵)で表します。これで、何となく「フーリエ変換が何をしているのか?」というイメージができると思います。

とりあえず、ここでは下記のように16年間分のGDPを考えましょう。ちなみに、もちろんこれは実際のGDPではなく、あくまで例のために用意したものです。
( 479 , 463 , 452 , 486 , 530 , 496 , 475 , 472 , 488 , 485 , 464 , 430 , 474 , 508 , 497 , 481 )

そして、この16個のGDP系列にフーリエ変換を施すと、↓のように16個の系列を、「ゆっくり変化する成分」(低周波数成分)や「激しく変化する成分」(高周波成分)に分解するわけです。
fourier_exsample1.jpg
ここでは、簡単に説明するために16個のGDP系列に対して5個の成分(基底ベクトル)に分解されて、それぞれの基底ベクトルにある定数がかけられています。この5個の定数が「変換係数」と言って、フーリエ変換された結果(値)となります。

基底ベクトル@の変換係数が1920
基底ベクトルAの変換係数が-50
基底ベクトルBの変換係数が70
基底ベクトルCの変換係数が-20
基底ベクトルDの変換係数が10

ちなみに、この変換係数の符号はあまり重要ではありません。というのも、正負の符号が逆という事は、その基底ベクトルの位相が反転するだけなので、むしろ大事なのは変換係数の絶対値の方です。ある基底ベクトルの変換係数の絶対値が大きいということは、その変換係数だけで大体の原系列の変動が説明できるわけです。
今の例だと、飛びぬけて基底ベクトル@の変換係数が大きいのですが、これはそもそも毎年400兆円〜500兆円の間でGDP系列が変化しているのですから、その分のオフセットを示しています。
そして、基底ベクトルAと基底ベクトルBの変換係数の絶対値が大きく、基底ベクトルCと基底ベクトルDの変換係数の絶対値が小さいため、このGDP系列は「毎年大きく変動するような高周波成分はほとんどなく、わりとゆっくり変化する低周波成分だけで説明できる」という事が言えるでしょうね。という事で、この変換係数に注目すると、「元々の系列の周期性を抽出できる」という利点があります。


fourier_exsample2.jpg
ちなみに、今の例をグラフではなくベクトルで説明すると、↑のようなことになるわけです。

ここでは説明のために、16個の原系列に対して5個の変換係数しか出てきませんでしたが、実際のフーリエ変換ではn個の系列はn個の成分に分解されます。


さて、それでは元々n個の系列を、どのように計算したらフーリエ変換の変換係数を導き出せるのでしょうか?次回以降は、その辺りについて説明します。



今日のエントリーで、「なるほど」「ふむふむ」「面白い」などと思ってくれた方で、一票を頂ける方は是非ともお願いします。↓
人気ブログランキングへ
posted by きらっち at 00:00| Comment(0) | TrackBack(0) | 科学

2010年02月17日

フーリエ変換の理解に向けて@

本ブログ開設以来、是非とも皆様へ説明したかった数学分野が「フーリエ変換」でした。ただ、この「フーリエ変換」なるものは理工系の大学生ですら、「なるべくこの分野は勉強したくない」と避ける人が多く、説明するにも非常に難解な概念が多いため、今までこの話題は避けていました。
本ブログの読者のニーズとはかなりずれるかもしれませんが、とりあえず何回かにわけて「フーリエ変換」のわかりやすい説明をして行こうかと思っています。


まず、そもそもこの「フーリエ変換」(とその仲間達)が実際に何に使われているかと言うと、
1.MP3プレイヤー(音楽や音声データを扱う時によく使われる)
2.MPEG・JPEGの映像・画像(映像・画像データを扱う時によく使われる)
3.レーダーやソナー(音波や電波分析によく使われる)
4.無線通信(電波の送受信をする時によく使われる)
というところでしょうか。3.は軍事分野ですが、それ以外は現代生活に密着した製品(特にここ10年〜20年で広まったもの)によく使われています。


という事で、この「(離散)フーリエ変換」とはどんなものかというと、簡単に書けば「あるベクトルを複数のベクトルで分解する」という事です。こんな例を考えてみましょう。今、「国語」「数学」「理科」「社会」の4科目のテストをしたときのあなたの点数が(78,64,72,82)だったとします。このように、4科目の点数を一組の全科目ベクトルとみなす事ができます。つまり、「1個目が国語の点数」「2個目が数学の点数」「3個目が理科の点数」「4個目が社会の点数」という4次元ベクトルですね。
よって、全科目ベクトルは以下の通り各科目ベクトルの和である事がわかります。

vector-and-base.jpg
ここで大事なのは↑の赤枠にも書きましたが、「4次元ベクトルである全科目ベクトルを数学的に表現するには、4つの基底ベクトル(4つの軸)と4つの点数が必要になる」という事です。

そして、ここからが肝心なポイントですが、実は基底ベクトル(軸)の取り方は自由度があります。今の時点では
(1,0,0,0)←国語を表す
(0,1,0,0)←数学を表す
(0,0,1,0)←理科を表す
(0,0,0,1)←社会を表す
このように、それぞれの基底ベクトル(軸)が「科目」と解釈できるのですが、この4つの基底ベクトル(軸)を以下のように考えてみましょう。
(1,1,1,1)
(1,1,-1,-1)
(1,-1,-1,1)
(1,-1,1,-1)
すると、全科目ベクトル(78,64,72,82)は以下のようにベクトル分解でき、新たな尺度での4つの点数(74,-3,6,1)が出てきます。

vector-and-converted-base.jpg
ちなみに、それぞれの点数が何を表しているかというと以下の通りです。

【点数@】
基底ベクトル@が(1,1,1,1)となっているので、点数@は総合力(4科目の平均点)を表している。点数@が大きければ大きいほど、平均的に点数の取れている事がわかる。

【点数A】
基底ベクトルAが(1,1,-1,-1)となっているので、点数Aは「国語&数学の点数」から「理科&社会の点数」を引いた値で、点数Aはマイナスの値も取りうる。つまり、点数Aが大きいと「暗記能力」よりも「論理的思考能力」が高く、点数Aが低いと「論理的思考能力」よりも「暗記能力」が高い事になる。この事から、点数Aの高低によって、「論理的思考」と「暗記」のどちらが得意なのかを計る指標値に成りうる。

【点数B】
基底ベクトルBが(1,-1,-1,1)となっているので、点数Bは「国語&社会の点数」から「数学&理科の点数」を引いた値で、マイナスの値も取りうる。つまり、点数Bが大きいと文系科目が得意で、点数Bが小さいと理系科目が得意という事がわかる。よって、点数Bの高低によって、「文系」と「理系」のどちらが得意なのかを計る指標値に成りうる。

【点数C】
基底ベクトルCが(1,-1,1,-1)となっているので、点数Cは「国語&理科の点数」から「数学&社会の点数」を引いた値で、これもマイナスの値を取りうる。点数Cは、直感的にどういう点数なのか説明しづらいが、とりあえずこの点数Cが0に近ければ「論理や暗記」と「文系や理系」で説明のできる点数の取り方をしているという事になる。一方で、この点数Cの絶対値が大きいと「論理や暗記」と「文系や理系」で説明のできない点数の取り方をしているという事になる。


このように、元々は各科目の点数を全科目ベクトル(78,64,72,82)で表していたのだけど、基底を変える(軸の取り方を変える)ことによって、新たな点数(74,-3,6,1)に変換する事ができるわけです。
実は、フーリエ変換というものは基本的にはこれと同じことをしていて、元々のベクトルを複雑な基底ベクトルで分解して、何か別のベクトルに変換しているんですよ。

今の例の場合は、(78,64,72,82)というベクトルに対して、
(1,0,0,0)(0,1,0,0)(0,0,1,0)(0,0,0,1)という基底ベクトル(軸)ではなく、(1,1,1,1)(1,1,-1,-1)(1,-1,-1,1)(1,-1,1,-1)という4つの基底ベクトル(軸)に変えた場合に、(74,-3,6,1)という新たな点数ベクトルに変換したわけですが、フーリエ変換の場合はこの基底ベクトルの取り方に特徴があったりします。この辺は、また次回にでも説明します。



今日のエントリーで、「なるほど」「ふむふむ」「面白い」などと思ってくれた方で、一票を頂ける方は是非ともお願いします。↓
人気ブログランキングへ
posted by きらっち at 00:00| Comment(2) | TrackBack(0) | 科学

2010年02月08日

統計において不偏分散を(n-1)で割る理由

という事で、今日は統計で誰もが思う疑問を考えてみましょう。高校までの教科書には、平均と分散の求め方を↓のように習っていたと思います。
ave-var_formula.jpg
ところが、実際に統計学を駆使しようとすると「不偏分散を求めるには(n-1)で割る」という事になっています。もともと我々は、↑のように分散をnで割っていたわけで、「この差は一体どういう事なんだ?」と不思議に思う方が多いかと思います。

統計学の参考書等には、単なる一言で「分散は自由度が1低いから、(n-1)で割るのだ」と説明しているものも多いのですが、「そもそも何故にnではなく、自由度で割らなくてはいけないのか」という根源的な説明が書いてあるテキストを、俺は今まで読んだことがありません。
という事で、今日はその辺を実例と共に説明しようかと思います。


とりあえず、「TVの視聴率」を考えてみましょう。ある番組の視聴率を完璧に誤差無く調べようとすると、TVを保有している全世帯のモニタリングが必要になります。ところが、全世帯をモニタリングするとなるとコストや時間等々の制約が厳しくなるために、実際のところ一部世帯を抽出するしか手段がないわけです。この時、「実際の視聴率」と「抽出した世帯の視聴率」が大きくかけ離れては困りますよね。このように、全体から一部を取り出してくる場合、2者の間で同じような統計的性質が保存されているのが望ましいわけです。


そこで、例を変えて次の事を考えてみましょう。今、サイコロを30回振って出た目の「平均」と「分散」を計算します。サイコロは3つあるので、これらを10回ずつ振る事にしましょう。実際に、↓のようにサイコロの目が出たとします。この時、サイコロの目を30回振った時の平均は3.433、(nで割る)分散は2.246でした(図中の@とAの箇所)。
unbiased-variance.jpg
そして一方で、一回ずつそれぞれのサイコロを振った場合の平均と分散を考えてみます。↑の例の場合だと、1回目に3つのサイコロを振った平均は4.67、(nで割る)分散が0.22、(n-1で割る)分散が0.33ですね(図中のBの箇所)。これは言い変えると、全10セット(サイコロを30回振る)から、一部を抽出した1セットでの「平均」と「分散」を求めていることになります。
先ほど、「全体から一部を取り出してくる場合、2者の間で同じような統計的性質が保存されているのが望ましい」と書きましたが、まさに今回の場合も、全10セットの平均と分散が、各セットの平均と分散と同程度である事が望ましいわけです。何故ならば、もし各セットの平均と分散が同程度であれば、30回(10セット)もサイコロを振る必要が無く、コストも手間もかからないわけですよね。
という事で、各セット間の「平均の平均」「(nで割る)分散の平均」「(n-1で割る)分散の平均」を見てみましょう(図中のCの箇所)。
「あれ?」と思う方がたくさんいらっしゃるかと思いますが、サイコロを30回振った時のAと比較すると、Cでは平均こそ一致していますが、分散は全然違いますね。サイコロを30回振った時の分散は2.246ですが、各セット間の「(nで割る)分散の平均」はわずか1.422にすぎません。一方で、各セット間の「(n-1で割る)分散の平均」は2.133と、(n-1)で割る方がサイコロを30回振った時の分散値に近づく事がわかります。そう、この部分が(n-1)で割る方が良い本質的な理由です。

元々、分散については、「全標本で計算する分散値」よりも、「一部の標本のみで計算する分散値」の方が、低く出る性質があります。よって、「全体から一部を取り出してくる場合、2者の間で同じような統計的性質が保存されているのが望ましい」という性質(不偏性)をより確保するために、nではなく自由度にかこつけて(n-1)で割る方が良いという事なのです。
実際にどういう場合に使い分ければ良いのかというと、「母集団全てを把握している場合」は普通にnで割って、「母集団の一部から母集団の分散を推定したい場合」に(n-1)で割ればいいわけですよ。おそらく実際の使い方としては、「母集団を全てわかっている場合」なんてのは実社会ではほとんど無いでしょうから、(n-1)で割る場合の方がほとんどなんじゃないですかね?もっとも、nであろうが(n-1)であろうが、扱うサンプル数が多くなれば数値上あまり大きな違いが出てくるわけではありませんが、サンプル数の少ないときには注意が必要でしょうね。


という事で、統計については今まで何も書いてこなかったので、これからは「回帰分析」とか「主成分分析」について、折を見て書こうかなと思っております。この辺りの分野は、経済指標とかいろいろなデータを読み取る上での基本的なリテラシーになる上に、民間会社とかでもマーケッティング等々に使える重要なツールになるので、数学の中でも直接的に世の中の役に立つ分野なんじゃないかなぁ、と俺は思っています。



今日のエントリーで、「なるほど」「ふむふむ」「面白い」などと思ってくれた方で、一票を頂ける方は是非ともお願いします。↓
人気ブログランキングへ
posted by きらっち at 22:17| Comment(4) | TrackBack(0) | 科学

2010年01月01日

自然数の二乗和の公式を導出

皆様あけましておめでとうございます。今年もよろしくお願いします。


という事で、雪がひどくて車で帰省出来ないため、今回は実家に帰省せず友達と年越しでした。
さて、年越しそばを食べてから友達との話の中で「そういえば、自然数の二乗和の公式ってどうやって導出するんだっけ?」という話題になり、午前5時まで二人で二乗和の公式についていろいろ考えていました。(「新年早々に何やってるんだか」という話ですが……)

summation_formula.jpg
↑のように、高校数学では「1 + 2 + 3 + …… + n」という単純な一乗和の総和と、「1^2 + 2^2 + 3^2 + …… + n^2」という二乗和の総和の公式を習います。
summation_formula2.jpg
一乗和については、↑のやり方で公式はすぐに導出できるのですが、二乗和についてはまったく導出方法を覚えていなかったために、自分でいろいろと考えた結果、以下のやり方を思いつきました。まずは、具体的に「5」までの二乗和について考えてみると、
summation_formula3.jpg
↑のように、二乗和の式を書き換えたものを3倍することによって、上手い具合に全ての項が「11」になる事を利用して、答えをすぐに出せそうです。

summation_formula4.jpg
これを一般的に考えて、「n」までの二乗和の時も同様に式を書き換えて3倍すると、「2n+1」が「n(n+1)/2」項分だけ出てくるので、ここに1/3をかければ、二乗和の公式を導出できます。

ところが、先ほど二乗和の公式をネットで調べてたのですが、俺のやり方で二乗和の公式を説明しているサイトが見つからないので、「ひょっとして、このやり方はオリジナルの導出方法なんじゃないの?」と思ったので、今日のエントリーにしてみました。誰か詳しい人がいたら教えてください。



今日のエントリーで、「なるほど」「ふむふむ」「面白い」などと思ってくれた方で、一票を頂ける方は是非ともお願いします。↓
人気ブログランキングへ
posted by きらっち at 16:03| Comment(14) | TrackBack(0) | 科学

2009年12月27日

「相関係数」の意味と応用例

今日は、統計学等でよく使用される「相関係数」の計算方法と意味について説明した後で、実際にある統計を使って相関係数を使った応用例を示したいと思います。

相関係数とは、2つの事柄の類似性を数値化したものです。通常、相関係数とは1.0から-1.0の値を取り、1.0に近ければ正の相関が強い(2つの事柄が非常に似ている)、0に近ければ無相関(2つの事柄に関連性が無い)、-1.0に近ければ負の相関が強い(2つの事柄がまったく逆)という事になるのですが、文章だとよくわからないので以下の例で考えて見ましょう。

ある高校で、生徒5名(A,B,C,D,E)に対して国語、英語、数学のテストを行いました。以下は、A〜Eの点数から平均点を引いたもの(平均差点)である。
A(12,-8,7)
B(-20,26,-5)
C(8,10,12)
D(-4,-22,-17)
E(4,-6,3)
この5人の平均差点の分布を見る限り、

@AとEは、総得点こそ違うものの、点数の取り方が似ている。
→つまり、Aの平均差点とEの平均差点には正の相関がある。
AAとBは、総得点こそ違うものの、平均差点の負号が逆になっている。
→つまり、Aの平均差点とEの平均差点には負の相関がある。

と言えそうです。ちなみに↑の5人の平均差点は、一種の3次元ベクトルと見ることができるのだけど、この3次元ベクトルが「似ているか」「似ていないか」をどう数値化できるのでしょうか?実は、高校数学で習った三角関数のcos(コサイン)が、類似度を数値化する一つの尺度になり得るのです。

cos.jpg
↑がコサイン関数です。ここでは0°≦θ<360°の時を考えていますが、この図を見て「ピン」と来る人もいるかもしれませんね。そうです、コサイン関数は0°の時に最大値である1をとって、180°の時に最小値である-1を取ります。
すなわち、何か二つのベクトルのなす角度をθとすると、θが0°に近い(正の相関が非常に強い)ときにcosθが最大値1をとり、θが180°に近い(負の相関が非常に強い)ときにcosθが最小値-1をとり、θが90°や270°に近い(相関が非常に弱い)ときにcosθは0の値をとるために、この2つのベクトルの類似度をコサイン関数で数値化できるわけです。そして、冒頭に出てきた「相関係数」とは、実はまさにこのコサイン関数の事だったりします。


具体的に、上記のA〜Eの平均差点で考えてみましょう。ちなみに、2本のベクトルのなす角度のコサイン値を導出するには以下の計算式が必要になります。具体例として、Aの平均差点ベクトル(12,-8,7)とBの平均差点ベクトル(-20,26,-5)のコサイン値の計算も↓に出しておきましょう。
cos-equation.jpg


ここではとりあえず、Aの平均差点ベクトル(12,-8,7)を1本目ベクトルとします。そして、それぞれ5人の平均差点ベクトルを2本目のベクトルとして、これらの2本のベクトルのコサイン値を出すと以下のようになります。

AとAのコサイン値…1.00
AとBのコサイン値…-0.91
AとCのコサイン値…0.36
AとDのコサイン値…0.02
AとEのコサイン値…0.93

AとAのコサイン値が1.00なのは、同一ベクトルのなす角度が0°になる事から当然ですね。なお、コサイン値は「2本のベクトルの大きさ」に依存せず「2本のベクトルのなす角度(2本のベクトルの向いている方向)」のみに依存します。よって、仮に2本のベクトルが(1,2,3)と(2,4,6)だったとしても、この2本のベクトルは「大きさが違うだけ」で「なす角度が0°」である事から、コサイン値は1.00となるわけです。
そしてAとBのコサイン値が-0.91(負の相関が非常に強い)である事は、A(12,-8,7)、B(-20,26,-5)で二つのベクトルの向き(負号)がほぼ逆向きである事からもわかりますね。
次に、AとDのコサイン値が0.02(ほぼ無相関)なので、A(12,-8,7)、
D(-4,-22,-17)のなす角度が直交(90°か270°)である事がわかります。


cos-image.jpg
という事で、「コサイン値(相関係数)」と「2本のベクトルのなす角度」を整理すると、↑のようなイメージになります。とりあえず、2本のベクトルの類似度をコサイン値(相関係数)で数値化できる事を説明しました。
それでは、次に↓のニュースについて、このコサイン値(相関係数)を応用して数字上の突っ込んだ分析をしていみます。

【諸外国の人たちがどんな組織・制度に信頼を寄せているかをグラフ化してみる(上)……日本編】
http://www.garbagenews.net/archives/1107428.html

【諸外国の人たちがどんな組織・制度に信頼を寄せているかをグラフ化してみる(下)……諸外国編】
http://www.garbagenews.net/archives/1107433.html

↑のニュースは、いろいろな国の人たちが「裁判所」「新聞・雑誌」等々の15の組織/制度にどの程度信頼を寄せているかというアンケートを取った結果が掲載されています。これらの結果を切り出して、↓の表にまとめてみました。


each-country_di-value.jpg
そうです、↑の表はまさに各国の結果に対する15次元ベクトルとなっているので、ここに先ほどの相関係数を当てはめてみようという事です。さすがに、7カ国15次元ベクトルともなると、表を目で見ただけではわかりにくいので、こういう時に相関係数があると直感的に似ているか似ていないかが把握できるわけです。
という事で、まずは米国を1本目のベクトルとして、それぞれ7カ国のベクトルとの相関係数を出すと、以下のようになります。

米国・日本……0.28
米国・オーストラリア……0.90
米国・米国……1.00
米国・英国……0.88
米国・イタリア……0.89
米国・フランス……0.83
米国・中国……-0.22

ふむ、米国を基準にした場合、やはり欧州系の国とは相関係数が非常に高いので、彼らの価値観の近い事がわかります。一方、日本と中国の相関係数は低いので、欧米系の国とは価値観の違うことがわかります。
ここで注意しなければいけないのは、これはあくまで「米国」との相関係数であるので、この結果だけで「日本」と「中国」の相関係数が高いとは言えません。実際に、日本・中国の相関係数を計算すると、-0.02となるので、米国・中国以上に、日本・中国は無相関というわけです。(やはり、日本と中国は価値観を共有できないという事なのでしょうか?(笑))
このように、多次元ベクトルを扱いだすと

1.AとBの相関係数が低い
2.AとCの相関係数が低い
3.よって、BとCは相関係数が高いはずだ

というような推論が成り立たない事がわかります。


ここでは全ての組み合わせで相関係数を出しませんが、今の場合で全ての組み合わせの相関係数から、価値観の近いグループ分けをすると、

@オーストラリア、米国、英国、イタリア、フランス
A日本
B中国

と3つのグループに分けるのが自然でしょう。このように、相関係数は人間の頭では手に負えなくなる多次元ベクトルを整理するとき、非常に威力を発揮します。しかも、この作業は相関係数だけでグループ分けできるので、自動化処理が可能だったりします。


俺が高校生の当時、「ベクトル」や「三角関数」はそれぞれまったく別個の数学分野として習っていたので、まさか今日の例のように、「統計」で二つがつながるとは思いませんでした。ところが、実はこの手の「まさかこの分野とあの分野がこんなところでつながるとは」みたいな話は、大学の数学においては山ほどあったりします。
また機会があったら、具体例と共にそういう話を書こうかと思います。



今日のエントリーで、「なるほど」「ふむふむ」「面白い」などと思ってくれた方で、一票を頂ける方は是非ともお願いします。↓
人気ブログランキングへ
posted by きらっち at 00:25| Comment(14) | TrackBack(1) | 科学

2009年12月21日

生活に役立つ(?)「待ち行列理論」

たまには実際の生活に直接応用のできる数学の話をしたいと思って、今日は「待ち行列」の話をします。そもそも数学(情報工学)的な世界での「待ち行列理論」とは、確率を駆使して最適ネットワークを作るための基礎的理論の事ですが、ネットワークの話になるとかなり専門的になるので、ここでは「スーパーのレジ」という日常に密着した例で考えて見ます。

ex_queue.jpg
さて、↑のように二台のレジがあった場合、お客がどう並ぶかは@のように「2列に並ぶ場合」と、Aのように「1列に並ぶ場合」の2通り考えられます。今の例の場合、お客を効率的に処理するという事は「お客の平均待ち時間を最小化する」と言い換える事ができるでしょう。よって、@とAでお客の平均待ち時間がどのように変わるのかを計算してみます。
ちなみに先に正解を言っておくと、Aの方がお客の平均待ち時間は少なかったりします。



さて、まずは今から説明する事が成り立つための前提条件を3つ説明します。
@お客は時刻に依存せずに、完全にランダムにレジに並ぶものとする。
→「特売日の開店直後」や「閉店間際」は、通常時とは違ってお客がレジに殺到するわけですが、どの時刻においても客の到着の仕方はランダムであるという仮定です。
Aお客は他の客の動向に関係なくレジに来るものとする。
→実際は、レジに100人も並んでいれば、お客のうちの大半がレジに並ぶのを諦めてしまいますが、ここではそういう事は関係なくお客が一定の確率でレジに並ぶという仮定です。
B同時にお客が並ぶ事はない。
→複数のお客が同時に並ぼうとする時に、並ぶ順番でけんかしないという仮定です。つまり、「複数のお客は必ず時間差をともなって到着する」という事にします。

上記の@〜Bの条件が成立することが、これから説明する平均待ち時間を計算するための前提条件となります。(ちなみに数学的に言うと、お客の到着が「ポアソン分布」、お客の並びが「指数分布」に従うという事です。)

そして、平均待ち時間を出すためには
「λ:お客の平均到着率」(1分当たりに並ぶお客の数(人/分))
「μ:1台のレジでの平均サービス率」(1分当たりに処理できるお客の数(人/分))
この上記2つが必要です。

今の@のレジの例の場合は、λ=0.2でμ=1.0のわけですが、この時の「t:平均待ち時間」は
t=( λ / μ ) / ( 1 - λ / μ ) = 0.25分 (15.0秒)
となるわけです。ちなみに、λ/μは「単位時間当たりの、"サービスを受ける客の人数"に対する"到着する客の人数"の比(サービス利用率)」を表していて重要な指標になります。

一方でAの場合は、@の場合と比べると列が半減するので、お客の平均到着率が2倍になる事によりλ=0.4でμ=1.0、サービス利用率が( λ / μ ) ^ 2となります。よって、この場合の「平均待ち時間」は
t = ( λ / μ ) ^ 2 / ( 1 - ( λ / μ ) ^ 2 ) = 0.19分 (11.4秒)
となります。

これらの結果から
@での平均待ち時間=15.0秒
Aでの平均待ち時間=11.4秒
となるために、この例の場合は、複数のレジに対して1列に並ぶ方がお客の平均待ち時間は少ない事になります。(結局はλとμの値次第ではあるわけですが)


ちなみにこれ、待ち時間を少なくさせようと努力している銀行のATMなんかでは、実際に複数列で並ばせずに1列で並ばせようとしてますよね。銀行のATMだけではありませんが、こういったように1列で並ばせるのは、それなりに数学的背景があるわけですよ。という事で、今後も機会があればこの手の話をしていくつもりです。



今日のエントリーで、「なるほど」「ふむふむ」「面白い」などと思ってくれた方で、一票を頂ける方は是非ともお願いします。↓
人気ブログランキングへ
posted by きらっち at 01:41| Comment(1) | TrackBack(0) | 科学

2009年12月04日

RSA暗号とは@〜素数判定の処理〜

【郵便会社:顧客12万人分の情報紛失 近畿支社】
http://mainichi.jp/select/jiken/news/20091204k0000m040082000c.html

支社は「個人情報は暗号化されており、外部漏えいの可能性は低い」としている。
って事で、よくこういう釈明で使われる「可能性は低い」ってどういうことでしょうかね?(笑)

という事で、大抵この手の「暗号化」ってのは「RSA暗号」が使われているのだけど、今日はこの「RSA暗号」の話をします。
「RSA暗号」は現在、世の中で最も広く使われている暗号方式なんだ。ただ、厳密に言うと「RSA暗号」は、暗号を解く事は可能なのだけど、それが数十年とか数百年かかるために、本来俺達がイメージする「原理的に解けない暗号」とは少し異なるかもしれない。後日にこの「RSA暗号」の原理を説明しようと思うのだけど、これも非常に数学の知識が必要な話なので、とりあえず「RSA暗号を解くのに何故そんなに時間がかかるのか?」というポイントを今日は説明します。


とりあえず、例としてこんな問題を考えてみよう。
「12345678909876543210123456789098765432101」は素数か否か?
「そんなもん、スパコン使えばすぐに解けるんじゃない?」と思う方も多いでしょう。ところが、実はスパコンでさえ、この手の素数判定には相応の時間がかかるわけですよ。何故かと言うと、全ての素数を表す一般式が発見されていないので、素数かどうか判定しようとすると、「2で割り切れるか」「3で割り切れるか」「5で割り切れるか」……というように、与えられた数に対して、小さい素数から順々に割り切れるかどうかを、しらみつぶしで探すしかないわけですよ。そして、割り切れる素数が無ければ、その数は素数と認められるわけですが、上記の問題ではどれだけの素数があるかを考えるだけでも嫌になるような数ですねぇ……。

とりあえず、もう少し小さい数で考えて見ましょう。「91」が素数かどうかを考えてみます。

91pn_1st.jpg
まずは、↑のように91までの数で、2の倍数を消していきます。この結果、91は赤く塗りつぶされるわけではないので、2の倍数で無い事がわかります。

91pn_2nd.jpg
次に、↑のように2の次で消されていない数字は3なので、3の倍数を消していきます。この結果、91は3の倍数で無い事がわかります。

91pn_3rd.jpg
次に、↑のように3の次で消されていない数字は5なので、5の倍数を消していきます。この結果、91は5の倍数で無い事がわかります。

91pn_4th.jpg
次に、↑のように5の次で消されていない数字は7なので、7の倍数を消していきます。この結果、91は7の倍数で無い事がわかります。

91pn_5th.jpg
次に、↑のように7の次で消されていない数字は11なので、11の倍数を消していきます。この結果、91は11の倍数で無い事がわかります。(というか、すでに11の倍数で残っているのは11しかないので、非常に無生産な作業っぽいですが)

91pn_6th.jpg
次に、↑のように11の次で消されていない数字は13なので、13の倍数を消していきます。この結果、91が塗りつぶされる(13の倍数)事がわかるので、「91は素数ではない」事が判明しました。


という感じで、今は91という小さい数字で、しかも素数で無い事が判明する例なので大した作業量でもありません。ところが、大きな数字で素数だった場合は、この作業を全てのマスが塗りつぶされるまで延々と続けていくことになります。小さい数字の場合、コンピュータを使えば短時間でこの作業は終わるのですが、非常に大きい数になると計算量が指数的に増えるので、現実的な時間で解くことが難しくなるという事です。

RSA暗号は、素数判定における上記の性質(非常に大きな数字に対する素数判定(素因数分解)に時間が非常にかかる性質)を利用した暗号方式であるので、「現実的な時間では暗号を解けない」という事になります。


実際のRSA暗号の原理ですが、「公開鍵」と「秘密鍵」という二つの数字が暗号を解くために必要な数字になります。また、「フェルマーの最終定理」で有名なフェルマーが、このRSA暗号に深く関係してるのですが、RSA暗号の仕組みと背景にある数学原理は、次の回以降で説明することにしましょう。



今日のエントリーで、「なるほど」「ふむふむ」「面白い」などと思ってくれた方で、一票を頂ける方は是非ともお願いします。↓
人気ブログランキングへ
posted by きらっち at 00:00| Comment(307) | TrackBack(0) | 科学

2009年11月08日

ランダムウォークとその周辺@

数学の確率や統計の分野で「ランダムウォーク」と呼ばれる分野があります。このランダムウォークは、「賭け事のみならず、株価や為替相場に応用の可能性がある」という事で、経済関係の研究者でも研究対象になっているのだけど、今日を含めて2回か3回程度に分けて、このランダムウォークの基礎になるところを説明しようと思う。

さて、今日はまず1次元のランダムウォークと逆正弦法則について説明しよう。第一回目からで申し訳ないのだが、早速人間の直感がいかにいい加減かを思い知らされる事になるでしょう。


randam-walk0.jpg
とりあえず最初は「1次元ランダムウォークとは何か?」という事だけど、↑の画像のように数直線があって、まずは「0」の場所に自分がいるとしよう。ここで、サイコロ(ここでは細工の無い公平なサイコロを考える)を振って奇数が出たら+1(→)に動き、偶数が出たら-1(←)に動くとする。つまり、右か左かどちらに行くかはわからないけれど、ランダムに隣へ動き続けることになるわけだ。これが「ランダムウォーク」と呼ばれるもので、例えば右に行くことが「コイントスで表が出る」とか「株価が上がる」事で、左に行くことが「コイントスで裏が出る」とか「株価が下がる」とかに応用できるわけだ。

さて、まずはこのランダムウォークだけど、2回、3回、4回とサイコロを振った後の事を考えてみよう。それぞれのサイコロの目の出方とサイコロを振り終わった後の自分の位置を考えると、以下のようになる事が考えられる。

【2回サイコロを振る場合】
1.→ →(+2の場所に移動)
2.→ ←(0の場所に移動)
3.← →(0の場所に移動)
4.← ←(-2の場所に移動)

2回サイコロを振った後に
「+2」の場所にいる確率1/4
「0」の場所にいる確率2/4
「-2」の場所にいる確率1/4


【3回サイコロを振る場合】
1.→ → →(+3の場所に移動)
2.→ → ←(+1の場所に移動)
3.→ ← →(+1の場所に移動)
4.→ ← ←(-1の場所に移動)
5.← → →(+1の場所に移動)
6.← → ←(-1の場所に移動)
7.← ← →(-1の場所に移動)
8.← ← ←(-3の場所に移動)

3回サイコロを振った後に
「+3」の場所にいる確率1/8
「+1」の場所にいる確率3/8
「-1」の場所にいる確率3/8
「-3」の場所にいる確率1/8


【4回サイコロを振る場合】
1.→ → → →(+4の場所に移動)
2.→ → → ←(+3の場所に移動)
3.→ → ← →(+2の場所に移動)
4.→ → ← ←(0の場所に移動)
5.→ ← → →(+2の場所に移動)
6.→ ← → ←(0の場所に移動)
7.→ ← ← →(0の場所に移動)
8.→ ← ← ←(-2の場所に移動)
9.← → → →(+2の場所に移動)
A.← → → ←(0の場所に移動)
B.← → ← →(0の場所に移動)
C.← → ← ←(-2の場所に移動)
D.← ← → →(0の場所に移動)
E.← ← → ←(-2の場所に移動)
F.← ← ← →(-2の場所に移動)
G.← ← ← ←(-4の場所に移動)

4回サイコロを振った後に
「+4」の場所にいる確率1/16
「+3」の場所にいる確率1/16
「+2」の場所にいる確率3/16
「0」の場所にいる確率6/16
「-2」の場所にいる確率3/16
「-3」の場所にいる確率1/16
「-4」の場所にいる確率1/16

ここでは、2回〜4回までサイコロを振る事しか考えていないけれど、一般的にn回サイコロを振った後に「0」付近に移動する確率が大きそうな気がしますね。確かにその通りで、スタート地点が「0」でサイコロを振るたびにランダムに左右へ動くので、当然「0」近くにいる確率は高くなりそうな気はします。ただし、サイコロを振る回数が100回とか1000回くらいになると、↓のようにサイコロを振った後に「0」近くにいる確率は低くなって、確率分布がだんだん正規分布に従う事になります。(ちなみに、この事象はまさに二項分布そのものです。)
randam-walk1.jpg


さて、ここまでは高校の数学で習っているので、直感的に理解できる人も多いとは思いますが、次は「n回サイコロを振って、n回移動する中でそのうちどのくらいの確率で「0以上の場所にいるか」」を考えます。ちょっとわかりにくいので、具体例として4回サイコロを振ること(n=4)として、それぞれ1.〜G.でどのように移動するかを見てみましょう。

【4回サイコロを振る場合】
1.→ → → →(1 2 3 4)「0以上の場所にいる確率」は4/4
2.→ → → ←(1 2 3 2)「0以上の場所にいる確率」は4/4
3.→ → ← →(1 2 1 2)「0以上の場所にいる確率」は4/4
4.→ → ← ←(1 2 1 0)「0以上の場所にいる確率」は4/4
5.→ ← → →(1 0 1 2)「0以上の場所にいる確率」は4/4
6.→ ← → ←(1 0 1 0)「0以上の場所にいる確率」は4/4
7.→ ← ← →(1 0 -1 0)「0以上の場所にいる確率」は3/4
8.→ ← ← ←(1 0 -1 -2)「0以上の場所にいる確率」は2/4
9.← → → →(-1 0 1 2)「0以上の場所にいる確率」は3/4
A.← → → ←(-1 0 1 0)「0以上の場所にいる確率」は3/4
B.← → ← →(-1 0 -1 0)「0以上の場所にいる確率」は2/4
C.← → ← ←(-1 0 -1 -2)「0以上の場所にいる確率」は1/4
D.← ← → →(-1 -2 -1 0)「0以上の場所にいる確率」は1/4
E.← ← → ←(-1 -2 -1 -2)「0以上の場所にいる確率」は0/4
F.← ← ← →(-1 -2 -3 -2)「0以上の場所にいる確率」は0/4
G.← ← ← ←(-1 -2 -3 -4)「0以上の場所にいる確率」は0/4

「4回サイコロを振って16通りある出方で」
4回の移動後の位置が全て0以上になる確率6/16
4回の移動後の位置が3回で0以上になる確率3/16
2回が0以上になる確率2/16
1回が0以上になる確率2/16
0以上にならない確率3/16

いずれにしても、4回全てが0以上になる確率が6/16と高いわけです。今はn=4の時を考えましたが、nが大きくなるとこの傾向が顕著に出てきて、↓のような分布になります。
randam-walk2.jpg
つまりこれは、コイントスの賭けを何度もした場合、最終的にはどちらかが勝ち(負け)に偏る確率が大きい事を意味しています。これは非常に面白い現象で、要は「今は大きく負けているけど、そのうち取り返せるはず」というギャンブラー特有の心理が、確率計算によって物の見事に否定されている事になります。

「いやいや、1/2で勝負のつくゲームだと期待値はプラスにもマイナスにもならないのではないか?」とか、「さっきの正規分布と矛盾してるのではないか?」と思う人もいるでしょう。俺も、大学で最初にこれを習ったときにはそう思いましたが、当時の先生はこのように説明してくれました。
コイントスは表と裏の出る確率は共に1/2なので、期待値としては勝ち負けがイーブンになると君は思っているのだろう。しかしそれは、「ゲームを一回で終わらせた場合の平均値」という事で、多くの人が誤解している部分だ。確率論で言うところの「期待値が0」という意味は、無限回数のゲームを行えば「勝ち負けの差/ゲーム数」が0になるということに過ぎないわけだよ。勝ち負けの差もゲーム回数が増加するほど大きくはなるが、ゲーム回数に比べればその増加スピードは非常に小さいだけだ。

と、ばっさり切られた記憶があります。ちなみに、この事を確率用語で「逆正弦の法則」と言います。賭け事が好きな人は、覚えておいた方が良いのではないでしょうか。


さて、次回(来週くらいですかねぇ)は1次元ランダムウォークではなく、2次元と3次元ランダムウォークについて説明します。



今日のエントリーで、「なるほど」「ふむふむ」「面白い」などと思ってくれた方で、一票を頂ける方は是非ともお願いします。↓
人気ブログランキングへ
posted by きらっち at 02:10| Comment(4) | TrackBack(0) | 科学

2009年10月22日

オイラーの公式

今日は、表題の通り「オイラーの公式」を紹介します。この公式は理工系の大学生でないと習わないのだけど、もしこの公式が発見されていなかったら、様々な分野でいろいろな技術が実現できなかったでしょう。(身の回りにあるもので言うと、「携帯電話」「MP3プレーヤー」「JPEG圧縮方式」等々。スケールの大きな物となると、「ロケットの打ち上げ」「人工衛星の軌道制御」が挙げられるでしょうか。)

euler-formula.jpg
さて、そのオイラーの公式だけど、↑の通りです。「はぁ?!」と思った人は多いでしょう。そう、高校の数学でe(自然対数)、i(複素数)、sin/cos(三角関数)は習っているけれど、「e^(ix)(eのix乗)が全然イメージできないぞ!」という方がほとんどだと思います。
ちなみにこのオイラーの公式は、特に「x = π」の時がよく知られていて、この時「e^(iπ) = -1」となる。右辺をべき乗しているにもかかわらず、左辺に負の数が出現するため、ますますわけのわからない公式なんですよね。(笑)
今日は、このオイラーの等式をマクローリン展開を使って導出するところまでを説明します。


maclaurin.jpg
まずはマクローリン展開についてだけど、これは「ある連続な関数f(x)を、xの多項式で近似する」というものである。とりあえず、文章だけじゃよくわからないので、マクローリン展開の公式その物を出すと、↑の通り。式そのものの理解は非常に難しいのだが、マクローリン展開の直感的な意味は、
1.nが小さいと、x=0近辺は近似できるが、x=0から離れるにつれて近似精度が悪くなる。
2.nが大きくなるにつれて、x=0から離れている場所の近似精度が上がる。
3.n→∞の時に、マクローリン展開した右辺がf(x)と一致する
というところでしょうか。

maclaurin_exsample.jpg
ちなみに↑の画像は、例としてf(x)=cos(x)という関数を、n=2,6,10としてマクローリン展開した例です。nが大きい程、cos(x)と一致する事がよくわかるかと思います。


さて、それでは次にそれぞれ「e^(ix)」「isin(x)」「cos(x)」にマクローリン展開をかけてみましょう。実は、この3つに非常に面白い関係が導き出せるのですが、それを↓の画像に示します。
euler-formula_qed.jpg

そうなんです。「isin(x)」「cos(x)」をマクローリン展開した物の和が、「e^(ix)」をマクローリン展開した物と一致するわけですよ。(ここでは、「isin(x)」をマクローリン展開した項を青色、「cos(x)」をマクローリン展開した項を赤色にしているので、「e^(ix)」をマクローリン展開した項との対応が容易に理解できると思います。)
このオイラーの公式は、「指数関数」と「三角関数」が「複素数」を介して一本の公式でつながっているわけで、数学的には非常に重要な公式なのです。


さて、この「オイラーの公式」は、あまりに基礎的かつアカデミックな話なので、これ以上の説明はしないけど、この「オイラーの公式」から派生したもので、「フーリエ変換」という数学分野がある。「フーリエ変換」を使う応用例として、「音声/音楽/画像/映像処理」とか「通信処理」とか「ロボット制御」等があるんだけど、次回(来月くらい?)はこの「フーリエ変換」の基礎について説明しようと思います。



今日のエントリーで、「なるほど」「ふむふむ」「面白い」などと思ってくれた方で、一票を頂ける方は是非ともお願いします。↓
人気ブログランキングへ
posted by きらっち at 23:48| Comment(9) | TrackBack(1) | 科学

2009年10月07日

ポアンカレ予想とは?

【【第5回】難問奇問と天才奇人数学者 〜ポアンカレ予想の解決〜】
http://www.itmedia.co.jp/anchordesk/articles/0702/09/news029.html

数学の世界で「ミレニアム懸賞問題」というものがあるんだけど、これは数学上の7つの未解決問題(「P≠NP予想」「ホッジ予想」「ポアンカレ予想」「リーマン予想」「ヤン-ミルズ方程式と質量ギャップ問題」「ナビエ-ストークス方程式の解の存在と滑らかさ」「バーチ・スウィンナートン=ダイアー予想」)に、100万ドルの賞金がかけられているものなんだ。
んで、このうちの「ポアンカレ予想」が最近、ロシア人のペレルマン博士によって証明されたわけなんだけど、今日はこの「ポアンカレ予想」について解説する。

ちなみに、この「ポアンカレ予想」は「ミレニアム懸賞問題」の中でも、一般の人には非常にイメージしにくい「トポロジー」と呼ばれる分野の問題であり、インターネット上でポアンカレ予想を解説しているサイトもあるのだけど、大抵それらは非常に難解であって、しかも「ロープを持って宇宙一周したらどうのこうの」と、これまた余計にわからなくなるような例え話が書かれている。
という事で、今日のエントリーはこのポアンカレ予想の本質について手短に説明したい。


そもそも、ポアンカレ予想とは「単連結なn次元閉多様体は、n次元球面に同相である」という予想なんだ。
まずは言葉の定義についてだけど、「AとBが同相である」とは、「図形Aを、切ったり穴を開けたりくっつけたりせず、曲げたり伸ばしたり縮めたりするのみで、図形Bに変形できる」という事である。もう少し数学的に言うと「図形Aと図形Bに連続的な1対1写像が取れる」という事なんだ。

poincare_digest.jpg
おそらく、文章だけの説明だとイメージがわかないので、n=1,n=2の時の具体例を↑の図を使って説明しよう。

まずは、@のn=1の場合を見て欲しい。この時、「単連結な1次元閉多様体」とは、2次元平面状で「線分の両端をつなげてできた閉図形」で、「1次元球面」とは「円周」を意味している。これを見ればすぐわかるけど、「単連結な1次元閉多様体」は、切ったりくっつけたりせずに、ちょっと形を整えて拡大/縮小するだけで、「円周」とぴったり一致する。これが「同相である」という事で、n=1の時は自明で成り立つ事がわかると思う。

そして、次にはAのn=2の場合を見てみよう。この時、「単連結な2次元閉多様体」とは、「内部に穴の無い立体の表面」で、「2次元球面」とは「3次元球の表面」を意味している。↑の画像中では、立方体の表面を例として書いたのだけど、この表面も切ったり穴を開けたりくっつけたりせずに、6面をそれぞれ上手に変形させた上で拡大/縮小すれば、3次元球の表面とぴったり一致する事がわかると思う。ということで、n=2の時も確かに自明で成り立ちそうな気がしますね。
ちなみに余談ですが、同じく2次元閉多様体である「トーラス」(ドーナツ形の表面)は、「2次元球面」とは同相ではありません。「トーラス」は、この形のままいくら変形したところで、一箇所をちょん切らない限りは「2次元球面」へ変形できないからです。(一箇所ちょん切れば、円柱の形に変形でき、そこから「2次元球面」に変形できます)このように、「立方体」と「トーラス」では物体の持つ空間的な性質(トポロジー)の異なる事がわかります。何に起因してこの違いが出るのかは、本エントリーの最後の参考@で補足説明致しましょう。

さて、話は戻して、次はBのn=3の場合を考えて見ましょう。ちなみに、ペレルマン博士が証明したのは、このn=3の場合です。今までは、n=1の時に2次元空間、n=2の時で3次元空間を考えていたわけですが、n=3になると4次元空間を相手にしなければいけないので、これが非常に難しいわけですよ。実際、「単連結な3次元閉多様体」も「3次元球面」も絵に描けないわけで、あくまで自分の想像力で考えるしかないのですが、とにもかくにもペレルマン博士の証明したのは「単連結な3次元閉多様体は、3次元球面に同相である」という事です。(一応、本エントリーの最後の参考Aで4次元球に対する補足説明をします)
ところで、ポアンカレ予想の面白いところは、普通は次元数が上がれば上がるほど証明が困難になると思ってしまうのですが、実は、n=4以上の時はすでに先人が証明されていて、最後のn=3をペレルマン博士が証明したところですかね。

わかりやすく書こうとは思っていましたが、やっぱポアンカレ予想を一般の人にわかりやすく説明するのは無理ですね。すみません。(謝)とりあえずn=1とn=2の時だけでも、飲み会用の話ネタにもなれれば幸いです。(笑)



今日のエントリーで、「なるほど」「ふむふむ」「面白い」などと思ってくれた方で、一票を頂ける方は是非ともお願いします。↓
人気ブログランキングへ


【参考@ 何故、立方体とトーラスではトポロジーが異なるのか?】
実は立方体もトーラスも、どちらも一枚の紙から作ることができるのですが、くっつけ方が異なるのでトポロジーが異なるわけです。

cubic-torus_difference.jpg
↑に、それを図示しました。立方体は、最後の貼り付けが一度に行えるので、1ステップ(単連結)で貼り付けが完了しますが、トーラスはまず側面の辺を貼り付けた上で、円周部分の貼り付けをしなくてはいけないので、貼り付けに2ステップ(2連結)必要です。この貼り付けのステップ数の違いで、同じ2次元閉多様体でもトポロジーが異なるわけです。


【参考A 4次元球のイメージ】
4D-ball.jpg
とりあえず「4次元球」のイメージを↑に出しておきました。ここでは、2次元球(円)はy直線で切った時の断面(面ではなく線だが)、3次元球をZ平面で切った時の断面、4次元球をt空間で切った場合の断面を表しています。何となく、4次元球についてイメージできるでしょうか?
それぞれの切った断面は、(例えば3次元球の断面が2次元円になるように)もともとの空間から次元数が1だけ落ちるのですが、「4次元球の断面が3次元球になる」という事は、やはり通常の感覚では理解しがたいところですよねぇ……。
posted by きらっち at 23:18| Comment(3) | TrackBack(2) | 科学

2009年09月28日

血液型の遺伝学と特殊血液型

そういえば最近「科学」カテゴリーのエントリーを書いていなかったと思い、今日は急遽「血液型」について書こうと思った次第。

さて、血液型は2つの遺伝子によって以下の規則で決定される。
O×O→O型
A×O,A×A→A型
B×O,B×B→B型
A×B→AB型
この2つの遺伝子はそれぞれ両親から一つずつ受け取るので、例えばA×O(A型)とB×O(B型)の両親からは、O×O(O型)の子供が生まれる事もあり得るわけだ。この辺は、血液型の遺伝に関する基本的な基礎知識が無いと、生まれてきた子供の血液型で揉める事がありそうだよね。(笑)

そして輸血についてだけど、「A型→A型」というように同型の血液で輸血するのが基本ではあるのだけど、生物学的には「O型→A型,B型,AB型」「A型→AB型」「B型→AB型」への輸血も可能なんだよね。なので、O型血液は全ての血液型への輸血が可能であり、AB型は全ての血液型からの輸血が可能なんですよ。ただし、Rh因子が合わないといけないので、日本だと緊急時以外に型違いの輸血は行われないわけです。


さて、基礎知識はこれくらいにしておいて、今日は特殊な血液型「シスAB型」と「ボンベイ型」について説明しましょう。

まずは「シスAB型」だけど、通常のAB型はA×Bの組み合わせだったよね。ところが、極々まれに「シスAB因子」を持つ人がいるわけですよ。この「シスAB因子」を持つ人は、もう一つの因子が何であれAB型になってしまうわけです。つまり、「シスAB因子」による遺伝規則だと

(シスAB)×A→AB型
(シスAB)×B→AB型
(シスAB)×O→AB型

という事になり、通常のAB型とはまったく違う遺伝規則を持つわけです。ちなみに、この「シスAB因子」によるAB型は、日本だと全AB型のうちで1万人に1人くらいの割合でいるらしく、中でも四国地方に多いとどこかの医学書で読んだ記憶があります。
ちなみに「シスAB因子」を持つ人は因子が特別なだけであって、血液型としてはAB型であるので輸血に関しても通常のAB型と同様の扱いになります。


そして次は「ボンベイ型」ですが、これは非常に珍しい血液型です。ただ、ボンベイ型は、ABOの遺伝因子と違う遺伝因子で決定されるので説明が非常に難しいのです。つまり、ABO因子とは別に、Hh因子というものがあって、これも両親から一つずつ受け取るわけです。H×HやH×hであれば通常の血液型と見なせますが、h×hになるとボンベイ型となります。(ただ、ボンベイ型だとしてもABO因子が無いわけでないので、ボンベイ型のA型とかボンベイ型のO型というような血液型になります。)
ちなみに、あえて通常のA型とボンベイ型のA型の例を出すと以下の通りです。

H×H×A×O→通常のA型(AH型)
H×h×A×O→通常のA型(AH型)
h×h×A×O→ボンベイ型のA型(Ah型)

このように、通常のABO因子以外にHh因子まで関係するので、因子レベルと考えると非常にややこしいのですが、抗原レベルで考えると非常にわかりやすいので、こちらの方で説明しましょう。抗原レベルでの血液型の決定は、赤血球の表面にある抗原の有無で決まります。

blood-type.jpg
↑に、通常時とボンベイ型の場合の抗原による血液型の違いを図に示します。H×HやH×hの時(いわゆる通常の血液)では、全ての血液型においてH抗原がくっついています。ただし、A型の人はH抗原の下にA抗原、B型の人にはH抗原の下にB抗原、AB型の人にはH抗原の下にA抗原とB抗原がついています。
しかしながら、h×h(ボンベイ型)の血液にはH抗原が存在しません。通常の血液型検査では、H抗原にくっついているA抗原とB抗原の存在を調べていて、以下のように血液型を判断します。
H抗原の下にA抗原がある→A型
H抗原の下にB抗原がある→B型
H抗原の下にA抗原もB抗原がある→AB型
それ以外→O型
ところが、ボンベイ型の人にはそもそもH抗原が無いために、上記の部類では「それ以外」という事になり常にO型と判定されますが、実際はH抗原が無くてもA抗原やB抗原を持っている可能性があるわけで、ボンベイ型の人は詳細な検査が必要になります。

ちなみに、ボンベイ型の人から通常型への輸血は以下の通り可能になりますが、
「Oh型→AH型,BH型,ABH型」「Ah型→ABH型」「Bh型→ABH型」
通常型の人からボンベイ型の人への輸血はできない上に、ボンベイ型の人からボンベイ型の人への以下の輸血しかできません。
「Oh型→Ah型,Bh型,ABh型」「Ah型→ABh型」「Bh型→ABh型」

という事でボンベイ型の人は、輸血という意味では非常に過酷な運命を背負っています。ボンベイ型は、世界的にも100万人に1人くらいの割合でしかいないため、おそらく日本には数百人もいないでしょう。下手すると、数十人くらいしかいないのではないでしょうか?
特にOh型(ボンベイ型のO型)で生まれた人にとっては、Oh型(ボンベイ型のO型)からしか輸血ができないため、普段から血液を貯蔵しなければならないので、大変なんだろうなぁ……。



今日のエントリーで、「なるほど」「ふむふむ」「面白い」などと思ってくれた方で、一票を頂ける方は是非ともお願いします。↓
人気ブログランキングへ
posted by きらっち at 03:25| Comment(364) | TrackBack(1) | 科学

2009年09月10日

弱い力〜中性子のβ崩壊〜

【強い力〜ヘリウム原子の矛盾〜】
http://kiracchi-serendipity.sblo.jp/article/30819916.html

7月25日に、↑のエントリーでヘリウム原子を例に出して、原子核内の中性子と陽子を結びつける「強い力」の存在を説明しました。今日は、もう一つの根源的な力「弱い力」を説明します。


42helium.jpg
↑再びヘリウムの原子を例にしましょう。大抵の原子の原子核には、陽子と中性子が存在しますが、実はこの中性子は原子核内では安定的に存在できますが、単独で取り出すとおよそ15分くらいで中性子線と呼ばれる放射線を放出しながら、「陽子」と「電子」と「反ニュートリノ」とに分解してします。これを物理学の世界では「β崩壊」と呼んでいます。

中性子→陽子+電子+反ニュートリノ

これは裏を返すと、中性子は陽子と電子と反ニュートリノと中性子線から出来ているとも言えそうな気もしますね。なお、「反ニュートリノ」とはニュートリノの反粒子なのですが、ここでは「そういうものがある」と思っておいてください。(反粒子の説明は、また後日に詳しく書く予定です。)
さて、この中性子のβ崩壊ですが、そのメカニズムについて「重力」「電磁気力」「強い力」では以下の理由で説明できません。

【電磁気力でβ崩壊が説明できない理由】
中性子は電気的に中性なので「電磁気力」とは反応しない。

【強い力でβ崩壊が説明できない理由】
β崩壊は中性子単独の崩壊なので、複数の中性子や陽子間に働く「強い力」とは関係が無い。

【重力でβ崩壊が説明できない理由】
陽子と中性子はほぼ同じ質量を持っているのですが(質量のみでなくその他の性質もほぼ同じ。異なるのは電荷の有無くらい)、陽子は単独状態で安定である事から「重力」に起因するものでも無さそう。

という事で、β崩壊を引き起こさせる力を「弱い力」と位置づけたわけです。そして今の物理学では、この「重力」「電磁気力」「強い力」「弱い力」の4つが根源的な力として認められていて、現在観測される全ての物理現象は、この4つの力で説明できます。

ちなみに、今日のエントリーで出てきた「中性子」「陽子」「電子」「(反)ニュートリノ」の中で、昔から存在の知られていたのは「陽子」と「電子」です。この2つの粒子は、「電磁気力」と反応するために観測する事が容易ですし、1910年代にはボーアによってすでに原子モデルが確立されています。しかし、「中性子」「(反)ニュートリノ」については「電磁気力」に反応しないためその発見は遅れ、中性子は1930年代、ニュートリノは1950年代にようやく存在が初めて確認されています。


とりあえず、前回と今回のエントリーで「強い力」「弱い力」の存在について説明しましたが、次回は素粒子(クォーク)を説明します。素粒子がわかれば「強い力」「弱い力」の発生する原理を深く理解できるのですが、何せ素粒子レベルの話になると常識を覆される話がたくさん出てくるので、我々にとってはなかなかハードルが高い学問でもあるのですが、なるべく平易に説明できるように頑張ります。



今日のエントリーで、「なるほど」「ふむふむ」「面白い」などと思ってくれた方で、一票を頂ける方は是非ともお願いします。↓
人気ブログランキングへ
posted by きらっち at 22:57| Comment(0) | TrackBack(0) | 科学

2009年09月06日

究極のエネルギー「核融合」

【高エネルギー加速器研究機構 一般公開チラシ】
http://openhouse.kek.jp/2009/images/chirashi09.jpg

今日は高エネルギー加速器研究機構の一般公開日で、それに伴いノーベル物理学賞受賞の小林先生の講演が聞けるという事で、数日前に申し込みしたら、すでに応募人数が超過したためダメでした。あぁ、せっかくのチャンスだったのに。
という事で、とりあえず何かこの手の物理話を書きたかったので、今日は核融合発電について紹介しましょう。


さて、現在日本の発電容量の30%を占める原子力発電ですが、その原理はというと、「ウラン」や「プルトニウム」の原子に中性子をぶつけて、ウランやプルトニウム原子を複数の原子や粒子に分裂させた際に出てくる熱でタービンを回して発電しています。発電システム全体で見ると、二酸化炭素の排出量は少ないのですが、何せ放射性元素を使っているわけなので万が一メルトダウンでも起こったりすると、チェルノブイリ発電所の二の舞になってしまうので、厳重な運用が求められます。

という事で、なるべく放射性元素を使わないで大容量の電力を生成したいわけですが、核融合発電はそれを達成できる可能性があります。(とはいうものの、おそらく俺らが生きている間に実現は不可能と思いますが)ということで今日は、代表的な3つの核融合反応式を見て、それぞれのメリット・デメリットを見ていきましょう。


nuclear-fusion_ce.jpg
まず、↑に3つの核融合反応式を示します。核融合の場合は、「中性子」と「陽子」の数がポイントになりますので、通常の化学反応式ではなく「中性子」と「陽子」に絞った反応式で書いてみました。

@重水素と三重水素を使うパターン
重水素は海水から生成できるので、地球上でも豊富にある。ただし、三重水素は地球上ではわずかにしかない。原子力発電所の発電炉内で中間生成物としてできるリチウム6やリチウム7から三重水素ができるので、それを使うのが最も現実かもしれないけど現段階での工業生産技術は無いんだよね。
しかもこの@の反応は、原料の三重水素も反応後の中性子も放射能を帯びてるため、安全面ではあまりオススメの方法ではないかもしれない。(ウランやプルトニウム違って、中性子は半減期が数分と非常に短くはあるのだけど)ただし、AやBの反応に比べるとそこまで高温状態でなくとも核融合反応が持続するため、技術的には一番簡単に実現できそうではある。

A重水素を使うパターン
この反応は原料が重水素のみなので、「原料をどこから持ってくるか?」の問題についてはクリアできるし、重水素は放射能も帯びていないので安全だよね。反応後に出てくる三重水素や中性子は放射能を帯びていはいるのだけど、この反応式を使って@の原料である三重水素を生成できるという利点もあるよね。さらに、この反応式では「陽子」を単独で生成できる。つまり、電力を直接生成できるのも大きなメリット。@の反応では、結局のところ出てきた熱でタービンを回して発電するしかないので、「熱エネルギー」→「電気エネルギー」の変換でかなりのロスが出てくるわけだ。ところが、Aの反応で陽子を単独でつかまえれば、電気エネルギーを直接生成できる。

B重水素とヘリウム3を使うパターン
おそらく、これが目指すべき最終核融合発電の反応式になると思う。なぜならば、このBの反応式には、原料と生成物共に放射能を帯びたものがない。しかも、反応後には陽子が生成されるので、Aと同じように直接電気エネルギーを生成できる。ただし、このBの反応は@やAよりも高温度が必要であるので、「どうやって炉の溶けるのを防ぐか?」という問題が生じる。さらに、ヘリウム3は地球上には存在しない。従って、Aの反応で生成するしかないわけだ。あるいは、月の表面には豊富にヘリウム3が存在するので、ロケットを飛ばして月から取ってくるしかないわけですよ。


いずれにしても、どの方法も核融合反応を継続的に起こせるくらいの超高温(数千万度以上)に耐えうる箱を作らないといけないのだけど、どうやってこの箱を作るかが現在一番考えないといけないわけですよ。
実は、「原料をプラズマ状態にさせた上で特殊磁場をかけてバリアを張る」というSFみたいな話が実際に考えられていて、この辺も非常に面白いので(俺みたいな一般人にはよくわからない世界ではあるのだけど)、また機会があれば紹介したいと思います。



今日のエントリーで、「なるほど」「ふむふむ」「面白い」などと思ってくれた方で、一票を頂ける方は是非ともお願いします。↓
人気ブログランキングへ
posted by きらっち at 23:04| Comment(6) | TrackBack(2) | 科学

2009年08月13日

東海地震と今回の静岡沖の地震との違い

【クローズアップ2009:静岡で震度6弱 「東海の前兆」否定 プレートの内部で発生】
http://mainichi.jp/select/opinion/closeup/news/20090812ddm003040098000c.html

とりあえず今回の静岡沖の地震に対する気象庁の見解は「直近に東海地震を引き起こすものではない」と言っているだけで、この地震の中長期的な影響に関しては何も言及していない。

東海地震みたいなプレート型の地震については、いろいろと前兆現象があるとは言われているけど、今回みたいなプレート内部の断層型地震になると、マグニチュードの規模も小さくなるし一般的には「予測が非常に難しい」と言われているよね。それでも、中越地震M6.8の震源のすぐ近く直上では震度7を記録しているので、震源の浅い直下型地震は非常に怖い。


shizuoka-earthquake.jpg
さて、とりあえず今日は東海地震のメカニズムと、今回の静岡沖の地震のメカニズムの違いを説明しておこう。まずは、↑の画像を見て欲しい。
「東海地震のメカニズム」に関しては、わりと多くの人が知っているのではないだろうか?ユーラシアプレートとフィリピン海プレートがぶつかって、ユーラシアプレートの沈み込みが耐えられなくなり跳ね上がろうとするのが、東海地震とか南海地震みたいなプレート型地震のメカニズムになる。なお、跳ね上がったプレートによって津波が引き起こされるわけだ。
そして、図の赤枠の部分を横からではなく上から見たのが下の図であって、これが今回の横ズレの断層型地震のメカニズムをあらわっしている。ユーラシアプレートとフィリピン海プレートには、プレート境界があるのだけど、今回はこのプレート境界がずれたわけではなく、フィリピン海プレートの断層面が動いたらしい。断層とは言うなれば、「プレートで特別にやわらかい場所」というところでしょうか?同じプレートでも、固い場所とやわらかい場所があって、たまたまやわらかい部分が線上に存在しているものを断層というわけです。
ここで図のように、ユーラシアプレートをA、フィリピン海プレートで断層より西側をB、断層より右側をCとします。この時、プレート境界がぴったりくっついて動かないとすると(東海地震が起きないとすると)、AとBはプレート移動にしたがって東側に押されます。一方、Cは西へと押されるわけで断層面に圧力がかかり、この圧力に耐え切れなくなってBが北側、Cが南側にずれるわけです。これが今回の静岡沖地震のメカニズムになるわけです。
今回の「横型」というのは、東海地震のように上下方向に跳ね上がったり跳ね下がったりするものではなく、同一平面状にずれる事によります。(実際ある程度は、上下方向へのズレもあったとは思いますが。)


【平成21年(2009年)8月11日5時7分頃の駿河湾を震源とする地震に伴う地殻変動(速報) 水平変動ベクトル図(PDF)】
http://www.gsi.go.jp/common/000049449.pdf

そして、↑が国土地理院が発表したこの地震による地殻変動で、震源より西側部分が西に動いたことがわかります。つまり、ユーラシアプレートが西に押し戻されたわけで、果たしてプレート境界の歪みがどうなったのか非常に気になります。素人考えでは、歪みのたまる方向に地殻変動してしまったような気がするのですが……。



今日のエントリーで、「なるほど」「ふむふむ」「面白い」などと思ってくれた方で、一票を頂ける方は是非ともお願いします。↓
人気ブログランキングへ
posted by きらっち at 03:01| Comment(0) | TrackBack(0) | 科学

2009年08月07日

ゴールドバッハ予想

今日は、中学生でも問題そのものは理解できるけれど、未だに証明されていない「ゴールドバッハ予想」について紹介しよう。


このゴールドバッハ予想は、説明が非常に簡単。
「4以上の全ての偶数は2つの素数の和で表せる」
と、これだけの予想なのである。ちなみに「素数」とは、1と自分自身以外では割り切れない数の事。実際にゴールドバッハ予想について適当な偶数を考えてみると、

8=3+5
14=7+7
24=11+13

となり、確かに全ての偶数は素数の和で表せそうな気もするよね。ところがこんなに単純な予想なんだけど、250年以上もの間、数々の数学者がこの証明に挑んでいるにもかかわらず、未だに証明ができていない超難問なのである。

上記の例ように偶数の一部が2つの素数の和で表せる事は楽勝で見つけられるのだけど、そもそも整数中での素数(2,3,7,11,13,17……)の分布がよくわからない事によって、「全ての偶数」に対して包括的に考える手段の無い事が証明を難しくしてるんだよなぁ……。


以前は、「問題そのものは中学生でも理解できるけれども誰も証明できない」という類の代表的な問題として、フェルマーの最終定理
(nが3以上の整数の時に、X^n+Y^n=Z^nとなる自然数X,Y,Zは存在しないという定理。ちなみに、n=2の時は三平方の定理そのもの)
があったのだけど、1995年にアメリカのワイルズによって証明されてしまったため、次にアマチュアの数学愛好家を刺激するのは、このゴールドバッハ予想だと思われる。

これが証明できたら、世界の数学史に名を残せるので、ご興味のある方はチャレンジしてみてはいかがでしょうか?
(俺も何回か証明を試みましたが、当然全て挫折。ほんとこれ、どっから手を付けていいのかすら、まったく見当つかないんだよなぁ……)



今日のエントリーで、「なるほど」「ふむふむ」「面白い」などと思ってくれた方で、一票を頂ける方は是非ともお願いします。↓
人気ブログランキングへ
posted by きらっち at 07:16| Comment(5) | TrackBack(0) | 科学

2009年08月01日

情報理論 データ圧縮の基礎〜ハフマン符号とは?〜

【情報理論 誤り訂正符号とは?!】
http://kiracchi-serendipity.sblo.jp/article/29807541.html

前回は、↑のエントリーで誤り訂正符号の概念を書いた。これは、通信中に「0」「1」のデジタル信号にノイズが混じって、「0」「1」が反転してしまった場合にも正しく復元できるような事を目的とするものであった。


さて、今日は同じ符号関係の話なんだけど、誤り訂正符号の話ではなく「データ圧縮」の代表的な手法である「ハフマン符号」について述べる。今「ABADAACB」という文字列をデジタル化して通信する事を考えよう。すると、まずはA,B,C,Dにどのような「0」「1」を割り振るかをかんがえなければいけない。
通常、普通に考えると
A→00
B→01
C→10
D→11
と割り振るのが自然だと思うのだけど、この時は「ABADAACB」という文字列は「00 01 00 11 00 00 10 01」という16個の「0」「1」に置き換えられる。ただ、これをUSBメモリ等に記録しようとした場合やデジタル通信しようとする場合に、16個の「0」「1」で記録/通信するよりも、より少ない個数の「0」「1」で記録/通信する方が、コスト削減かつ記録や通信資源の有効利用ができるので、「0」「1」の量を少なくする事は、非常に意義がある。
よって、「同じ内容を、いかに少ない「0」「1」にデジタル化するか?」っていう研究が、「データ圧縮」って呼ばれる分野となっている。

ちなみに上記の例の「ABADAACB」の場合、本当に16個の「0」「1」も必要なのだろうか?「ひょっとしたら16個の「0」「1」よりも、もっと少ない個数でデジタル化できるんじゃない?」と思う人もいるかもしれない。まぁちょっくら、考えてみようか?とりあえず、以下のような規則でデジタル化しよう。
A→0
B→1
C→01
D→10
そうすると、「ABADAACB」って文字列は、「0 1 0 10 0 0 01 1」となって、10個の「0」「1」で表せるけれど、この「0」「1」の並びだと「CCAAACB」(01 01 0 0 0 01 1)とも解釈できるよね。この「0」「1」の割り当て方法だと、記録や通信内容が一意に戻せない事になるので、実際には全然実用にならない。


実は、これから説明するハフマン符号と呼ばれる手法は、上記とは違って「一意に戻せて、なおかつ「0」「1」の量を少なくする」とても良い「0」「1」割り当て方法なんですよ。
んで、その基本的なアプローチなんだけど、
1.出現確率の高い文字には、短い「0」「1」を割り振り
2.出現確率の低い文字には、長い「0」「1」を割り振る
という事で、全体の「0」「1」の個数を削減しようってことなんだな。

例えば以下の割り当て規則を考えてみよう。
A→0
B→10
C→110
D→111
この時「ABADAACB」は「0 10 0 111 0 0 110 10」と、14個の「0」「1」で表せて、最初の16個の例から2個の圧縮が可能になる。さらにこの割り当て規則であれば、上記の「0」「1」からきちんと一意に「ABADAACB」に戻せるのが確認できるだろう。


それじゃ、どうやってこの「0」「1」の割り当て規則を自動的に生成すればいいのか?とりあえず、さっきも書いたけど、それぞれの文字の「出現確率」に注目してみましょう。
「ABADAACB」で各アルファベットの出現確率は以下のようになる。
A:4/8、B:2/8、C:1/8、D:1/8。

huffman-coding.jpg
ここからは、↑の画像を使わないと説明が難しくなるのだが、ハフマン符号とは基本的に「一番小さい二つの確率を結びつける作業を繰り返す」という事に集約される。今の例の場合だと、C,Dの出現確率が一番小さいので、CD連合を作る。この場合の出現確率は、
A:4/8、B:2/8、CD:2/8となるわけだ。次に再び、一番小さい二つの確率を結びつけるわけで、A:4/8、BCD:4/8となり、最後にABCD:8/8となった時点で、結びつける作業は終了する。
この時、↑の画像みたいに結び付けを図に表したときに、各分岐に対する「0」「1」を決める事によって、A(0)、B(10)、C(110)、D(111)の符号割り当てが自動的に決まるわけだ。

今は、送るべき文字がABCDの4種類しかなかったのだけど、これが100種類とか200種類になっても、この方法は汎用的に使えるので、データ圧縮の世界では一種の金字塔的な手法になっている。
もっとも、今は元々送るべき「0」「1」の数が16個から14個になるだけなので圧縮効果としては大したことないかもしれないけど、もっと長い文字列を扱う場合、圧縮率はどんどん上がっていきます。

ちなみに、圧縮率限界に対しては「情報エントロピー」という確固たる指標があるのだけど、実はこの情報エントロピーの概念はデータ圧縮だけではなく、以前の↓エントリーにも書いた天気予報の話にも密接に関係してくる事になります。これまた数学的には非常に面白い話なのですが、またいつか時間のある時にでも詳細を書くことになるでしょう。

【天気予報 的中率だけで予報性能を判断していいのか?】
http://kiracchi-serendipity.sblo.jp/article/29287395.html




今日のエントリーで、「なるほど」「ふむふむ」「面白い」などと思ってくれた方で、一票を頂ける方は是非ともお願いします。↓
人気ブログランキングへ
posted by きらっち at 08:56| Comment(6) | TrackBack(0) | 科学

2009年07月25日

強い力〜ヘリウム原子の矛盾〜

今日はヘリウム原子に着目して、高校までの物理では説明できない「強い力」について解説をしよう。


42helium.jpg
↑が通常の(電子、陽子、中性子をそれぞれ2つ持つ)ヘリウム原子である。ヘリウム原子は希ガスに属するので、単原子のまま常温で安定な気体である。空気より軽く、水素と違って火をつけても爆発しないので、よく風船への注入気体として使われるよね。

さて、上記のヘリウムの原子モデルを見て欲しい。ヘリウムは、本当にこの姿で安定な状態を保てるのだろうか?


まず、電子について見てみよう。電子は、負電荷を持つ粒子なので、正電荷を持つ陽子とはお互い電気的引力※1が働く。ただし、電子は原子核を周回しているため、その遠心力と電気的引力がつりあっているので、安定的に原子核を周回していると考えられる※2。
※1:電荷を持つ物質間に働く力で、正電荷同士or負電荷同士なら斥力、正電荷と負電荷であれば引力が働く。電荷量が大きく、2電荷間の距離が短いほど大きな力が発生する。
※2:正確に書くと、電子は↑の画像のように平面的に原子核を周回しているわけでなく、立体的に周回している。
次に、中性子について見てみよう。中性子は電気的には中性の粒子なので、陽子や電子からは電気的な力を受けない。ただし、質量を持つ粒子間に働く万有引力※3のために、陽子と中性子の間には引力が働くわけだ※4。ただし、陽子と中性子の質量と距離を基に万有引力の大きさを計算すると、そこまで大きな引力が発生しているわけでも無さそうなので、果たして「安定的に中性子が原子核中に収まるのか?」と言われると疑問なのだが、とりあえず中性子には原子核よりも外に行こうとする力が働いているわけではないので、原子核内に留まることを認めざるを得ない。
※3:質量を持つ物質同士に働く引力で、質量が重く距離が短いほど大きな引力が発生する。
※4:電子と中性子間にも万有引力は働くのだけど、距離が遠すぎるのと、電子の質量が中性子や陽子に対して軽すぎるのでほぼ無視してよい。
最後に陽子を見てみよう。実は高校までの知識だと、原子核内に収まる陽子の安定性はまったく説明できない。何故なら、原子核内に陽子が2つ存在しているわけで、正電荷を持つ2つの粒子が極めて狭い空間に閉じ込められていることになる。よって、万有引力による引力の大きさ以上に、この2つの陽子は大きな電気的斥力が働くわけだ。さらに電子からも電気的引力を受けるわけで、2つの陽子は原子核を突き破って外に行かないとおかしいわけですよ。

という事で、陽子が原子核内で安定的に存在できるためには、万有引力と電気的引力(斥力)の他に、何かまったく種類の違う力で陽子と中性子を結びつけていないと、説明がつかないわけですよ。実はそれが「強い力」であるんだけど、「強い力」は万有引力や電磁気力とは違って、力の到達距離が非常に短く、原子レベルの小さい世界でしかあらわれないために、俺達の普段の生活ではまったく実感できないんだよね。

とりあえず今日は、この辺までにしておきますが、この「強い力」を探る上で非常に大事な「素粒子」の世界と、万有引力や電磁気力の力の発生メカニズム等々、これも不定期シリーズで書いていく事になるでしょう。


いやぁ、この手の研究を毎日やれる「高エネルギー加速器研究機構」とかの研究員は凄い羨ましいよなぁ……。




今日のエントリーで、「なるほど」「ふむふむ」「面白い」などと思ってくれた方で、一票を頂ける方は是非ともお願いします。↓
人気ブログランキングへ
posted by きらっち at 21:53| Comment(8) | TrackBack(0) | 科学

2009年07月15日

数理計画問題とその応用

情報科学や経済学の学問分野ではメジャーなんだけど、「数理計画問題」と呼ばれるものがある。この学問分野、一言でいうと「与えられた複数の条件式の下で、目的とする値を最大化(最小化)する」という事を探求するのだけど、これは現代の経済や企業経営において非常に役に立つ話なんですよ。
実際に大手の企業は、物流や人員配置等を数理計画問題として解いてコスト削減を実施しているらしい。

さて、今日はこの数理計画問題の中でも、わりと簡単な「線形計画問題(条件式の中に、二乗以上のべき乗変数を含まない)」について、例と共に説明していこう。



さて、まずはこの線形計画問題を説明する上での背景話として、俺の大学時代の貧乏話(半分フィクション)を出すとしよう。(笑)

当時俺は朝食を作るのがめんどくさくてしょうがなかった。ただ、昼食も夕食もろくな物を食べていなかったので、栄養失調が心配で何かしら朝食を食べる必要は感じていた。とりあえずシリアルと牛乳を買って来て、これを朝食にしようと思ったのだが、どれだけ食べれば朝食に必要な栄養素を摂取する事ができるかと思い、栄養士である友達に聞いたところ、たんぱく質を9グラム、ビタミンDを1/3RDA、カルシウムを1/4RDAを摂取する必要のある事がわかった。(ちなみに、RDAは1日の必要摂取量)そして実際に、牛乳とシリアルにどれだけその栄養素が含まれているのを調べてみると、以下の通りである事がわかった。

【牛乳(1/2カップ)】
値段:50円
タンパク質:3グラム
ビタミンD:1/15RDA
カルシウム:1/6RDA

【シリアル(1/4袋)】
値段:65円
タンパク質:2グラム
ビタミンD:2/15RDA
カルシウム:なし

ここで俺は「どうせなら一日の朝食に必要最低限の栄養素を摂取しつつ、朝食費用をできるだけ少なくしたいな」と考えたわけですよ。しかも、「牛乳を混ぜ過ぎてシリアルをびしょびしょにしたくない」「逆に、牛乳が少なすぎてぼそぼそのシリアルにしたくない」という多少わがままな条件まで付けることにしました。

さて、今までの話はつまるところ
○一日の朝食に必要最低限の栄養素を摂取する
○牛乳を混ぜ過ぎてシリアルをびしょびしょにしたくない
○牛乳が少なすぎぼそぼそのシリアルにしたくない
の三つの条件を満たしながら、朝食代を最も少なくするために、牛乳とシリアルをどの程度の割合で混ぜるべきか?という問題にまとめる事ができる。


ここで一旦、この問題を定式化してみよう。牛乳1/2カップとシリアル1/4袋をそれぞれ一単位として(x,y)とする。そして朝食一食分の費用をzとすると、以下のようにこの問題を定式化できる。
breakfast-model.jpg

今は変数がxとyしかないので、非常に簡単な問題なんだよね。なぜなら、xy平面に@〜Fの条件式を図示すると以下の領域になる。
linear-plan-probrem.jpg
今考えなければいけないのは、この領域内においてzを最小にする具体的な(x,y)の値を求めるわけだ。z=50x+65yであるので、この直線が上記の水色の領域に触れていて、さらにzが一番小さくなるところというと、↓の箇所になる時でしょうか。
linear-plan-probrem_answer.jpg
この結果より、7つの条件式を満たして朝食費用を最小化するx,yが算出できるわけです。

ちなみに、この問題の場合はわりと楽に答えが出るんだけど、変数の数が3個以上になると、図に書くのも面倒だし、人間の手で解くにはもうかなりしんどいわけですよ。さらに、4変数になると図に書けないので、おそらく人間には解けないわけだ。ただし、この手の線形計画問題に対しては変数の数がいくつになろうが、「シンプレックス法」というコンピュータで解ける万能な計算方法がある。このシンプレックス法を、初めてコストダウンに適用した企業が、米国のデルタ航空だったのだけど、航空機と乗務員のスケジューリングに関して変数の数が1700万、条件式は800本の線形計画問題を解いて年間1000万ドル以上のコスト削減が図られたんだよね。いやいや、やっぱ規模の大きいことになると、人間が適当に決めるよりも数式に従う方が無難って事だな。(笑)


シンプレックス法(1947年発案)については、かなり数学チックな話になるのでここでは説明しないけど、自動でこういう問題が普通のPCで解けるんだから、すごい世の中になったよなぁ……。(笑)



今日のエントリーで、「なるほど」「ふむふむ」「面白い」などと思ってくれた方で、一票を頂ける方は是非ともお願いします。↓
人気ブログランキングへ
posted by きらっち at 20:12| Comment(2) | TrackBack(0) | 科学

2009年07月02日

4色定理と7色定理

純粋数学にはまだまだ証明の出来ない未解決問題が多いのだが、もちろん数学の世界も日々前進していて、長年未解決だった問題がポツポツ解かれている。

そんな証明された問題の一つに、「4色定理」(あるいは4色問題)と呼ばれるものがある。これは、地図の塗りわけ問題として知られるもので、「二次元平面で隣接する異なる領域を塗り分けるには最低4色あれば良い」というものである。まぁ別に地図で無くてもいいのだけど、とにかく「どんな図形でも4色あれば塗り分け可能」ということなんですよ。

2dim_4-colors.jpg
適当な例として、↑の画像を作ってみたけど(ここでは境界線を目立つように書いたけど、本来は境界線は考えません)、これを3色で塗り分けられるかと言うと、それは不可能なわけで二次元平面状の塗りわけは最低4色は必要なわけです。

ところが、この塗りわけ問題は次元の異なる空間では性質が異なるため、3次元空間上の塗りわけは領域の取り方で無限色必要になる。その一方で、3次元球面の塗りわけは2次元平面と同じく4色で全てが事足りる。そして面白い事に、トーラス表面(ドーナツの表面)の塗り分けには最低7色必要になる。
torus_7-colors.jpg
↑が7色必要になる場合の実際のトーラス表面上の塗りわけなのだが、確かに何かの色を何かに置き換えてしまうと、全ての場合で同じ色が隣接してしまう事がわかるだろう。この事から、平面とトーラス表面では空間の性質が全く異なる事がわかる。


この問題が提唱されたのは1850年頃なんだけど、実はこれが100年以上も証明できないでいたんだな。4色定理の証明(1976年)は、数学の世界では史上初の「コンピュータを使った証明」であり、当時はいろいろと議論を巻き起こしたらしい。俺がこの話を聞いたのは、今から12年前の高校の数学の授業の時。その時は、4色定理なんてのは小学生でも理解できる話なので、「最近になってようやく証明されるほど難しい問題だったの?」と思ったのだけど、「当たり前」とか「経験則的には確かにそうだ」っていう事を証明するのはやはり難しいんだろうね。


しっかし、上記画像のトーラスの7色の塗り分け方を最初に考えた人は一体誰なんだろう?普通に考えたらこんな塗り方を思い付くのなんて、よっぽどの変態としか思えないんだが……。(笑)(おそらく思い付きでの発見じゃなくて、計算でこの塗り分け方を算出したのだろうけどね)




今日のエントリーで、「なるほど」「ふむふむ」「面白い」などと思ってくれた方で、一票を頂ける方は是非ともお願いします。↓
人気ブログランキングへ
posted by きらっち at 20:38| Comment(3) | TrackBack(0) | 科学