正方形内部の2点間の距離の平均についての論考
こんにちは。
最近やってる数学について面白いことがわかってきたのでまとめてみます。
まずは、次の問いを考えてみてください。
「1辺の長さが1の正方形の内部にランダムに2点を取ります。
この時、2点間の距離の平均はいくらになるでしょうか。」
問い自体はとてもシンプルですね。
ですが、答えはとても複雑になります。
実は、4重積分を解かないといけません笑。
解析的な答えは、(2+√2+5log(√2+1))/15になります。
小数に直すと、約0.52です。
計算方法が気になった方は、以下の記事を参考にしてみてください。
さて、本題はここからです。
2次元の場合が分かったら、次はd次元の場合が気になりますよね。
d次元の場合は、2d次元の重積分を解かなくてはならなそうです。(畳み込みを使えばd次元の積分に落とし込めそうです。)
2次元の場合ですらあれだけ複雑だったので、d次元の場合について解析的に解くことは、とても困難なように見えます。
では、平均を考えることは無理なのでしょうか。
いいえ、できます。
実は、dが大きくなるにつれて、距離の平均は、√(d/6)に収束することが知られています。
例えば、100万次元の場合は、√(1000000/6)≒408です。
このように、解析的な正確な値を求めることこそ難しいですが、それに近い値を知ることができるのです。
なぜ、√(d/6)に収束するのでしょうか。
答えは、この収束値は√(2d∫_[0,1] x^2(1-x))を解くことで得られます。
ここで、xは2点間のある座標の差の二乗,1-xは確率密度関数に相当します。
√はユークリッド距離を考えるときに登場する√、2∫_[0,1]は∫_[-1,1]に由来します。
本来は2d次元の重積分を解かないといけないのを畳み込みによりd次元に、また、ユークリッド距離の式の形から1次元の分布のd個の標本和として考えること(大数の法則)で1次元の積分に落とし込んでいます。極限を知りたいだけなので、√はいったん外に出しています。(厳密な議論は省きます)
*気が向いた人が読む詳しい説明*
2点をx,yとすると、
距離の平均 = ∫(ユークリッド距離)*p(x)p(y)dxdyで求められる。
(E(x)=∫xf(x)を思い出す。)
x=(x_1,x_2,,,,,,x_d),y=(y_1,…..y_d)
p(x),p(y)は確率密度関数
dが大きくなると、距離の二乗の平均は、ある値cに近づいていく。
この時、我々が求めたい距離の平均はその平方根√cに近づいていく。
よって、距離の平均=√∫(ユークリッド距離の二乗)*p(x)p(y)dxdy
x_i-y_iの積分に置き換えて考えることで次元を半分に考えることができる。
畳み込みの計算の仕方はブログでリンク貼った記事にもある。
x_i-y_i=xとして積分の表記を変更すると
√∫(Σx^2)p(x)dx
dが十分大きい時、Σx^2は、i軸の距離の差の二乗のd個の標本和として考えることができる。
よって、Σx^2 = d*(i軸の距離の二乗x^2の標本平均)
このようにi軸の、一次元の距離の二乗の平均を考える。
xが-1から1の範囲を動くが、0から1の範囲を動いたものを考え、その値を2倍すれば一次元の距離の二乗平均は求められる。
また、畳み込みをした結果確率密度関数は、x>0のとき1-x
(ブログ内にあるリンクの記事参照)
よって、距離の平均=√(2d*∫_[0,1]x^2(1-x)dx)
あとは、∫_[0,1]x^2(1-x)=1/12なので距離の平均=√(d/6)が得られる。
さて、d次元の場合の2点間の距離の近似値(収束値)について分かったので、今度は2点間の距離以外の量について考えたいですよね。
3点をランダムにとってできる三角形の面積の平均なんてどうでしょうか。
2点間の距離よりも複雑なので、2次元の場合ですら、解析的に解くことは難しいですね。(計算できた人がいたら教えてください!)
では、近似値(収束値)について考えてみましょう。
2点間の距離のように、1次元の積分に落とし込んで解析的に考える方法がわからなかったので、まずは数値計算に頼ってみました。
各次元において面積の平均を数値計算し、プロットします。
(注:x=0が2次元の場合です。x=1が3次元,x=2が4次元という感じ。表示の調整サボってごめんなさい。0,1次元の場合は三角形が作れないので2次元がstartです。)
するとあら不思議、直線に見えます。
線形回帰してみましょう。
線形回帰すると、大体y=0.721x+0.08という結果が得られました。(傾き、切片はもっとたくさんの桁ありますが上位の桁だけ取り出しています。)
この直線をさっきのプロットに重ね合わせるとこのようになります。
めちゃくちゃピッタリですね。このy=0.721x+0.08という回帰結果から、なんと、d次元の場合においては、0.721dに近似できることが言えそうです。
低次元の場合に線形だったからと言って、高次元の場合でも線形かはわからないので、より大きい10000次元、100000次元における数値計算を実行してましたが、それぞれ約721,7217になったので、より確信して、dが大きくなると0.721dに収束することが言えそうです!(100万次元の場合は僕のコンピュータが悲鳴をあげた)
なぜこうなるのでしょうか。
ここで、一辺の長さが√(d/6)の正三角形の面積を計算してみましょう。
すると、√3d/24になります。
√3/24≒0.721...
あ....
厳密な証明はわからないですが、そういうことみたいですね。
最後に、d次元超立方体内部に、n点をランダムにとった時の、n-1単体の体積について考えてみましょう。
まずは、d次元超立方体内部に、4点をランダムにとった時の、3-単体、つまり四面体の体積の平均。
三角形の面積の場合に、一辺の長さが√(d/6)の正三角形の面積に収束することがわかったので、同じように、一辺の長さが√(d/6)の正四面体の体積に収束しそうです。
この要領でいくと、d次元超立方体内部に、n点をランダムにとった時の、n-1単体の体積は、d^((n-1)/2)に比例することが言えそうです。
n=4の場合は、数値計算してその予想の妥当性が確かめられそうなので、(d^1.5の関数に回帰できるかどうか)気が向いたらやってみようと思います。
最後まで読んでくださりありがとうございました。
わからないことも多いですが、結構面白い性質が隠れてそうで、興味深かったのではないと思います。
タコピーの原罪に隠された問題 道徳を知らない子供たち
はじめに
「タコピーの原罪」は、「対話をすることの難しさ」や「助けるとはどういうことか」を描いた作品だ。その裏で、一つ重要な問題が隠されているような気がして、この記事を執筆するにいたった。
みんなタコピーに冷たくないか?
これが、私がこの作品を読んでいるときに常々感じていたことである。
しずか、まりな、直樹・・・登場人物は皆タコピーに対して冷たい、それどころかとても酷い扱いをしているように思われる。
例えば、しずかは、タコピーが役に立たないと分かると、冷たい目で見たり、足で踏んだりしている。
一方まりなは、タコピーのことを初対面のときにごみくそと呼んだ。
また、直樹は、落ち着いてとなだめるタコピーに対して、「黙ってろよ」と一蹴したり、「お前は能天気で馬鹿でごみ」と評している。
いったいなぜ、皆タコピーに対してこのような態度を取るのだろう。単にタコピーという生物が気持ち悪いから、という可能性もなくはないが、実はこのような違和感は作品の他の部分でも見られる。
横行するいじめ
物語の序盤では、まりなのしずかに対するいじめが横行する。
しかし、このいじめ、あまりにも横行しすぎている。机の落書きでも十分酷いが、暴力に器物損壊など、度を超えたものが度々出てくる。現実世界なら、先生などの大人が流石に気がついて止めるところだろうに、実際は不思議がるだけでいじめに気がついてないない。私は幸いにもこのようないじめを経験したことがないこともあって、率直な感想として、「こんなことってある!?」と思ってしまった。
このあまりに出来すぎたいじめに対し、同じように違和感を持った人は私以外にもいたようで、例えば小山という批評家?は「虐待描写にリアリティがない」と批判している。もっともこの批判は、この作品が別に虐待描写のリアリティに重きをおいたものでないうえに、これによって作品の自然さが損なわれているわけではない以上、ただの的外れでしかないのだが・・・
(参考)
道徳心のない子供たち
こうした露骨すぎるいじめの他にも、違和感を覚える場面はあるだろう。
そこで、こうしたいじめも含め、違和感のある場面を人物ごとにみてみると、
しずか:
まりなを殺したタコピにーに対して、「殺してくれてありがとう」
自分に協力してくれた東くんに対して身代わりで自首をするよう要求する
自分の言うこと聞かないタコピーに冷たい視線を向けたり蹴る
まりな:
しずかに対する容赦のないいじめ
初対面のタコピーにごみくそ呼ばわり
直樹:
タコピーに対して暴言
まりなのとりまき:
下敷きを割ることに罪悪感を覚えていない
といった風にまとめられる。
こうした違和感をまとめてみると、「タコピーの原罪」に登場する子供たちは、一般的な道徳が身についていない、ということが判明する。
育った境遇が道徳を教えていない
なぜ、このようなことが起きてしまっているのだろうか。
これは、ひとえに育った環境が影響していると考えられる。
例えば、しずかは母子家庭で育っている。しかも、母親は水商売で男とよく一緒にいる。また、まりなの家庭に関しても、父親は不倫をし、母親も荒れてまりなに対して暴力を振るう。
このような環境で果たして道徳が身に付くだろうか。
お腹がすいた人にパンを分け与えるくらいはしてあげれるかもしれない。
ただ、人を殺すこと、いじめをすること、暴力を振るうことがよくないことだという理解がない。それを教わっていないから。だからこそ平気で残虐なことができてしまう。
事件が警察沙汰になって騒ぎになってる時に、しずかが平然と「何言ってんの。今日から夏休みだよ」と言ってのけたのも、タコピーが、まりながタコピーに暴力振るうのを「お母さんのまねっこ」と表現したのも、まさにそのことを象徴しているのではないだろうか。
誰かが道徳を教え、子供たちをよく見て助けてあげないといけない
そもそも、道徳とは自然に身に付くものではない。誰かが教えなければ、善も悪も分かるはずがない。しずかやまりなにはそれを教えてあげられる人がいなかった。そして、親がその役割を果たさないときに、先生など周りの大人が、子供たちをよく観察して助けてあげられなかった。だからこそ、あれだけ酷いいじめが横行してしまった。よく、小学校や中学校でいじめによる自殺等が取り上げられているが、そういう孤独な子供たちを、先生など周りの大人がよく見てあげられていないということに対する批判も、この作品には込められているのではないだろうか。
タコピーの名前の由来を考察する
はじめに
「わ わかんないっぴ」というセリフで知られるタコピーだが、実はタコピーという名前は本名ではなく、本名を、「んうえいぬkf」という。
一見するとめちゃくちゃに思われる名前だが、どうしてこのような名前になったのかについて、公式では説明がない。
そこで、本記事では、この「んうえいぬkf」という名前の由来について考察する。
ネットの考察
まずは、ネットで公開されている考察を見てみよう。
例えばこの記事では、タコピーの本名である「んうえいぬkf」は、「takotaql」という文字列がいじられてできあがったものではないかと考察されている。
タコピーは2022年から2016年へと、6年前の過去にタイムスリップした。その6という数字にちなんで、「takotaql」のそれぞれのアルファベットを、前に6つ分ずつずらすと、「nueinukf」という文字列が出来上がる。この「nueinukf」という文字列を、可能な限り平仮名に直したものが「んうえいぬkf」ではないかという考察だ。
このいじる前の文字列「takotaql」が、タコピーの「tako=たこ」を含んでおり、それっぽいというのがこの考察の根拠である。タコピーがタコであることにちなんで「takota」、また「Quantum Leap(タイムマシーンにお願い)」というアメリカのタイムトラベルもののSFがあるらしく、それにちなんで「ql」、「takotaql」は「たこた、タイムマシーンにお願い!」という意味になる。
なるほど、ある程度は筋が通っているように思われる。
私の考察
しかし、いうまでもなく、上の考察には不自然なところがある。
「たこ」ならともかく、「たこた」は意味不明である。
この考察が出た当時は、まだ連載の途中で、「たこた」はまりなちゃんがタコピーにつけた名前であり、まりなちゃんがタコピーに過去に戻ることをお願いしたのではないかという可能性が考えられていた。
しかし、まりなちゃんはタコピーのことを「ごみくそ」と呼んでいたため、この可能性は否定されてしまい、とうとう「たこた」は意味の分からない単語となってしまった。
そこで、私の考えはこうである。
「んうえいぬkf」が、「takotaql」をアルファベット6文字分ずらしてできた文字列であるというところまでは正しい。
ただし、「takota」+「ql」ではなく、「tako」+「taql」である。
まず、「takotaql」を声に出してよんだとき、私は「たこたくる」と読んだ。
「たこたくる」の「たこ」は「蛸」として、「たくる」とは何だろう。
私は、「テンタクル」を連想した。テンタクルとは、触手という意味である。触手は、タコと関連が深い。タコのキャラクターにつける名前に用いるのは、とても自然である。「たこ」+「テンタクル」で「たこたくる」だろう。
ただし、テンタクルの綴りは、「tentacle」である。元々は、「cle」をそのまま用いても良かったのだろうが、先ほど言ったように「Quantum Leap」という作品があるので、それをまぜて「cle」を「ql」にいじくったのだと考えられる。また、「kf」だとひらがな一文字分のスペースに収まるが、「cle」を6文字ずらした「wfy」だと、上手くスペースに収まらないので、「ql」の方が都合が良かったという面もあるかもしれない。