カテゴリー「数学」の38件の記事

三角関数の幾つかの2次無理式の積分

記事になるネタがないので、最近行った、幾つかの三角関数の無理式の積分計算をそのままアップする。

初めに、記号を決めておこう。

\begin{align*}
&0<k<1, 0<k^{\prime}<1, k^{2}+k^{\prime{2}}=1, 0\leq \varphi \leq \frac{\pi}{2}\\
&u(x) := k\sin(x), v(x) :=k\cos(x)\\
&\Delta(x,k) := \sqrt{1-k^{2}\sin^{2}x} = \sqrt{1-(u(x))^{2}} = \sqrt{k^{\prime2}+(v(x))^{2}}\\
&E(\varphi,k) := \int_{0}^{\varphi}\Delta({\theta},k)d\theta, \quad F(\varphi,k) := \int_{0}^{\varphi}\frac{d\theta}{\Delta({\theta},k)}\\
&I_{\mathrm s}^{n} := \int_{0}^{\varphi}\Delta({\theta},k)\sin^{n}(\theta)d\theta, \quad I_{\mathrm c}^{n} := \int_{0}^{\varphi}\Delta({\theta},k)\cos^{n}(\theta)d\theta\\
&J_{\mathrm s}^{n} := \int_{0}^{\varphi}\frac{\sin^{n}(\theta)}{\Delta({\theta},k)}d\theta, \quad J_{\mathrm c}^{n} := \int_{0}^{\varphi}\frac{\cos^{n}(\theta)}{\Delta({\theta},k)}d\theta\\
%&I_{\mathrm s}^{2} := \int_{0}^{\varphi}\Delta({\theta},k)\sin^{2}(\theta)d\theta, \quad I_{\mathrm c}^{2} := \int_{0}^{\varphi}\Delta({\theta},k)\cos^{2}(\theta)d\theta\\
\end{align*}

ここで、F(\varphi,k)E(\varphi,k) とが、それぞれ Legendre の第1種楕円積分と第2種楕円積分であるのは周知のとおり。そして、自明ながら、次の式が成り立っていることを注意しておく。

I_{\mathrm s}^{0} = I_{\mathrm c}^{0} = E(\varphi,k), \qquad J_{\mathrm s}^{0} = J_{\mathrm c}^{0} = F(\varphi,k)

I_{\mathrm s}^{2} + I_{\mathrm c}^{2} = E(\varphi,k), \qquad  J_{\mathrm s}^{2} + J_{\mathrm c}^{2} = F(\varphi,k)

以下では、I_{\mathrm s}^{n}, I_{\mathrm c}^{n}, J_{\mathrm s}^{n} 及び J_{\mathrm c}^{n} について、n=1,2 の場合の計算を行う。

下記の計算で用いる主な関係式は,次の通りの簡単なものだ。

\begin{align*}
 &\sin^{2}\theta = \frac{1 - (\Delta(\theta.k))^{2}}{k^2}\\
 &\cos^{2}\theta = 1 - \frac{1 - (\Delta(\theta.k))^{2}}{k^{2}} = \frac{-k^{\prime2} + (\Delta(\theta.k))^{2}}{k^{2}}\\
 &\odiff{\Delta}{\theta}(\theta,k) = -\frac{k^{2}\sin(\theta)\cos(\theta)}{\Delta(\theta,k)} = -\frac{u(\theta)v(\theta)}{\Delta(\theta,k)}\\
 &\odiff{u}{\theta}(\theta) = v(\theta), \quad \frac{du}{k} = \cos(\theta)d\theta\\
 &\odiff{v}{\theta}(\theta) = -u(\theta), \quad \frac{dv}{k} = -\sin(\theta)d\theta
\end{align*}

では、順次計算していこう。


\begin{align*}
 J^{1}_{\mathrm c} &= \int_{0}^{\varphi}\frac{\cos(\theta)}{\Delta(\theta,k)}d\theta\\
&= \int_{0}^{\varphi}\frac{\cos(\theta)}{\sqrt{1-(u(\theta))^{2}}}d\theta\\
&= \inverse{k}\int_{0}^{k\sin(\varphi)}\frac{du}{\sqrt{1-u^2}}\\
&= \inverse{k}\arcsin(k\sin(\varphi))\\
\end{align*}


\begin{align*}
 J^{1}_{\mathrm s} &= \int_{0}^{\varphi}\frac{\sin(\theta)}{\Delta(\theta,k)}d\theta\\
&= \int_{0}^{\varphi}\frac{\sin(\theta)}{\sqrt{k^{\prime2}+(v(\theta))^{2}}}d\theta\\
&= -\inverse{k}\int_{k}^{k\cos(\varphi)}\frac{v}{\sqrt{k^{\prime2}+v^{2}}}dv\\
&= -\inverse{k}\left[\ln(v+\sqrt{k^{\prime2}+v^{2}})\right]_{k}^{k\cos(\varphi)}\\
&= \inverse{k}\ln\left(\frac{k+\sqrt{k^{\prime2}+k^{2}}}{k\cos(\varphi)+\sqrt{k^{\prime2}+k^{2}\cos^{2}(\varphi)}}\right)\\
%&= \inverse{k}\ln\left(\frac{k+\sqrt{k^{\prime2}+k^{2}}}{k\cos(\varphi)+\sqrt{k^{\prime2}+k^{2}\cos^{2}(\varphi)}}\right)\\
&= \inverse{k}\ln\left(\frac{k+1}{k\cos(\varphi)+\sqrt{1-k^{2}\sin^{2}(\varphi)}}\right)\\
&= \inverse{k}\ln\left(\frac{(k+1)\left(k\cos(\varphi)-\sqrt{1-k^{2}\sin^{2}(\varphi)}\right)}{k^{2}\cos^{2}(\varphi)-(1-k^{2}\sin^{2}(\varphi))}\right)\\
&= \inverse{k}\ln\left(\frac{(k+1)\left(k\cos(\varphi)-\Delta(\varphi,k)\right)}{k^{2}-1}\right)\\
&= \inverse{k}\ln\left(\frac{\Delta(\varphi,k)-k\cos(\varphi)}{1-k}\right)\\
\end{align*}


\begin{align*}
 I^{1}_{\mathrm c} &= \int_{0}^{\varphi}\Delta(\theta,k)\cos(\theta)d\theta\\
&= \inverse{k}\int_{0}^{k\sin(\varphi)}\sqrt{1-u^{2}}du\\
&= \inverse{k}\left[\inverse{2}\left(u\sqrt{1-u^{2}}+\arcsin(u)\right)\right]_{0}^{k\sin(\varphi)}\\
&= \inverse{2k}\left(k\sin(\varphi)\sqrt{1-k^{2}\sin^{2}(\varphi)} + \arcsin(k\sin(\varphi))\right)\\
&= \frac{\sin(\varphi)\Delta(\varphi,k)}{2} + \inverse{2k}\arcsin(k\sin(\varphi))
\end{align*}


\begin{align*}
 I^{1}_{\mathrm s} &= \int_{0}^{\varphi}\Delta(\theta,k)\sin(\theta)d\theta\\
&= -\inverse{k}\int_{k}^{k\cos(\varphi)}\sqrt{k^{\prime2}+v^{2}}dv\\
&= -\inverse{k}\left\{\inverse{2}\left[v\sqrt{k^{\prime2}+v^{2}} + k^{\prime2}\ln(v+\sqrt{k^{\prime2}+v^{2}})\right]_{k}^{k\cos(\varphi)}\right\}\\
&= -\inverse{2k}\left\{k\cos(\varphi)\sqrt{k^{\prime2}+k^{2}\cos^{2}(\varphi)} - k\sqrt{k^{\prime2}+k^{2}}\right\}\\
&\qquad\qquad\qquad - \frac{k^{\prime2}}{2k}\ln\left\{\frac{k\cos(\varphi) + \sqrt{k^{\prime2}+k^{2}\cos^{2}(\varphi)}}{k+\sqrt{k^{\prime2}+k^{2}}}\right\}\\
&= -\inverse{2}\cos(\varphi)\Delta(\varphi,k) + \inverse{2} - \frac{1-k^{2}}{2k}\ln\left\{\frac{k\cos(\varphi)+\Delta(\varphi,k)}{k+1}\right\}
\end{align*}


\begin{align*}
 J^{2}_{\mathrm s} &= \int_{0}^{\varphi}\frac{\sin^{2}(\theta)}{\Delta(\theta,k)}d\theta\\
&= \int_{0}^{\varphi}\inverse{\Delta(\theta,k)}\left\{\inverse{k^{2}}(1-(1-k^{2}\sin^{2}(\theta))\right\}d\theta\\
&= \inverse{k^{2}}\int_{0}^{\varphi}\left(\inverse{\Delta(\theta,k)} - \Delta(\theta,k)\right)d\theta\\
&= \inverse{k^{2}}\left(F(\varphi,k)-E(\varphi,k)\right)
\end{align*}


\begin{align*}
 J^{2}_{\mathrm c} &= F(\varphi,k) - J^{2}_{\mathrm s}\\
&=(1-\inverse{k^{2}})F(\varphi,k) + \inverse{k^{2}}E(\varphi,k)\\
&=\inverse{k^{2}}E(\varphi,k) - \frac{1-k^{2}}{k^{2}}F(\varphi,k)
\end{align*}


\begin{align*}
 I^{2}_{\mathrm c} &= \int_{0}^{\varphi}\Delta(\theta,k)\cos^{2}(\theta)d\theta = \int_{0}^{\varphi}\Delta(\theta,k)\left(\frac{1+\cos(2\theta)}{2}\right)d\theta\\
&=\inverse{2}\int_{0}^{\varphi}\Delta(\theta,k)d\theta + \inverse{2}\int_{0}^{\varphi}\Delta(\theta,k)\cos(2\theta)d\theta\\
&=\inverse{2}E(\varphi,k) + \inverse{2}\int_{0}^{\varphi}\Delta(\theta,k)\left(\inverse{2}\sin(2\theta)\right)^{\prime}d\theta\\
&=\inverse{2}E(\varphi,k) + \inverse{4}\left\{\left[\Delta(\theta,k)\sin(2\theta)\right]_{0}^{\varphi} - \int_{0}^{\varphi}
\left(\Delta(\theta,k)\right)^{\prime}\sin(2\theta)d\theta\right\}\\
&=\inverse{2}E(\varphi,k) + \inverse{4}\left[\Delta(\theta,k)\sin(2\theta)\right]_{0}^{\varphi}\\
&\qquad\qquad\qquad\qquad + \inverse{4}\int_{0}^{\varphi}\frac{k^{2}\sin(\theta)\cos(\theta)}{\Delta(\theta,k)}\sin(2\theta)d\theta\\
&=\inverse{2}E(\varphi,k) + \inverse{4}\Delta(\varphi,k)\sin(2\varphi)\\
&\qquad\qquad\qquad\qquad + \frac{k^{2}}{2}\int_{0}^{\varphi}\frac{\sin^2(\theta)\cos^2(\theta)}{\Delta(\theta,k)}d\theta\\
&=\inverse{2}E(\varphi,k) + \inverse{2}\Delta(\varphi,k)\sin(\varphi)\cos(\varphi)\\
&\qquad\qquad\qquad\qquad + \frac{k^{2}}{2}\int_{0}^{\varphi}\frac{\sin^2(\theta)\cos^2(\theta)}{\Delta(\theta,k)}d\theta
\end{align*}

しかるに
\begin{align*}
 &\frac{k^{2}}{2}\int_{0}^{\varphi}\frac{\sin^2(\theta)\cos^2(\theta)}{\Delta(\theta,k)}d\theta\\
&\quad = \frac{k^{2}}{2}\int_{0}^{\varphi}\left(\inverse{{\Delta(\theta,k)}}\right)\left(\frac{1 - (\Delta(x.k))^{2}}{k^2}\right)\left(\frac{-k^{\prime2} + (\Delta(x.k))^{2}}{k^{2}}\right)d\theta\\
&\quad = \inverse{2k^{2}}\int_{0}^{\varphi}\left(\inverse{\Delta(\theta,k)}\right)\left(-k^{\prime2} + (1+k^{\prime2})(\Delta(x.k))^{2} - (\Delta(x.k))^{4}\right)d\theta\\
&\quad = -\frac{k^{\prime2}}{2k^{2}}\int_{0}^{\varphi}\frac{d\theta}{\Delta(\theta,k)} + \frac{1+k^{\prime2}}{2k^{2}}\int_{0}^{\varphi}\Delta(x.k)d\theta\\
&\qquad\qquad\qquad\qquad - \inverse{2k^{2}}\int_{0}^{\varphi}(1-k^{2}\sin^{2}\theta)\Delta(x.k)d\theta\\
&\quad = -\frac{k^{\prime2}}{2k^{2}}F(\varphi,k) + \frac{k^{\prime2}}{2k^{2}}E(\varphi,k) + \inverse{2}\int_{0}^{\varphi}\sin^{2}\theta\Delta(x.k)d\theta\\
&\quad = -\frac{k^{\prime2}}{2k^{2}}F(\varphi,k) + \frac{k^{\prime2}}{2k^{2}}E(\varphi,k) + \inverse{2}\int_{0}^{\varphi}(1 - \cos^{2}\theta)\Delta(x.k)d\theta\\
&\quad = -\frac{k^{\prime2}}{2k^{2}}F(\varphi,k) + \left(\frac{k^{\prime2}}{2k^{2}} + \inverse{2}\right)E(\varphi,k) - \inverse{2}I^{2}_{\mathrm c}\\
\end{align*}
だから、まとめると
\begin{align*}
\frac{3}{2}I^{2}_{\mathrm c} &= \inverse{2}E(\varphi,k) + \inverse{2}\Delta(\varphi,k)\sin(\varphi)\cos(\varphi)\\
&\qquad\qquad + \left(-\frac{k^{\prime2}}{2k^{2}}F(\varphi,k) + \left(\frac{k^{\prime2}}{2k^{2}} + \inverse{2}\right)E(\varphi,k)\right)\\
&= \inverse{2}\Delta(\varphi,k)\sin(\varphi)\cos(\varphi) + \left(\frac{k^{\prime2}+2k^{2}}{2k^{2}}\right)E(\varphi,k) - \frac{k^{\prime2}}{2k^{2}}F(\varphi,k)\\
&= \inverse{2}\Delta(\varphi,k)\sin(\varphi)\cos(\varphi) + \frac{1+k^{2}}{2k^{2}}E(\varphi,k) - \frac{1-k^{2}}{2k^{2}}F(\varphi,k)
\end{align*}
となる。

結局
\begin{align*}
 I^{2}_{\mathrm c} = \inverse{3}\Delta(\varphi,k)\sin(\varphi)\cos(\varphi) + \frac{1+k^{2}}{3k^{2}}E(\varphi,k) - \frac{1-k^{2}}{3k^{2}}F(\varphi,k)
\end{align*}
が得られる。


\begin{align*}
 I^{2}_{\mathrm s} &= E(\varphi,k) - I^{2}_{\mathrm c}\\
 &= -\inverse{3}\Delta(\varphi,k)\sin(\varphi)\cos(\varphi) + \frac{2k^{2}-1}{3k^{2}}E(\varphi,k) + \frac{1-k^{2}}{3k^{2}}F(\varphi,k)
\end{align*}\end{align*}


| | コメント (0) | トラックバック (0)
|

メモ:岩波全書[数学公式 III] p.48 におけるヤコビのテータ関数の虚変換公式の誤り

本稿の草稿段階で、用語「Jacobi の虚変換」と「Jacobi の虚数変換」のどちらがヨリ広く通用しているのだろうと、google 検索してみたら、ウィキペディアに「ヤコビの虚数変換式」と云う項目が立てられていて、そこで、本稿の主題である [数学公式III] の誤りのことが指摘されていることに気が付いた (以前にも、テータ関数に就いてネットで調べたことがあるのは、下記にある通りだが、その時は見落としたらしい)。従って、本稿を書く意味はホボ無くなっている。しかし、新たに記事のネタを考えるのもメンドーなので、今までに書いた草稿を少しくドレッシングして投稿することにする。

更に、いきなり話を混線させるようなことをして申し訣ないが、[数学公式III] での誤りとは別に、ウィキペディア「ヤコビの虚数変換式」の第2の式 (つまり $\vartheta_{1}$ に就いての式) の右辺冒頭のマイナス符号は不要である。ウィキペディア [テータ関数] の小節 [恒等式] では正しく示されているので、それを参照されたい。

岩波書店発行 [数学公式III] (1960年。著者: 森口 繁一, 一松 信, 宇田川 銈久。新装版が 1987年に発行されている) は、もっぱら [特殊関数] に関わる。この記事は、新装版に基づいている (1960年版も所持しているのだが、現在手元に見当たらない)。

その [第II篇楕円関数第2章](pp.46-51) は 「楕円テータ関数」を扱うが、p.48 に示されている「Jacobi の虚変換」の恒等式は次の通りである。

Jacobis_imaginary_transformation_false

しかし、この内、第2の式は誤っており、第1の式を含め、全体として、次のようにすべきである。

Jacobis_imaginary_transformation_true

「Jacobi の虚数変換式」([数学公式III] では「Jacobi の虚変換」) と云う通り名があるくらいの公式で、誤植レベルを超えた瑕疵があるのは、やや面妖ではある。更に、この恒等式は、モジュラー形式に至る「数学の大道」にあることに思いを致すなら、この間違いの [面妖さ] は倍増する。

まぁ、それでも、これを「編集ミス」レベルと言ってしまったら、「編集ミスレベル」になる。人間、間違える時は間違えるものなのだ。「編集者」は「編集ミス」をする性である。「犯人」探しをしても、仕方がない。

ただ、それはそれとして、この件については、「重要参考人」の如きものが、存在する。

それは、[数学公式] の少し前に発行された、所謂「テラカン」、つまり寺澤寛一著 [自然科學者のための数學概論 (增訂版) ](岩波書店1954年。[增訂版] と云うことは、[オリジナル版] も存在する訣だが、そして、たしか以前所持していた記憶があるが、引っ越しの際に廃棄してしまった筈であり、両者間の比較は諦めることにする) である。その pp.544-546 には「Jacobi の虚數變換」が解説されていて、特に p.546 には、虚数変換式が、次のように示されている。

Jacobis_imaginary_transformation_TERAKAN

「テラカン」では、[岩波数学公式III] に対し、変数 $v$ の代わりに $z$ が使われ、コンマの代わりに「縦棒」が使われ、そして、テータ関数の添え字では、[岩波数学公式] では、$\nu$ のみが使われているのに比して、jk とが使われいる点を除けば、両者が同一であることがわかる ($\sqrt{i}=e^{{\pi}i/4}$ 及び $i\sqrt{i}=e^{3{\pi}i/4})$ に注意)。

そして重要なのは、「テラカン」においては、上記の式に続いて

ここに $j=0$ なら $k=2$, $j=2$ なら $k=0$, $j=3$ なら $k=3$ である.
と補足されていることである。

ここから先は、妄想にしかなりえないが、公式集の原稿作成時、「テラカン」もしくは同等の内容を有する「種本」から、上記のテータ関数の虚数変換式を、(公式集の内部の文脈に合わせて適宜、変数・定数・添え字の記法を書き換えて) 引き写した時に、元はあった添え字に就いての注意書きを転記し忘れたのなら、例えばゲラ刷りの段階では、左辺と右辺の添え字の相違が意味不明になる。その相違を hypercorrection して統一してしまうと、丁度、[岩波数学公式集III] における式が誕生するのだ。

こうしたことが実際に起こったかどうかは分からない。

非当事者には想像しがたい失策であっても、当人の表層的現実意識では「ウッカリしていた」と表現するしかないこともありうる。原因の調査自体に特段の意味があるのでない限り、whodunit ばりの詮索に拘るより、次の段階に進んだ方がよい。この話は、「そうかもしれない」と云う、それまでのことである。

結局、読み手としては Caveat lector の二語を肝に銘ずるしかない。

この件と関係するのかどうか、不明だが、以前、この記事の起稿を意識していない段階でテータ関数に就いての情報を求めてネット内を彷徨していた際、立川裕二 (たちかわ ゆうじ: 。東京大学理学系研究科物理学科准教授、東京大学国際高等研究所カブリ数物連携宇宙研究機構科学研究員 --その長さに感動せざるを得ない。海堂尊の小説の中の登場人物を思い出してしまった。その海堂尊自身が「独立行政法人放射線医学総合研究所重粒子医科学センターAi情報研究推進室室長」なんだそうだが--。立川さんの専門分野は素粒子物理学、特に超弦理論における場の理論や数理物理) と云う方の駒場での授業の講義録のなかに『「岩波公式集」。これは僕が学生のとき(の少しまえ) ぐらいまでは日本の(理論) 物理屋の必携書だったが』と前振りした後で、

有名な噂として、岩波公式集のテータ関数の恒等式が間違っていたせいで、日本の弦理論研究者が一年ほど混乱して研究が遅れた、という話がある。
--Yuji Tachikawa [線形代数の復習 離散および連続フーリエ変換 ]
と云う逸話を紹介されているのことを知った。

私の感想は述べないでおこう。

| | コメント (0) | トラックバック (0)
|

メモ: 所謂「モンティ・ホール問題 (Monty Hall problem)」に就いて

以前、図書館から「放浪の天才数学者エルデシュ」と云う本を借りて読んだ時、彼が、所謂「モンティ・ホール問題 (Monty Hall problem)」に引っかかったと云うエピソードが紹介されていて (その後、文庫版を購入した。文庫版 /*草思社文庫 ISBN978-4-7942-1854-4*/ では第6章「はずれ」に書かれている)、その「問題」に就いて無知であった私は、ザッとネットで調べたことがある。

有名な問題らしく、ウィキペディアに項目が立てられていた (「モンティ・ホール問題」)。それに対する印象は、「説明がピンとこない」と云うものだった。実は、「放浪の天才数学者エルデシュ」にも解説があって、それも読んでいた訣だが、キツネにつままれた気分だった。しかし、「読んでいて理解できない・腑に落ちない」と云うことは、私のように超絶的に頭の悪い人間にはデフォルトで発生する現象なので、そうした場合のルーチンである、「何度も読み直す」とか、「新規まき直し自分の頭で考えてみる」とかをする訣だが、この場合も、結局は納得したのだった。ただ、「少なくとも、私自身にとっては、もっと分かりやすい説明の仕方がある」と云うオマケが付いたりする。

今回は、そのオマケを紹介しておく。ただ、当時、そして今回もこの原稿を書くに当たって、ごく簡単に調べただけだから、以下のことは、ネット上に、(あるいは、それどころか、私が気が付かないだけで、ウィキペディアの記事自体の中に)、既に指摘されているかもしれない。そうした場合は、笑殺していただきたい。調べたり考えたりしたことの前回分と今回分とが、私の頭の中で錯綜しているような気がするが、弁別することはしないでおく。そうしたことに拘るほど、大した内容ではないのだ。

ます、スタートラインとして、ウィキペディアに従って、本稿で論ずる「モンティ・ホール問題」とは、いかなるものかを確定しておこう。

「プレーヤーの前に閉まった3つのドアがあって、1つのドアの後ろには景品の新車が、2つのドアの後ろには、はずれを意味するヤギがいる。プレーヤーは新車のドアを当てると新車がもらえる。プレーヤーが1つのドアを選択した後、司会のモンティが残りのドアのうちヤギがいるドアを開けてヤギを見せる。

ここでプレーヤーは、最初に選んだドアを、残っている開けられていないドアに変更してもよいと言われる。プレーヤーはドアを変更すべきだろうか?」

1990年9月9日発行、ニュース雑誌 ''Parade'' にて、マリリン・ボス・サヴァントが連載するコラム「マリリンにおまかせ」において上記の読者投稿による質問に「正解は『ドアを変更する』である。なぜなら、ドアを変更した場合には景品を当てる確率が2倍になるからだ」と回答した。すると直後から、読者からの「彼女の解答は間違っている」との約1万通の投書が殺到し、本問題は大議論に発展した。
--モンティ・ホール問題(最終更新 2017年3月1日 [水] 04:14)

引用者註:「司会のモンティ」は、あらかじめ、アタリとハズレのドアを知っている。

こうした反論に対して、マリリン・ヴォス・サヴァント (Marilyn vos Savant) は、「ドアを変えれば勝てるのは3回の内2回、負けるのは3回の内1回だけ、しかしドアを変えなければ勝てるのは3回の内1回だけ」と反論したそうだ。私に言わせれば、私が読んだ説明の中では、最終的には、これが一番単純で分かりやすい。私の以下の説明も、このヴォス・サヴァントの指摘の枠内に留まるものであることをあらかじめ認めておく。


では、わたしなりの解釈を述べることにする。

いま、1つの「アタリ」と2つの「ハズレ」からなる3つの回答候補がある問題があって、それに対しに2つの異なるフォーマットのクイズ・プログラムを作るとする。それを F1 と F2 と呼ぶことにする。

フォーマットF1 のルールは所謂「三択(三者択一)」である。挑戦者は、3つの候補の内の1つドアを選択して、それがアタリであるなら、ウィナーになり、ハズレであればルーザーになる。挑戦者がウィナーになる確率は 1/3 である。

フォーマットF2 のルールでは、3つの候補の内、2個の選択が許される。選択した2つのドアを開けたとき、その内の中にアタリが含まれているなら挑戦者はウィナーになり、両方ともハズレであればルーザーになる。挑戦者がウィナーになる確率は 2/3 である。ここで、注意しておくと、「開けるドアを2つ選択する」と云うことは、「開けないドアを1つ選択する」と云うことと同じであることである。

私の「納得」のキッカケも、「モンティ・ホール問題」では、司会者の提案を受け入れると、挑戦者が「開けるドアを1つ選択する」状態から「開けないドアを1つ選択する」状態に推移することに気づいたことだった。

さて、次のような、プロトタイプのプログラムを考える。

プログラム0: 司会者 (上記の例で言うなら「司会のモンティ」) が、プログラムの冒頭で、挑戦者 (プレーヤー) に対して、フォーマットF1のクイズと、フォーマットF2のクイズとを提示して、そのどちらのフォーマットでクイズを行っても良いと宣言する。つまり、ドアの選択の前に、クイズ・フォーマットの選択をする。

そして、挑戦者が選択したフォーマットに従って、プログラムが進行する。この場合、どちらのフォーマットが挑戦者にとり有利かと言えば、当然 F2 (アタリの確率が 2/3) の方が F1 (アタリの確率が 1/3) の2倍有利である。

プログラム0 は、フォーマット自体の選択を行うことが明示されている。「モンティ・ホール問題」の核心は、プログラムの途中で、フォーマットF1 からフォーマットF2のへ切り替えが行われているのに、それが気づきづらいようにされていることである (フォーマットの切り替え自体、「ルール違反」だろう)。以下、フォーマット切り替えが容易に透けて見えるプログラムから、フォーマット切り替えがホボ隠蔽されているプログラムへと順次変更していく。

プログラムI: フォーマットF1のクイズでプログラムを開始して、挑戦者が開けるべき1つのドアを選択した時点で、司会者が、開けるドアをもう1つ追加して、2つにしても良いと宣言する。つまり、フォーマット F1 からフォーマット F2 への切り替えを提案する。

もし、挑戦者がこの提案に同意するなら、挑戦者がウィナーになる確率は 1/3 から 2/3 へと倍増する。

このプログラムI を以下の系列で、「 フォーマットF1 を、それの2倍有利なフォーマットF2 に切り替える提案が行われる」と云う事実を変えないまま、プログラムI のコンテンツを「モンティ・ホール」型のコンテンツへ徐々に変形していく。

プログラムII: フォーマットF1のクイズでプログラムを開始して、挑戦者が開けるべき1つのドアを選択した時点で、司会者が挑戦者に対して、当初選択した1つのドアを開けない代わりに、当初選択しなかった2つのドアを開けることを提案する。

この変更は、「開けるドアの集合」の包含関係を意味しない。つまり、「開けるドア」の追加ではない。しかし、「開けるドア」の個数 (集合の濃度) は、1つから2つへと2倍になっている。フォーマットF1 と F2 の要件は、「開けるドア」の個数のみに依存することに注意するなら、この場合も、フォーマットF1 から、フォーマットF2 への切り替えになっていることが分かる。

挑戦者は、司会者の提案に応じるか応じないかに従って、2つ又は1つのドアを開ける。当然のことながら、挑戦者がウィナーになる確率は、司会者の提案を受け入れた場合の方が、受け入れない場合の2倍になる。

プログラムIII: フォーマットF1のクイズでプログラムを開始して、挑戦者が開けるべき1つのドアを選択した時点で、司会者が挑戦者に対して、当初選択したドアを開けない代わりに、当初選択しなかった2つのドアを開けることを提案する。つまり、フォーマットF1 から、フォーマットF2 への切り替えを提案する。ここまでは、プログラムII と同じである。

しかし、プログラムIII では、挑戦者が提案を受け入れた場合、開けるべき2つのドアのうちの一つを挑戦者自身が、そして他方のドアを司会者が同時に開ける

ただし、「同時に開ける」のは、司会者が、「挑戦者の分身」としてドアを開けることを際立たせるためであり、フォーマットF2 への転換後なら、司会者が、挑戦者の前にドアを開けても (次のプログラムIV 参照)、後でドアを開けても、そして、勿論同時に開けても (このプログラムIIIの場合)、いずれの場合も、司会者が挑戦者の分身であることには変わりはない。どの場合も,挑戦者がウィナーになる確率の値は等しく 2/3 である。それらが、コンテンツとして訴求性を有するかどうかは問題にしていない。

プログラムIII以降では、フォーマットF2 への切り替えが行われるなら、司会者が、あるドアを開けるようになっている。ここで、確率の導出のため、挑戦者自身がドアを開ける最終段階までプログラムが進んだ状態を想定するなら、挑戦者自身と司会者がどう関わるにしろ、2つのドアの両方が開くという最終形態は同一であるのだから、その順番も (あるいは同時であっても)、また、司会者及び/又は挑戦者のどちらが開けるかも、挑戦者がウィナーになる確率には影響しない。しかも、司会者がドアを開けるのは、必ず挑戦者の分身としてであることが重要な意味を持つ。司会者はウィナーにもルーザーにもならないのである。

従って、以下、プログラムの変形で指針となるのは、「挑戦者自身の行為により、挑戦者がウィナーになるか、ルーザーになるかが決定する」と云う籤引き型クイズとしての基本的要請を守ることである。ただし、そのことは、確率の計算とは無関係である。

プログラムIV: フォーマットF1のクイズでプログラムを開始して、挑戦者が開けるべき1つのドアを選択した時点で、司会者が挑戦者に対して、当初選択したドアを開けない代わりに、当初選択しなかった2つのドアを開けることを提案する。つまり、フォーマットF1 から、フォーマットF2 への切り替えを提案する。ここまでは、プログラムII 及びプログラムIII と同一である。

しかし、プログラムIV では、挑戦者が提案を受け入れたなら、開けるべき2つのドアのうち、司会者が挑戦者より先に、2つのドアの内、少なくとも一つはあるハズレのドア (司会者は、アタリ・ハズレのドアを知っている) を開けてしまい。残りのドアを挑戦者自身に開けさせる。

この場合でも、時間が前後しているだけで、司会者が挑戦者の分身としてドアを開けると云う事実には変わりはないから、挑戦者がウィナーになる確率は、やはり、提案を受け入れない場合の確率の2倍になる。

このプログラムの場合、司会者がハズレのドアを開けた時点で、「挑戦者がウィナーになる確率は?」と云う設問に対して、「1/3」又は「1/2」と考える人たちが多数いたことが「モンティ・ホール問題」がスキャンダルになった理由だった。しかし、これは間違っている

つまり、F2 への切り替わり当初は「2/3」だったが、司会者がハズレのドアを開けた時点では「1/3」又は「1/2」になると云うようなことは、起こらない。開かないで残っているドアが2つになっていても、挑戦者がウィナーになる確率は 2/3 である。

ドアが2つになったことで、「二者択一」になったように見えても (この見かけにより、プログラムは「盛り上がる」かもしれないが)、それはあくまで「見かけ」であり、ウィナーになる確率には影響しない。アタリ/ハズレを知っている司会者が、意図的にハズレのドアをあけており、挑戦者が正解する可能性を減らしていないから、挑戦者がウィナーになる確率は 2/3 のままである。

挑戦者がウィナーになるかどうかは「フォーマットF2 では、開けることになった2つのドアにどちらかがアタリであればよい」と云う事実に変化はなく、少なくともその片方が必ずハズレと云うフォーマットF2移行時当初からの確定事項が意図的に暴露されたとしても、最終結果の確率には影響は出ないのである。

プログラムIV を変形して、フォーマットF2において開けるべき2つのドアのどちらかにアタリのドアがある場合に「司会者が先にアタリ・ハズレに関わらずドアを開く」としも、挑戦者がウィナーになる確率は 2/3 である。ただし、この場合は、上記の「挑戦者自身の行為により、挑戦者がウィナーになるか、ルーザーになるかが決定する」と云う籤引き型クイズとしての基本的要請に反することになる (この場合、司会者は、アタリのドアであることを承知で開ける訣で、プログラムとして滑稽なことが起こる)。

プログラムV: フォーマットF1のクイズでプログラムを開始して、挑戦者が開けるべき1つのドアを選択した時点で、司会者は、挑戦者が選択しなかったドアの内、少なくとも一つはあるハズレのドア (挑戦者は、アタリ・ハズレのドアを知っている) を開けてしまった後、挑戦者に対して、当初選択したドアを開けない代わりに、「当初選択しなかった2つのドアで、ハズレであることが分かっているドアの他」に、「まだ開いていない残りのドアも」開けることを提案する。

開けるドアは2つだから、これも、フォーマットF1 から、フォーマットF2 への切り替えになっている。ただし、フォーマット切り替えの提案が、プログラムIV では、司会者によるハズレのドア開扉の前に行われているのに対し、プログラムV では、司会者がハズレのドアを開けてしまった後に、フォーマットの切り替えが提案されているので、フォーマット切り替えという事実が認識しにくくなっている。

もし、挑戦者が提案を受け入れたなら、開けるべき2つのドアのうちのうち、司会者が既に開けてしまったドアとは別のドアを挑戦者自身に開けさせる。この場合でも、2つのドアを開けると云う選択を行ったのは挑戦者自身だから、時間が前後しているだけで、司会者が挑戦者の分身としてドアを開けると云う事実には変わりはない。従って、挑戦者がウィナーになる確率は、やはり、受け入れない場合に確率の2倍になる。

このように、このプログラムV (そして、次のプログラムVI) では、興味深いことが発生している。もし、挑戦者が司会者の提案を受け入れると、提案以前に司会者が、挑戦者と別主体として行ったドアを開けると云う行為が、挑戦者の分身としての行為に、時間を遡及して転化するのである。これは、フォーマットF1 及びフォーマットF2 の構成要件に時間が関係しないことから起こるパラドクスである。「モンティ・ホール問題」の解析にベイズ理論が親和するのも、これに起因するのだろう。

プログラムVI: フォーマットF1のクイズでプログラムを開始して、挑戦者が開けるべき1つのドアを選択した時点で、司会者は、挑戦者が選択しなかった2つのドアの内、少なくとも一つはあるハズレのドア (挑戦者は、アタリ・ハズレのドアを知っている) を開けてしまう。ここまでは、プログラムV と同一である。そして、挑戦者に対して、開けるドアを、「挑戦者が当初選択したドア」から、「挑戦者が当初選択しなかった2つのドアの内、まだ開いていないドア」に「切り替える」ことを提案する。

ここで、プログラムVI と司会者の提案の文言が異なっているだけであることに注意。司会者は挑戦者が開けるドアの「切り替え」を提案している形だが、実際には、開けるドアの追加を提案しているのである。

しかし、司会者がこうした言い方をすることで、実際にはフォーマットF1からフォーマットF2への切り替えが提案されているのに、そのことがホボ隠蔽されてしまっている。

提案を受け入れることにより、「切り替え」られるのは、「挑戦者が開けるドア」ではなく、クイズのフォーマットである。挑戦者は、司会者と云う「潜在的な分身」により、ドアを1つ開けており、提案を受け入れることは、「分身を含めて挑戦者が開けるドア」を2つにすることを意味する。従って、挑戦者がウィナーになる確率は、やはり、受け入れない場合に確率の2倍になる。

このプログラムVI は、「モンティ・ホール問題」そのものである。

付言すると、司会者の Monty と云う名前は、three-card Monte や three-cup Monte (これらに就いては、適宜、YouTube をご参照頂きたい) などの、short con game (イメージとしての訳語を当てるなら「大道芸」ならぬ「大道詐欺」) を連想させる。

| | コメント (0) | トラックバック (0)
|

岩波書店「位相解析の基礎」 [延長定理] (pp.59-60) の証明における初歩的ミス

自分の疎漏な知識を補強するために測度論や積分論の基礎に就いて書かれた本を拾い読みすることがある。その時に読む本は大体決まっているのだが、岩波書店の「位相解析の基礎」(1960年。吉田耕作・河田敬義・岩村聯) は、その中に入っていない。

それでも、他の本を読んでいて釈然としないときは、手がかりを求めて手を出すことがある。しかし、「位相解析の基礎」の第1編第4章 20.8 の [延長定理] (pp.59-60) の証明を読んで、少し残念だった。初歩的なミスをしているのだ。

[延長定理] は、集合 $X$ の冪集合 $\mathfrak{P}(X)$ の部分集合の内、一定の条件 (「位相解析の基礎」p.52) を満たすものである「集合体」 (つまり「有限加法族」) $\mathfrak{K}$ 上の Jordan 式測度 $v$ が、$\mathfrak{K}$ から生成される最小の Borel 集合体 $\mathfrak{B}=B(\mathfrak{K})$ 上に延長される必要十分条件として $v$$\mathfrak{K}$ 上での可算加法性

\[
 A,A_{1},A_{2},\cdots \in \mathfrak{K}, A=\displaystyle{\bigcup_{n=1}^{\infty}}A_{n}, A_{i}{\cap}A_{j}=\emptyset\; (i{\neq}j)
\]
ならば
\[
 v(A)=\sum_{n=1}^{\infty}v(A_{n})
\]
であること を主張する。

必要なことは明らかなので、十分であることを示すために「位相解析の基礎」では次の段階を踏む。

(a) $v$ から $\mathfrak{P}(X)$ 全体を定義域とする集合関数 $m^{\ast}$ を、任意の $E{\in}\mathfrak{P}(X)$ に対し


\[
 m^{\ast}(E)=\inf\left\{\sum_{n=1}^{\infty}v(A_{n});{\,} E{\subset}\bigcup_{n=1}^{\infty}A_{n},{\,} A_{n}{\in}\mathfrak{K}{\;} (n=1,2,\cdots)\right\}
\]
とすることで、構成する。そして $m^{\ast}$Carathéodry の外測度であることを示す。

(b) 次に、$\mathfrak{P}(X)$ に要素のうち $m^{\ast}$ 可測な集合全体を $\mathfrak{B}^{\ast}$ とする時、$\mathfrak{K}{\subset}\mathfrak{B}^{\ast}$ であることを示す。Carathéodry の外測度に就いて可測な集合 $\mathfrak{B}^{\ast}$ の全体は、Borel 集合体をなすから (「位相解析の基礎」p.57)、$\mathfrak{K}{\subset}\mathfrak{B}^{\ast}$ と云うことは $\mathfrak{B}=B(\mathfrak{K}){\subset}\mathfrak{B}^{\ast}$ を含意する。

(c) 最後に $m^{\ast}$$\mathfrak{B}^{\ast}$ 上に制限するなら測度となる (「位相解析の基礎」p.57) ので、その測度を $m$ で表すなら、$m$$\mathfrak{K}$ への制限 (これは、つまり $m^{\ast}$$\mathfrak{K}$ への制限と云うこと) が $v$ に一致することを示す。

実は、この最後の (c) 段階の [証明] が、間違っている (勿論、[主張] そのものは正しい)。原文を引用すると次の通り (「位相解析の基礎」p.60)。

(c) $m^{\ast}|\mathfrak{K}=v$ の証明. $A{\in}\mathfrak{K}$ に対して $m^{\ast}(A){\leqq}v(A)$ は明らかであるが、$A{\subset}\displaystyle{\bigcup_{n=1}^{\infty}A_{n},{\:}A_{n}{\in}\mathfrak{K}}$であれば、$v$ の可算加法性によって $v(A)=\displaystyle{\sum_{n=1}^{\infty}}v(A_{n}{\cap}A){\leqq}\displaystyle{\sum_{n=1}^{\infty}}v(A_{n})$ である。ゆえに $v(A){\leqq\inf}\{\sum{v(A_{n})}\}=m^{\ast}(A)$ となる。

しかしながら、可算加法性では、可算和を取られる個々の要素の集合は共通部分を持たないこと、つまり

\[
 A_{i}{\cap}A_{j}=\emptyset \quad(i,j=1,2,3,\cdots,{\;}i{\neq}j)
\]
が前提となっている。ところが、この (c) 段階の議論では、これは担保されていない。

勿論、この瑕疵は、初等的なテクニックで回避できる。と云うか、その初等的なテクニックを適用し忘れているので、私はがっかりしたのだ。

烏滸がましいが、その「初等的なテクニック」を書いておく。

\[
 B_{1}=A_{1}{\cap}A,{\quad}B_{n}=(A_{n}-\bigcup_{k=1}^{n-1}A_{k}){\cap}A{\;}(n=2,3,\cdots)
\]
とおくと、当然 $B_{n}{\subset}A_{n}{\cap}A{\,}(n=1,2,3,\cdots)$"" であるが、また、$\mathfrak{K}$ が集合体 (有限加法族) と云う前提から $B_{n}{\in}\mathfrak{K}{\,}(n=1,2,3,\cdots)$ が言える。そして $B_{n}{\,}(n=1,2,3,\cdots)$ の構成法により $n>1$ なら $B_{1}{\cap}B_{n}=\emptyset$ であり $i,j>1,i{\neq}j$ なら、以下の演算で $i<j$ としても一般性を失わないことに注意して
\begin{align*}
 B_{i}{\cap}B_{j} &= \left((A_{i}-\bigcup_{k=1}^{i-1}A_{k}){\cap}A\right){\cap}\left((A_{j}-\bigcup_{k=1}^{j-1}A_{k}){\cap}A\right)\\
                  &=\left((A_{i}-\bigcup_{k=1}^{i-1}A_{k}){\cap}(A_{j}-\bigcup_{k=1}^{j-1}A_{k})\right){\cap}A\\
                  &{\subset} \left(A_{i}{\cap}(A_{j}-\bigcup_{k=1}^{j-1}A_{k})\right){\cap}A\\
                  &{\subset} (A_{i}-\bigcup_{k=1}^{j-1}A_{k}){\cap}A =\emptyset{\cap}A = \emptyset
\end{align*}
そして
\begin{align*}
 \sum_{n=1}^{\infty}B_{n} &= (A_{1}{\cap}A) + \sum_{n=2}^{\infty}\left((A_{n}-\bigcup_{k=1}^{n-1}A_{k}){\cap}A\right)\\
                          &= (\bigcup_{n=1}^{\infty}A_{n}){\cap}A = A
\end{align*}

こうして $B_{1},B_{2},\cdots$ は、$v$$\mathfrak{K}$ における可算加法性の前提を満足するから

\[
 v(A) = \sum_{n=1}^{\infty}v(B_{n}) \leqq \sum_{n=1}^{\infty}v(A_{n})
\]
が言える。これから、$v(A){\leqq\inf}\{\sum{v(A_{n})}\}=m^{\ast}(A)$ が導かれるのは原文通りである。

参照: 伊藤清三著「ルベーグ積分」(裳華房。1963年) p.52-53 の定理9.1 (E.Hopf の拡張定理) 及び p.23-24 の定理5.1、特に、その ii)。

| | コメント (0) | トラックバック (0)
|

「高木貞治 [代数学講義改訂新版] p.194 での4次方程式の3次分解方程式の根の表記の瑕疵」補足 (「検算」篇)

本ブログの記事 [高木貞治 [代数学講義改訂新版] p.194 での4次方程式の3次分解方程式の根の表記の瑕疵] (2016年11月30日 [水]) では結果だけを書いたので、この記事では、その「検算」をしておく。

つまり、4次方程式


\[
 a_{0}x^{4}+a_{1}x^{3}+a_{2}x^{2}+a_{3}x+a_{4} = 0
\]

の4つの根 $x_{1},x_{2},x_{3},x_{4}$ に対して
\[
 a_{0}(x_{1}+x_{2})(x_{3}+x_{4}), a_{0}(x_{1}+x_{3})(x_{2}+x_{4}), a_{0}(x_{1}+x_{4})(x_{2}+x_{3})
\]

の3つを根とし、主項係数が 1 の3次方程式が

\[
 \lambda^{3} - 2a_{2}\lambda^{2} + (-4a_{0}a_{4}+a_{2}^{2}+a_{1}a_{3})\lambda + a_{0} a_{3}^{2} + a_{1}^{2}a_{4} - a_{1}a_{2}a_{3} = 0
\]

であることを示すことにする。

まず記号


\begin{align*}
 &V_{1}\equiv(x_{1}+x_{2})(x_{3}+x_{4})\\
 &V_{2}\equiv(x_{1}+x_{3})(x_{2}+x_{4})\\
 &V_{3}\equiv(x_{1}+x_{4})(x_{2}+x_{3})\\
 &S_{1}\equiv{V_{1}+V_{2}+V_{3}}\\
 &S_{2}\equiv{V_{1}V_{2}+V_{2}V_{3}+V_{3}V_{1}}\\
 &S_{3}\equiv{V_{1}V_{2}V_{3}}\\
 &W_{1}\equiv{a_{0}V_{1}} = a_{0}(x_{1}+x_{2})(x_{3}+x_{4})\\
 &W_{2}\equiv{a_{0}V_{2}} = a_{0}(x_{1}+x_{3})(x_{2}+x_{4})\\
 &W_{3}\equiv{a_{0}V_{3}} = a_{0}(x_{1}+x_{4})(x_{2}+x_{3})\\
 &A_{1}\equiv{W_{1}+W_{2}+W_{3}} = a_{0}S_{1}\\
 &A_{2}\equiv{W_{1}W_{2}+W_{2}W_{3}+W_{3}W_{1}} = a_{0}^{2}S_{2}\\
 &A_{3}\equiv{W_{1}W_{2}W_{3}} = a_{0}^{3}S_{3}
\end{align*}

を導入する。

これらの記号を用いて、改めて本稿の目的を述べれば、それは3次式

\[
 \lambda^{3}-A_{1}{\lambda}^{2}+A_{2}{\lambda}-A_{3}
\]

\[
 \lambda^{3} - 2a_{2}\lambda^{2} + (-4a_{0}a_{4}+a_{2}^{2}+a_{1}a_{3})\lambda + a_{0} a_{3}^{2} + a_{1}^{2}a_{4} - a_{1}a_{2}a_{3}
\]

に一致することを示すことにある。

別の言い方をするなら


\begin{align*}
 &A_{1}=2a_{2}\\
 &A_{2}=a_{2}^{2}+a_{1}a_{3}-4a_{0}a_{4}\\
 &A_{3}=a_{1}a_{2}a_{3} - a_{1}^{2}a_{4} - a_{0} a_{3}^{2}
\end{align*}

を示せばよい。

我々が求めようとしているのは $W_{1},W_{2},W_{3}$ を根とする3次方程式である訣だが、それを構成する前に、それぞれを $a_{0}$ で割った、$V_{1},V_{2},V_{3}$ /> に就いて、若干検討しておく。そこで、まず、根 $x_{1},x_{2},x_{3},x_{4}$ の置換が $V_{1},V_{2},V_{3}$ に及ぼす作用を見ることにする。

$x_{1},x_{2},x_{3},x_{4}$ を2個づつに分けて、それぞれから作った和同士を掛け合わせて得られる積は、$V_{1}\equiv{(x_{1}+x_{2})(x_{3}+x_{4})}$, $V_{2}\equiv{(x_{1}+x_{3})(x_{2}+x_{4})}$, $V_{3}\equiv{(x_{1}+x_{4})(x_{2}+x_{3})}$ の3通りしかないから、$x_{1},x_{2},x_{3},x_{4}$ の置換を行うと、$V_{1},V_{2},V_{3}$ のそれぞれは $V_{1},V_{2},V_{3}$ のいずれかに変化する。

下の表では、根の添え字に対して左の欄の互換を行った際に $V_{1},V_{2},V_{3}$ がどれに変化するかを、右欄に示してある。なお、表を見やすくするために $(x_{1}+x_{2})(x_{3}+x_{4})$, $(x_{1}+x_{3})(x_{2}+x_{4})$, $(x_{1}+x_{4})(x_{2}+x_{3})$ を、それぞれ $\{12\}\{34\}$,$\{13\}\{24\}$ $\{14\}\{23\}$と表記した (勿論、これらは $x_{1},x_{2},x_{3},x_{4}$ の置換を意味しない)。

\[
 \begin{array}{|c|ccc|}
\hline
  & V_{1}\equiv\{12\}\{34\} & V_{2}\equiv\{13\}\{24\} & V_{3}\equiv\{14\}\{23\}\\
\hline
  (12) & V_{1}\equiv\{12\}\{34\} & V_{3}\equiv\{14\}\{23\} & V_{2}\equiv\{13\}\{24\}\\
  (13) & V_{3}\equiv\{14\}\{23\} & V_{2}\equiv\{13\}\{24\} & V_{1}\equiv\{12\}\{34\}\\
  (14) & V_{2}\equiv\{13\}\{24\} & V_{1}\equiv\{12\}\{34\} & V_{3}\equiv\{14\}\{23\}\\
  (23) & V_{2}\equiv\{13\}\{24\} & V_{1}\equiv\{12\}\{34\} & V_{3}\equiv\{14\}\{23\}\\
  (24) & V_{3}\equiv\{14\}\{23\} & V_{2}\equiv\{13\}\{24\} & V_{1}\equiv\{12\}\{34\}\\
  (34) & V_{1}\equiv\{12\}\{34\} & V_{3}\equiv\{14\}\{23\} & V_{2}\equiv\{13\}\{24\}\\
\hline
 \end{array}
\]

このように、4次方程式の根 $x_{1},x_{2},x_{3},x_{4}$ の互換の全てに於いて、$V_{1},V_{2},V_{3}$ は全体として変わらない。当然、そうした根の任意の置換に於いても $V_{1},V_{2},V_{3}$ は全体として変わらない。これは $V_{1},V_{2},V_{3}$ 自体の置換が起こるのみと云う言い方もできる。従って、$V_{1},V_{2},V_{3}$ の対称式は、$x_{1},x_{2},x_{3},x_{4}$ に就いて対称になる。

ちなみに、恒等置換 ($e$ と表すことにする) の他、置換 $(12)(34),(13)(24),(14)(23)$ の4つの置換 (くどくなりそうだが、こちらの方は、4次方程式の根 $x_{1},x_{2},x_{3},x_{4}$ の置換であって、上記表の右欄の $\{12\}\{34\},\{13\}\{24\},\{14\}\{23\}$ とは異なる) は、個々の $V_{1},V_{2},V_{3}$ そのものを動かさない。この4つの置換 $\{e, (12)(34),(13)(24),(14)(23)\}$ は、4次交代群の正規部分群になっている。それは、位数 2 の巡回群2個の直積と同型なアーベル群であり、Klein の4元群と呼ばれている。この Klein の4元群が、4次交代群の正規部分群になっていることが、上記の 3次方程式が分解方程式になっている所以である。

$S_{1},S_{2},S_{3}$ は、$V_{1},V_{2},V_{3}$ に就いての基本対称式 ([代数学講義改訂新版] p.138 参照) となっているから、$x_{1},x_{2},x_{3},x_{4}$ に対しても対称式であり、従って、符号を除けば $x_{1},x_{2},x_{3},x_{4}$ の基本対称式に等しい $\displaystyle \frac{a_{1}}{a_{0}},\frac{a_{2}}{a_{0}},\frac{a_{3}}{a_{0}},\frac{a_{4}}{a_{0}}$ の多項式として表すことができる (対称式に関する基本定理。[代数学講義改訂新版] p.140)。

さて、4変数 $x_{1},x_{2},x_{3},x_{4}$ から作られる対称式に就いて論じるため、記法と用語を決めておくと、4変数 $x_{1},x_{2},x_{3},x_{4}$ からなる単項式は $Cx_{i_{1}}^{e_{1}}x_{i_{2}}^{e_{2}}x_{i_{3}}^{e_{3}}x_{i_{4}}^{e_{4}}$ ($C$ は定数。$\{i_{1},i_{2},i_{3},i_{4}\}=\{1,2,3,4\}$ であり $e_{1}\geq{0}$, $e_{2}\geq{0}$, </span>$e_{3}\geq{0}$, $e_{4}\geq{0}$) と表せるが、こうした単項式で、変数に置換操作を施すと一致させることができる時、それらを「同型の単項式」又は「同型単項式」と呼ぶ ([代数学講義改訂新版] p.139 参照。ただし、そこでは「同型の項」と呼ばれている)。また、各単項式に於いて $C=1$ と置いた単項式を、元の単項式の「基本形」と呼ぶことにする。同型単項式同士の基本形同士は、勿論同型である。

基本形の単項式があった時、それと異なる同型単項式が存在する場合、それぞれの単項式一つひとつの総和は、対称式となる。また、異なる同型単項式が存在しない場合は、それ自体で対称式となっている。いずれにしろ、そうした対称式を「単型対称式」と呼ぶ ([代数学講義改訂新版] p.139 参照。ただし、そこでは「単型の対称式」になっている)。本稿で扱う対称式は、単型対称式の整係数多項式である。

そこで、基本形の単項式 $x_{i_{1}}^{e_{1}}x_{i_{2}}^{e_{2}}x_{i_{3}}^{e_{3}}x_{i_{4}}^{e_{4}}$ と同型であるが、その具体的な形に任意性を有するものを $[x_{i_{1}}^{e_{1}}x_{i_{2}}^{e_{2}}x_{i_{3}}^{e_{3}}x_{i_{4}}^{e_{4}}]$ で表すことにする。そして、$x_{i_{1}}^{e_{1}}x_{i_{2}}^{e_{2}}x_{i_{3}}^{e_{3}}x_{i_{4}}^{e_{4}}$ と同型の単項式が $n$ 個あって、その総和が対称式になっている時、その総和を $n \otimes{[x_{i_{1}}^{e_{1}}x_{i_{2}}^{e_{2}}x_{i_{3}}^{e_{3}}x_{i_{4}}^{e_{4}}]}$ と記することにする。

この記法を、以下の基本対称式に適用するなら、${}_n\mathrm{C}_{m}$ を二項係数として


\begin{align*}
 &\frac{a_{1}}{a_{0}}=-{}_4\mathrm{C}_{1}\otimes[x_{1}]=-4\otimes[x_{1}]\\
 &\frac{a_{2}}{a_{0}}={}_4\mathrm{C}_{2}\otimes[x_{1}x_{2}]=6\otimes[x_{1}x_{2}]\\
 &\frac{a_{3}}{a_{0}}=-{}_4\mathrm{C}_{3}\otimes[x_{1}x_{2}x_{3}]=-4\otimes[x_{1}x_{2}x_{3}]\\
 &\frac{a_{4}}{a_{0}}={}_4\mathrm{C}_{4}[x_{1}x_{2}x_{3}x_{4}]=[x_{1}x_{2}x_{3}x_{4}]=x_{1}x_{2}x_{3}x_{4}\\
\end{align*}

が成り立つ (4変数 $x_{1},x_{2},x_{3},x_{4}$ を基礎とするなら $x_{1}x_{2}x_{3}x_{4}$ は、単独で対称式になっていることに注意)。

以下では、基本形の単項式を、$x_{1},x_{2},x_{3},x_{4}$ の積を添え字の昇順、指数の降順に並べた

\[
 x_{1}^{e_{1}}x_{2}^{e_{2}}x_{3}^{e_{3}}x_{4}^{e_{4}} \qquad (e_{1}{\geq}e_{2}{\geq}e_{3}{\geq}e_{4}{\geq}0)
\]

を以って代表させることにする。

この記法を使うなら、基本形の範囲内にあっては、4変数 $x_{1},x_{2},x_{3},x_{4}$ の単項式は

  1. 1次: $[x_{1}]$ の1種類
  2. 2次: $[x_{1}x_{2}]$, $[x_{1}^{2}]$ の2種類
  3. 3次: $[x_{1}x_{2}x_{3}]$, $[x_{1}^{2}x_{2}]$ 及び $[x_{1}^{3}]$ の3種類
  4. 4次: $x_{1}x_{2}x_{3}x_{4}$, $[x_{1}^{2}x_{2}x_{3}]$, $[x_{1}^{2}x_{2}^{2}]$ 及び $[x_{1}^{3}x_{2}]$, $[x_{1}^{4}]$ の5種類
  5. 6次: $[x_{1}^{2}x_{2}^{2}x_{3}x_{4}]$, $[x_{1}^{2}x_{2}^{2}x_{3}^{2}]$, $[x_{1}^{3}x_{2}x_{3}x_{4}]$, $[x_{1}^{3}x_{2}^{2}x_{3}]$ 及び $[x_{1}^{3}x_{2}^{3}]$, $[x_{1}^{4}x_{2}x_{3}]$, [x_{1}^{4}x_{2}^{2}], [x_{1}^{5}x_{2}], $[x_{1}^{6}]$ の9種類
に限られることが分かる。ただし、7次以上の単項式は当然だが、5次の単項式、及び $[x_{1}^{3}]$, $[x_{1}^{3}x_{2}]$, $[x_{1}^{4}]$, 及び $[x_{1}^{3}x_{2}^{3}]$, $[x_{1}^{4}x_{2}x_{3}]$, [x_{1}^{4}x_{2}^{2}], [x_{1}^{5}x_{2}], $[x_{1}^{6}]$ の形式の単項式は、以下登場しない。

このうち


\begin{align*}
 &x_{1}+x_{2}+x_{3}+x_{4} = 4{\otimes}[x_{1}] = -\frac{a_{1}}{a_{0}}\\
 &x_{1}x_{2}+x_{1}x_{3}+x_{1}x_{4}+x_{2}x_{3}+x_{2}x_{4}+x_{3}x_{4} = 6{\otimes}[x_{1}x_{2}] = \frac{a_{2}}{a_{0}}\\
 &x_{1}x_{2}x_{3}+x_{1}x_{2}x_{4}+x_{1}x_{3}x_{4}+x_{2}x_{3}x_{4}+ = 4{\otimes}[x_{1}x_{2}x_{3}] = -\frac{a_{3}}{a_{0}}\\
 &x_{1}x_{2}x_{3}x_{4} = \frac{a_{4}}{a_{0}}
\end{align*}

は既述の通り。

以下、単型対称式の幾つかに就いて、基本対称式で表していく。

${x_{1}^{2}}$ から得られる単型対称式 $4{\otimes}[x_{1}^{2}]$ を基本対称式で表すなら


\begin{align*}
 4{\otimes}[x_{1}^{2}] &= (4{\otimes}[x_{1}])^{2} - 2(6{\otimes}[x_{1}x_{2}])\\
                       &= \left(-\frac{a_{1}}{a_{0}}\right)^{2} - 2\left(\frac{a_{2}}{a_{0}}\right)\\
                       &= \frac{a_{1}^{2}}{a_{0}^{2}} - \frac{2a_{2}}{a_{0}}
\end{align*}

次に $[x_{1}^{2}x_{2}x_{3}]$ の形の単項式が幾つあるかというと、$[x_{1}^{2}x_{2}x_{3}]$ の形の単項式は、$[x_{1}x_{2}x_{3}]$ 形の単項式の各変数を選んで二乗することで得られるから、$[x_{1}x_{2}x_{3}]$ 形の単項式が4つあり、そのうちの各変数を選んで二乗する仕方が3通りあるから、全体として $4\times{3}=12$ 個になる。

従って、$[x_{1}^{2}x_{2}x_{3}]$ 形の異なる同型の項 12 個の総和が作る単型対称式 $12\otimes[x_{1}^{2}x_{2}x_{3}]$ を、$x_{1},x_{2},x_{3},x_{4}$ の基本対称式の多項式で表わすと


\begin{align*}
 12\otimes[x_{1}^{2}x_{2}x_{3}] &= (4{\otimes}[x_{1}])(4{\otimes}[x_{1}x_{2}x_{3}]) - 4x_{1}x_{2}x_{3}x_{4}\\
                                &= \left(-\frac{a_{1}}{a_{0}}\right)\left(-\frac{a_{3}}{a_{0}}\right) - 4\left(\frac{a_{4}}{a_{0}}\right)\\
                                &= \frac{a_{1}a_{3}}{a_{0}^{2}} - \frac{4a_{4}}{a_{0}}\\
\end{align*}

$[x_{1}^{2}x_{2}^{2}]$ の形の単項式は ${}_4\mathrm{C}_{2}=6$ 個ある。それらの総和が作る単型対称式 $6{\otimes}[x_{1}^{2}x_{2}^{2}]$


\begin{align*}
 &(6{\otimes}[x_{1}x_{2}])^{2} =\\
 &\quad (x_{1}x_{2}+x_{1}x_{3}+x_{1}x_{4}+x_{2}x_{3}+x_{2}x_{4}+x_{3}x_{4})\\
 &\qquad\qquad \times (x_{1}x_{2}+x_{1}x_{3}+x_{1}x_{4}+x_{2}x_{3}+x_{2}x_{4}+x_{3}x_{4})
\end{align*}

から見て取れるように

\begin{align*}
 6{\otimes}[x_{1}^{2}x_{2}^{2}] &= (6{\otimes}[x_{1}x_{2}])^{2} - 24{\otimes}[x_{1}^{2}x_{2}x_{3}] - 6x_{1}x_{2}x_{3}x_{4}\\
                                &= (6{\otimes}[x_{1}x_{2}])^{2} - 2(12{\otimes}[x_{1}^{2}x_{2}x_{3}]) - 6x_{1}x_{2}x_{3}x_{4}\\
                                &= \left(\frac{a_{2}}{a_{0}}\right)^{2} - 2\left(\frac{a_{1}a_{3}}{a_{0}^{2}} - \frac{4a_{4}}{a_{0}}\right) - 6\left(\frac{a_{4}}{a_{0}}\right)\\
                                &= \frac{a_{2}^{2} - 2a_{1}a_{3}}{a_{0}^{2}} + \frac{2a_{4}}{a_{0}}\\
\end{align*}

$[x_{1}^{2}x_{2}^{2}x_{3}x_{4}]$ の形の単項式は${}_4\mathrm{C}_{2}=6$ 個ある。


\begin{align*}
 6{\otimes}[x_{1}^{2}x_{2}^{2}x_{3}x_{4}] &= (6{\otimes}[x_{1}x_{2}])(x_{1}x_{2}x_{3}x_{4})\\
                                          &= \left(\frac{a_{2}}{a_{0}}\right)\left(\frac{a_{4}}{a_{0}}\right)\\
                                          &= \frac{a_{2}a_{4}}{a_{0}^{2}}\\
\end{align*}

$[x_{1}^{2}x_{2}^{2}x_{3}^{2}]$ の形の単項式は ${}_4\mathrm{C}_{3}=4$ 個ある。


\begin{align*}
 4{\otimes}[x_{1}^{2}x_{2}^{2}x_{3}^{2}] &= (4{\otimes}[x_{1}x_{2}x_{3}])^{2} - 12{\otimes}[x_{1}^{2}x_{2}^{2}x_{3}x_{4}]\\
                                       &= (4{\otimes}[x_{1}x_{2}x_{3}])^{2} - 2(6{\otimes}[x_{1}^{2}x_{2}^{2}x_{3}x_{4}])\\
                                       &= \left(-\frac{a_{3}}{a_{0}}\right)^{2} - 2\left(\frac{a_{2}a_{4}}{a_{0}^{2}}\right)\\
                                       &= \frac{a_{3}^{2}-2a_{2}a_{4}}{a_{0}^{2}}\\
\end{align*}

$[x_{1}^{3}x_{2}x_{3}x_{4}]$ の形の単項式は ${}_4\mathrm{C}_{1}=4$ 個ある。


\begin{align*}
 4{\otimes}[x_{1}^{3}x_{2}x_{3}x_{4}] &= (4{\otimes}[x_{1}^{2}])(x_{1}x_{2}x_{3}x_{4})\\
                                      &= \left(\frac{a_{1}^{2}}{a_{0}^{2}} - \frac{2a_{2}}{a_{0}}\right)\left(\frac{a_{4}}{a_{0}}\right)\\
                                      &= \frac{a_{1}^{2}a_{4}}{a_{0}^{3}} - \frac{2a_{2}a_{4}}{a_{0}^{2}}\\
\end{align*}

$[x_{1}^{3}x_{2}^{2}x_{3}]$ の形の単項式は $4!=24$ 個ある。


\begin{align*}
 24{\otimes}[x_{1}^{3}x_{2}^{2}x_{3}] &= (4{\otimes}[x_{1}])(6{\otimes}[x_{1}x_{2}])(4{\otimes}[x_{1}x_{2}x_{3}]) - (12{\otimes}[x_{1}^{3}x_{2}x_{3}x_{4}])\\
                                      &\qquad - (48{\otimes}[x_{1}^{2}x_{2}^{2}x_{3}x_{4}])- (12{\otimes}[x_{1}^{2}x_{2}^{2}x_{3}^{2}])\\
                                      &= (4{\otimes}[x_{1}])(6{\otimes}[x_{1}x_{2}])(4{\otimes}[x_{1}x_{2}x_{3}]) - 3(4{\otimes}[x_{1}^{3}x_{2}x_{3}x_{4}])\\
                                      &\qquad - 8(6{\otimes}[x_{1}^{2}x_{2}^{2}x_{3}x_{4}])- 3(4{\otimes}[x_{1}^{2}x_{2}^{2}x_{3}^{2}])\\
                                      &= \left(-\frac{a_{1}}{a_{0}}\right)\left(\frac{a_{2}}{a_{0}}\right)\left(-\frac{a_{3}}{a_{0}}\right) - 3\left(\frac{a_{1}^{2}a_{4}}{a_{0}^{3}} - \frac{2a_{2}a_{4}}{a_{0}^{2}}\right)\\
                                      & \qquad - 8\left(\frac{a_{2}a_{4}}{a_{0}^{2}}\right) - 3\left(\frac{a_{3}^{2}-2a_{2}a_{4}}{a_{0}^{2}}\right)\\
                                      &= \frac{a_{1}a_{2}a_{3}-3a_{1}^{2}a_{4}}{a_{0}^{3}} + \frac{4a_{2}a_{4}-3a_{3}^2}{a_{0}^{2}}\\
\end{align*}

この計算で、$[x_{1}^{3}x_{2}x_{3}x_{4}]$ の型の項は、$x_{1}.x_{1}x_{2}.x_{1}x_{3}x_{4}$ の型の積に由来する $4{\times}3{\times}1=12$ 個であり、$[x_{1}^{2}x_{2}^{2}x_{3}^{2}]$ の型の項は $x_{1}.x_{2}x_{3}.x_{1}x_{2}x_{3}$ の型の積に由来する $4{\times}3{\times}1=12$ 個であるのは容易に分かるが、$[x_{1}^{2}x_{2}^{2}x_{3}x_{4}]$ の型の項は、$x_{1}.x_{1}x_{2}.x_{2}x_{3}x_{4}$ の型の積に由来する $4{\times}3{\times}1=12$ 個、$x_{1}.x_{2}x_{3}.x_{1}x_{2}x_{4}$ の型の積に由来する $4{\times}3{\times}1=12$ 個、 $x_{1}.x_{2}x_{4}.x_{1}x_{2}x_{3}$ の型の積に由来する $4{\times}3{\times}1=12$ 個の他に、</span>$x_{1}.x_{2}x_{3}.x_{2}x_{3}x_{4}$ の型の積に由来する $4{\times}3{\times}1=12$ 個が存在することに注意すべきである。結果として $[x_{1}^{2}x_{2}^{2}x_{3}x_{4}]$ の型の項は $12{\times}4=48$ 個である。

これらの結果を踏まえて、$S_{1},S_{2},S_{3}$ の計算をしていく。これらが、$x_{1},x_{2},x_{3},x_{4}$ の整係数の対称式であるから、基本多項式の整係数の多項式として一意に表わされることに注意しておく。

まず、$S_{1}\equiv{V_{1}+V_{2}+V_{3}}$ は、$x_{1},x_{2},x_{3},x_{4}$ は2次多項式であり、個々の変数に就いては1次になっている。従って、$6{\otimes}[x_{1}x_{2}]$ の整数倍になっているが、その項数は $4{\times}3=12$ だから


\[
 S_{1} = 2(6{\otimes}[x_{1}x_{2}]) = 2\left(\frac{a_{2}}{a_{0}}\right) = \frac{2a_{2}}{a_{0}}
\]

である。

$S_{2}{\equiv}V_{1}V_{2}+V_{2}V_{3}+V_{3}V_{1}$ は、$x_{1},x_{2},x_{3},x_{4}$ は4次多項式であり、個々の変数の最高次数は 2 なので、項として可能であるのは $x_{1}x_{2}x_{3}x_{4}$$[x_{1}^{2}x_{2}x_{3}]$$[x_{1}^{2}x_{2}^{2}]$ との3種類である。

例えば、


\begin{align*}
 V_{1}V_{2} &= (x_{1}+x_{2})(x_{3}+x_{4})(x_{1}+x_{3})(x_{2}+x_{4})\\
            &= (x_{1}x_{3}+x_{1}x_{4}+x_{2}x_{3}+x_{2}x_{4})(x_{1}x_{2}+x_{1}x_{4}+x_{2}x_{3}+x_{3}x_{4})
\end{align*}

を参考にして、それぞれを数え上げると $S_{2}$ の中には $x_{1}x_{2}x_{3}x_{4}$ の項が6個、$[x_{1}^{2}x_{2}x_{3}]$ の型の項が36個、$[x_{1}^{2}x_{2}^{2}]$ の型の項が6個あることが分かる。従って

\begin{align*}
 S_{2} &= 6{\otimes}[x_{1}x_{2}x_{3}x_{4}] + 36{\otimes}[x_{1}^{2}x_{2}x_{3}] + 6{\otimes}[x_{1}^{2}x_{2}^{2}]\\
       &= 6{\otimes}[x_{1}x_{2}x_{3}x_{4}] + 3(12{\otimes}[x_{1}^{2}x_{2}x_{3}]) + 6{\otimes}[x_{1}^{2}x_{2}^{2}]\\
       &= 6\left(\frac{a_{4}}{a_{0}}\right) + 3\left(\frac{a_{1}a_{3}}{a_{0}^{2}} - \frac{4a_{4}}{a_{0}}\right) + \left(\frac{a_{2}^{2}-2a_{1}a_{3}}{a_{0}^{2}} + \frac{2a_{4}}{a_{0}}\right)\\
       &= \frac{a_{2}^{2} + a_{1}a_{3}}{a_{0}^{2}} - \frac{4a_{4}}{a_{0}}
\end{align*}

同様に、$S_{3}{\equiv}V_{1}V_{2}V_{3}$ は6次多項式であり、個々の変数の最高次数は 3 なので、項として可能であるのは $[x_{1}^{3}x_{2}x_{3}x_{4}]$$[x_{1}^{3}x_{2}^{2}x_{3}]$$[x_{1}^{2}x_{2}^{2}x_{3}x_{4}]$$[x_{1}^{2}x_{2}^{2}x_{3}^{2}]$


\begin{align*}
  S_{3} &= \{(x_{1}+x_{2})(x_{1}+x_{3})(x_{1}+x_{4})\}\{(x_{2}+x_{3})(x_{2}+x_{4})(x_{3}+x_{4})\}\\
        &= \{x_{1}^{3} + (x_{2}+x_{3}+x_{4})x_{1}^{2} + (x_{2}x_{3}+x_{2}x_{4}+x_{3}x_{4})x_{1} + x_{2}x_{3}x_{4}\}\\   
        &\qquad \times\{x_{2}^{2}x_{3}+x_{2}x_{3}^{2}+x_{2}^{2}x_{4}+x_{2}x_{4}^{2}+x_{3}^{2}x_{4}+x_{3}x_{4}^{2}+2x_{2}x_{3}x_{4}\}
\end{align*}

を見るならば、4種類の項がすべて含まれることが分かる。更に、$x_{1}^{3}x_{2}x_{3}x_{4}$ の係数は 2 になるから、$[x_{1}^{3}x_{2}x_{3}x_{4}]$ の型の項は8個、$x_{1}^{2}x_{2}^{2}x_{3}^{2}$ の係数も 2 だから、$[x_{1}^{2}x_{2}^{2}x_{3}^{2}]$ の型の項も8個であることが分かる。また、積の中で、$x_{1}^{2}x_{2}^{2}x_{3}x_{4}$ となるのは

\[
  \{x_{2}x_{1}^{2}\}\{2x_{2}x_{3}x_{4}\} + \{x_{3}x_{1}^{2}\}\{x_{2}^{2}x_{4}\} + \{x_{4}x_{1}^{2}\}\{x_{2}^{2}x_{3}\} = 4x_{1}^{2}x_{2}^{2}x_{3}x_{4} 
\]
だけである。これから $[x_{1}^{2}x_{2}^{2}x_{3}x_{4}]$ の型の項は $6{\times}4 = 24$ 個あることが分かる。

従って、


\[
  S_{3} = 2(4{\otimes}[x_{1}^{3}x_{2}x_{3}x_{4}]) + K(24{\otimes}[x_{1}^{3}x_{2}^{2}x_{3}]) + 4(6{\otimes}[x_{1}^{2}x_{2}^{2}x_{3}x_{4}]) + 2(4{\otimes}[x_{1}^{2}x_{2}^{2}x_{3}^{2}])\\
\]

を満たす正整数 $K$ が存在することが分かるが、これから項数を抽出すると

\[
 64=8+24K+24+8
\]

が成り立つので、$K=1$ でなければならない。

結局


\begin{align*}
  S_{3} &= 2(4{\otimes}[x_{1}^{3}x_{2}x_{3}x_{4}]) + 24{\otimes}[x_{1}^{3}x_{2}^{2}x_{3}] + 4(6{\otimes}[x_{1}^{2}x_{2}^{2}x_{3}x_{4}]) + 2(4{\otimes}[x_{1}^{2}x_{2}^{2}x_{3}^{2}])\\
        &= 2\left(\frac{a_{1}^{2}a_{4}}{a_{0}^{3}} - \frac{2a_{2}a_{4}}{a_{0}^{2}}\right) + \left(\frac{a_{1}a_{2}a_{3}-3a_{1}^{2}a_{4}}{a_{0}^{3}} + \frac{4a_{2}a_{4}-3a_{3}^2}{a_{0}^{2}}\right)\\
        &\qquad  + 4\left(\frac{a_{2}a_{4}}{a_{0}^{2}}\right) + 2\left(\frac{a_{3}^{2}-2a_{2}a_{4}}{a_{0}^{2}}\right)\\
        &= \frac{a_{1}a_{2}a_{3}-a_{1}^{2}a_{4}}{a_{0}^{3}} - \frac{a_{3}^{2}}{a_{0}^{2}}
\end{align*}

このようにして


\begin{align*}
 &A_{1}=a_{0}S_{1}=a_{0}\left(\frac{2a_{2}}{a_{0}}\right)=2a_{2}\\
 &A_{2}=a_{0}^{2}S_{2}=a_{0}^{2}\left(\frac{a_{2}^{2} + a_{1}a_{3}}{a_{0}^{2}} - \frac{4a_{4}}{a_{0}}\right)=a_{2}^{2} + a_{1}a_{3}-4a_{0}a_{4}\\
 &A_{3}=a_{0}^{3}S_{3}=a_{0}^{3}\left(\frac{a_{1}a_{2}a_{3}-a_{1}^{2}a_{4}}{a_{0}^{3}} - \frac{a_{3}^{2}}{a_{0}^{2}}\right)=a_{1}a_{2}a_{3}-a_{1}^{2}a_{4} - a_{0}a_{3}^{2}
\end{align*}
が成り立っていることが分かった。

改めて、方程式の形で表すと


\begin{align*}
 \lambda^{3} &-A_{1}\lambda^{2} + A_{2}\lambda - A_{3}\\
             &= \lambda^{3} - 2a_{2}\lambda^{2} + (-4a_{0}a_{4} + a_{2}^{2} + a_{1}a_{3})\lambda + a_{0}a_{3}^{2} + a_{1}^{2}a_{4} - a_{1}a_{2}a_{3} = 0
\end{align*}

である。

[高木貞治]著 [代数学講義改訂新版] (1965年 共立出版 ISBN 978-4-320-01000-0)

| | コメント (0) | トラックバック (0)
|

高木貞治 [代数学講義改訂新版] p.194 での4次方程式の3次分解方程式の根の表記の瑕疵

[高木貞治]著 [代数学講義改訂新版] (1965年 共立出版 ISBN 978-4-320-01000-0) p.194 では、4次方程式


\[
 a_{0}x^{4}+a_{1}x^{3}+a_{2}x^{2}+a_{3}x+a_{4} = 0
\]
と、その根 $x_{1},x_{2},x_{3},x_{4}$ に就いて、次のような記載がある。

四次方程式 
\[
 a_{0}x^{4}+a_{1}x^{3}+a_{2}x^{2}+a_{3}x+a_{4} = 0
\]
を解くことは, 連立二元二次方程式


\begin{align*}
&x^{2} = y \\
&a_{0}y^{2}+a_{1}xy+a_{2}y+a_{3}x+a_{4} = 0
\end{align*}
から $x$ を求めるのと同じである. この場合 (3) は
\begin{equation*}
すなわち

\[
 \lambda^{3} - 2a_{2}\lambda^{2} + (-4a_{0}a_{4}+a_{2}^{2}+a_{1}a_{3})\lambda + a_{0} a_{3}^{2} + a_{1}^{2}a_{4} - a_{1}a_{2}a_{3} = 0
\]
になる. これは $(x_{1}+x_{2})(x_{3}+x_{4}), (x_{1}+x_{3})(x_{2}+x_{4}), (x_{1}+x_{4})(x_{2}+x_{3})$ を根とする三次分解方程式である。

[以下、引用者 (ゑ) 補足]
ただし、ここで (3) とあるのは、[代数学講義改訂新版] pp.192-193 に見られるように、連立2元2次方程式

</p>

<p>\begin{align*}
 &F= ax^{2} +2hxy +by^{2} +2gx +2fy +c =0\\
 &G= a^{\prime}x^{2} +2h^{\prime}xy +b^{\prime}y^{2} +2g^{\prime} +2f^{\prime}y +c^{\prime} =0
\end{align*}
から導かれる2次式
\begin{align*}
 F+{\lambda}G = &(a+{\lambda}a^{\prime})x^{2} + 2(h+{\lambda}h^{\prime})xy + (b+{\lambda}b^{\prime})y^{2}\\
                &\qquad +2(g+{\lambda}g^{\prime})x + 2(f+{\lambda}f^{\prime})y + (c+{\lambda}c^{\prime})
\end{align*}
が2つの1次式の積に分解されるための条件式

\begin{equation*}
\begin{vmatrix}
 a+{\lambda}a^{\prime} &h+{\lambda}h^{\prime}  &g+{\lambda}g^{\prime}  \\
&&\\
 h+{\lambda}h^{\prime} &b+{\lambda}b^{\prime}  &f+{\lambda}f^{\prime}  \\
&&\\
 g+{\lambda}g^{\prime} &f+{\lambda}f^{\prime}  &c+{\lambda}c^{\prime}
\end{vmatrix} 
=0
\end{equation*}
を指す。 [引用者補足終了。]

しかし、上記引用部分の最後の箇所は間違っている。単純なケアレスミスだと思うが、「三次分解方程式の根」のそれぞれは、係数 $a_{0}$ を乗じて


\[
 a_{0}(x_{1}+x_{2})(x_{3}+x_{4}), a_{0}(x_{1}+x_{3})(x_{2}+x_{4}), a_{0}(x_{1}+x_{4})(x_{2}+x_{3})
\]
としなければならない。

| | コメント (0) | トラックバック (0)
|

メモ: H.フランダース「微分形式の理論」第X章 問題7「サンヴナンの適合条件」(p.234) の前提に就いて。付け足し: 第X章 問題2 及び 問題3 (p.233) に就いての個人的述懐

以前、H.フランダース著「微分形式の理論」(1967年岩波書店刊。訳: 岩堀長慶) を通読したことがある。

著者自身が [まえがき] で認めているように、本書は、「微分形式」と云う「非常に偉大な力をもった新しい道具を, 工学者や物理学者のお役に立て」(p.vi) ることを主目的としている (「本書の材料を数学科の大学院学生に, 現代微分幾何学への入門として推薦することを躊躇はしない」(p.vii)とも豪語しているが・・・)。

原著発行 (1963年) から、半世紀以上経過しているため、的外れな評価になる可能性が高いことを認めつつも、それを棚上げして言うなら、本書の利点と、読んでいて感じる「歯がゆさ」とは、両方とも、この点に集約されるといってよいだろう。

ただし、「無いものねだり」を諦めるなら、微分形式の具体的利用の見本帖として充分に「お役に立つ」。

理論物理・数学の著作ではありがちなことだが、校正ミスが目立つ (著者・訳者又はその補助者が、よほど気を入れないと、これは防げまい。また、理論物理・数学の著作は、「他人の目」で見ると、校正ミスや計算の誤りが、かなり明瞭に分かる、と云う側面もある)。

本書では、p.168 の下から6行目に於けるように、「楕円的」とすべきところを「随円的」とするような「惜しいね!」とでも言うしかない校正ミスばかりでなく、数式内部でのミスも二・三にとどまらないので (原書由来かもしれないが、未確認)、まとめた方が良いのだろうが、そこまで時間をかけることをあるまいと云う気が頻りにするするのでやめておく。

一応、原書 H. Flanders "Differential Forms with Applications to the Physical Sciences" (Dover, 1989) の [Google ブックス] のページのリンクを貼っておく。

ただし、校正ミスのチェックには向いていないように見えるので、それ以上のことことはしないでおく。

それよりも、本題である p.234 の [問題X-7] に急ごう。問題文は次のとおりである。

7. $a_{ij}$ 達を $x^{1},x^{2},\cdots,x^{n}$$n^{2}$ 個の函数とする. このとき積分可能条件

\[
\partialsecondmixed{a_{ij}}{x^{k}}{x^{l}} - \partialsecondmixed{a_{ik}}{x^{j}}{x^{l}} =
\partialsecondmixed{a_{lj}}{x^{k}}{x^{i}} - \partialsecondmixed{a_{lk}}{x^{j}}{x^{i}}
\]
が, 函数 $u_{1},\cdots,u_{n}$ が存在して
\[
 a_{ij} = \inverse{2}\left(\pdiff{u_{i}}{x^{j}}+\pdiff{u_{j}}{x^{i}}\right)
\]
を満たすための必要十分条件であることを証明せよ. $n=3$ および $n=2$ の場合を調べよ. (Saint-Venant による. Love[18], 49頁参照.)

ちなみに、この Love[18] の、[Google ブックス] は "A Treatise on the Mathematical Theory of Elasticity - A. E. H. Love - Google ブックス" で見られる。

必要条件になっていることを示すのは容易である。単に 下の式の添え字を適宜変更して、上の式の各項に代入するなら、左辺は

\begin{align*}
 \partialsecondmixed{a_{ij}}{x^{k}}{x^{l}} - \partialsecondmixed{a_{ik}}{x^{j}}{x^{l}} &=
\inverse{2}\left(\cancelto{A}{\partialthirdmixed{u_{i}}{x^{k}}{x^{l}}{x^{j}}} - \partialthirdmixed{u_{j}}{x^{k}}{x^{l}}{x^{i}}\right) -
\inverse{2}\left(\cancelto{A}{\partialthirdmixed{u_{i}}{x^{j}}{x^{l}}{x^{k}}} - \partialthirdmixed{u_{k}}{x^{j}}{x^{l}}{x^{i}}\right)\\
&= - \inverse{2}\left(\partialthirdmixed{u_{j}}{x^{k}}{x^{l}}{x^{i}} - \partialthirdmixed{u_{k}}{x^{j}}{x^{l}}{x^{i}}\right)
\end{align*}

右辺は

\begin{align*}
 \partialsecondmixed{a_{lj}}{x^{k}}{x^{i}} - \partialsecondmixed{a_{lk}}{x^{j}}{x^{i}} &=
\inverse{2}\left(\cancelto{B}{\partialthirdmixed{u_{l}}{x^{k}}{x^{i}}{x^{j}}} - \partialthirdmixed{u_{j}}{x^{k}}{x^{i}}{x^{l}}\right) -
\inverse{2}\left(\cancelto{B}{\partialthirdmixed{u_{l}}{x^{j}}{x^{i}}{x^{k}}} - \partialthirdmixed{u_{k}}{x^{j}}{x^{i}}{x^{l}}\right)\\
&= - \inverse{2}\left(\partialthirdmixed{u_{j}}{x^{k}}{x^{i}}{x^{l}} - \partialthirdmixed{u_{k}}{x^{j}}{x^{i}}{x^{l}}\right)
\end{align*}
となるから (ストライクスルーして同じ文字 $A$ 又は $B$ が付されている項は、相殺する)、両辺は等しい。

しかし、十分条件の方を確認しようとして、私は行き詰まってしまった。何が原因かは、明瞭だった。函数 $a_{ij}$ が添え字に就いて対称、つまり、$a_{ij}=a_{ji}$ であることが使えないと、式の変形が前進しないのだ。

$a_{ij}$ が添え字に就いて対称であるのは、第2の表式を見れば明らかだ。しかし、原状の設問では、第1の式から、$a_{ij}$ の添え字に就いての対称性も導出することを要求していることになる。しばらく途方に暮れましたね。

上記 [Google ブックス] の Love の本の、 該当箇所を読んでみたけれど、どうもピンとこなかったのだが、もし $a_{ij}$ に対応するのが、歪テンソルだとすると、これが添え字に対して対称なのは、物理的な与件として前提に含まれるとして良い。

そこで、今度は "Saint-Venant" を google にかけて、ネットを右往左往していくと、結局、次のページが見つかった。

Saint-Venant's compatibility condition - Wikipedia (last modified on 23 February 2015, at 19:08.)

そこに曰く、

For a symmetric rank 2 tensor field $F$ in n-dimensional Euclidean space the integrability condition takes the form of the vanishing of the Saint-Venant's tensor $W(F)$ defined by

\[
W_{ijkl} = \frac{\partial^2 F_{ij}}{\partial x_k \partial x_l} + 
\frac{\partial^2 F_{kl}}{\partial x_i \partial x_j} - \frac{\partial^2 F_{il}}{\partial x_j \partial x_k} -\frac{\partial^2 F_{jk}}{\partial x_i \partial x_l}
\]

The result that, on a simply connected domain $W=0$ implies that strain is the symmetric derivative of some vector field, was first described by Barré de Saint-Venant in 1864 and proved rigorously by Beltrami in 1886.

n 次元ユークリッド空間における対称2階テンソル場 $F$ に対する積分可能条件は

\[
W_{ijkl} = \frac{\partial^2 F_{ij}}{\partial x_k \partial x_l} + 
\frac{\partial^2 F_{kl}}{\partial x_i \partial x_j} - \frac{\partial^2 F_{il}}{\partial x_j \partial x_k} -\frac{\partial^2 F_{jk}}{\partial x_i \partial x_l}
\]
で定義されるサンヴナン・テンソル $W(F)$ が消えると云う形で言い表される。

この結果は、単連結領域上で $W=0$ が成立しているなら、歪は、何らかのベクトル場の対称微分となっていることを意味するものであるが、1864年にバレ・ド・サンヴナンにより言及され、そして、1886年になって、ベルトラミにより厳密に証明された。

これを見ても、$a_{ij}$ が添え字に就いて対称であることを、前提として含めるべきことが分かるから、以下、これに従って、「十分条件」部分の確認をすることにする。

そこで

\[
 \omega_{jk} := \sum_{i}\left(\pdiff{a_{ij}}{x^{k}}-\pdiff{a_{ik}}{x^{j}}\right)dx^{i}
\]
と云う 1 形式を考える。

この $\omega_{jk}$ が添え字に就いて反対称 (つまり $\omega_{jk}+\omega_{kj}=0$ である) ことに注意。

すると、まさに上記第1の式により

\[
 d\omega_{jk} = \inverse{2}\sum_{i,l}\left\{\pdiff{}{x^{l}}\left(\pdiff{a_{ij}}{x^{k}}-\pdiff{a_{ik}}{x^{j}}\right) - \pdiff{}{x^{i}}\left(\pdiff{a_{lj}}{x^{k}}-\pdiff{a_{lk}}{x^{j}}\right)\right\}dx^{l}{\wedge}dx^{i} = 0
\]
となる。従って、ポアンカレの補題の逆命題 (本書では pp.34-37 特に p.37 を参照) により、ある 0 形式、つまり、函数 $f_{jk}$ が存在して
\[
 \omega_{jk} = df_{jk}
\]
が成立する。

\[
 d(f_{jk}+f_{kj}) = df_{jk}+df_{kj} = \omega_{jk}+\omega_{kj}=0
\]
だから $\displaystyle{f_{jk}+f_{kj}}$ は定数になる。それを $\displaystyle{c_{jk}}$ と表すことにする。

もし $\displaystyle{c_{jk} \neq 0}$ であったなら、$\displaystyle{f_{jk}-\inverse{2}c_{jk},f_{kj}-\inverse{2}{c}_{jk}}$ を、それぞれ改めて $f_{jk},f_{kj}$ と置くことで、

\[
 f_{jk}+f_{kj}=0
\]
が成り立っているとして良い。つまり、$f_{jk}$ は、添え字に就いて反対称だとすることができる。

ここで 1形式

\[
 p_{i} :=\sum_{j}(a_{ij}+f_{ij})dx^{j}
\]
を考えると
\begin{align*}
 dp_{i} &=\sum_{j}(da_{ij}{\wedge}dx^{j} + df_{ij}{\wedge}dx^{j})\\
        &=\sum_{j}\left(da_{ij}{\wedge}dx^{j} + \omega_{ij}{\wedge}dx^{j}\right)\\
        &=\sum_{l,j}\left(\pdiff{a_{ij}}{x^{l}}dx^{l}{\wedge}dx^{j} + \left(\pdiff{a_{li}}{x^{j}}-\pdiff{a_{lj}}{x^{i}}\right)dx^{l}{\wedge}dx^{j}\right)\\
        &=\sum_{l,j}\left(\pdiff{a_{il}}{x^{j}}dx^{j}{\wedge}dx^{l} + \left(\pdiff{a_{li}}{x^{j}}-\pdiff{a_{lj}}{x^{i}}\right)dx^{l}{\wedge}dx^{j}\right)\\
        &=\sum_{l,j}\left(\xcancel{-\pdiff{a_{il}}{x^{j}} + \pdiff{a_{li}}{x^{j}}}\right)dx^{l}{\wedge}dx^{j} - \inverse{2}\sum_{l,j}\left(\xcancel{\pdiff{a_{lj}}{x^{i}}-\pdiff{a_{jl}}{x^{i}}}\right)dx^{l}{\wedge}dx^{j}\\
        &=0
\end{align*}

再び、ポアンカレの補題の逆命題により、ある函数 $u^{i}$ が存在して

\[
 p_{i} = du_{i} = \sum_{j}\pdiff{u^{i}}{x^{j}}dx^{j}
\]
が成り立つ。つまり
\[
 \sum_{j}(a_{ij}+f_{ij})dx^{j} = \sum_{j}\pdiff{u^{i}}{x^{j}}dx^{j}
\]
と云うことだから、全ての $i,j$ の組み合わせに対して
\[
 a_{ij}+f_{ij} = \pdiff{u^{i}}{x^{j}}
\]
が言える。ここで、$i$$j$ とを交換すると
\[
 a_{ji}+f_{ji} = \pdiff{u^{j}}{x^{i}}
\]

ここで辺々足し合わせると、添え字に就いて $a_{ij}$ が対称、$f_{ij}$ が反対称だから

\[
 2a_{ij} = \pdiff{u^{i}}{x^{j}} + \pdiff{u^{j}}{x^{i}}
\]
つまり
\[
 a_{ij} = \inverse{2}\left(\pdiff{u^{i}}{x^{j}} + \pdiff{u^{j}}{x^{i}}\right)
\]
が得られる。

p.233 の [問題X-3] 及び [問題X-2] に就いても書いておきたいことがある。

その p.233 の [問題X-3] とは、

さて, これらのことを Lie のブラケットと関係づける次の公式を証明せよ.
\[
 (d\sigma, \mathrm{v}{\wedge}\mathrm{w}) + (\sigma,[\mathrm{v},\mathrm{w}]) = \mathrm{v}{(\sigma,\mathrm{w})} - \mathrm{w}{(\sigma,\mathrm{v})}
\]
と云うものだ。

今回、この原稿を書くに際して、関連個所を読み直そうとしている途中、たまたま、以前通読した際この問題の一つ前 [問題X-2] の題意を誤解してており、その誤解の混乱の中で、[問題X-3] に就いても計算間違い (正当な根拠のない式の変形) をしていたことに気が付いたからだ。

負け惜しみを言うなら、今でも、 [問題X-2] の題意は、曖昧だと思う。[問題X-2] は、2つの 1形式 $\displaystyle{\sigma_{1}}$$\displaystyle{\sigma_{2}}$ との外積 $\displaystyle{\sigma_{1}{\wedge}\sigma_{2}}$ と、2つのベクトル場 $\displaystyle{\mathrm{v}_{1}}$$\displaystyle{\mathrm{v}_{2}}$ との外積 $\displaystyle{\mathrm{v}_{1}{\wedge}\mathrm{v}_{2}}$ との間の「内積」(「微分形式の理論」で用いられている用語) $\displaystyle{(\sigma_{1}{\wedge}\sigma_{2},\mathrm{v}_{1}{\wedge}\mathrm{v}_{2})}$

\[
 (\sigma_{1}{\wedge}\sigma_{2},\mathrm{v}_{1}{\wedge}\mathrm{v}_{2}) = 
\begin{vmatrix}
 (\sigma_{1},\mathrm{v}_{1}) & (\sigma_{1},\mathrm{v}_{2}) \\
 (\sigma_{2},\mathrm{v}_{1}) & (\sigma_{2},\mathrm{v}_{2}) 
\end{vmatrix}
\]
で「与えられることを示せ」と云うものだが、この設問の意図するところが、「内積」が、この式により well-defined (つまり、右辺が、局所座標系の取り方によらない) であると云うことなのか、それとも、本書では [問題X-1] (p.232-233) でようやく明示されたベクトル場と 1形式との双対性の延長から構成される、2ベクトルと2形式の双対の1性質としての表式なのか、捕えがたいものがある。

まぁ、いづれにしろ、計算間違いをする言い訣にはならないのは分かっている。

自戒を込めて、[問題X-3] の解として、今回行った計算内容を示しておく。

ほぼ機械的な計算で済むが、その前に背景を説明しておくと $\sigma$ は 1形式、$\mathrm{v},\mathrm{w}$ はベクトル場 (1ベクトル場) である。

従って、(本稿においてすでに利用されている記号を含めて、改めて明示的に定義すると) n次元多様体の、任意の一点に着目して、その局所座標系が $\displaystyle{(x^{i})_{1\leq{i}\leq{n}}}$ で表されるとする。これに対応する接ベクトル空間の基底を $\displaystyle{(\partial{}/\partial{x^{i}})_{1\leq{i}\leq{n}}}$ (以下、これを $\displaystyle{(\partial_{i})_{1\leq{i}\leq{n}}}$ と書くことにする) 、その余接ベクトル空間 (1形式のなす線形空間) における双対基底を $\displaystyle{(dx^{i})_{1\leq{i}\leq{n}}}$ とすると、次の関係式を満たす、多様体上の函数 $\displaystyle{\{s_{i}\}_{1\leq{i}\leq{n}},\{v^{i}\}_{1\leq{i}\leq{n}},\{w^{i}\}_{1\leq{i}\leq{n}}}$ が存在する。

\[
 \sigma \equiv \sum_{i}s_{i}dx^{i}, \mathrm{v} \equiv \sum_{i}v^{i}\partial_{i}, \mathrm{w} \equiv \sum_{i}w^{i}\partial_{i}
\]

さらにここで、[問題X-3] がらみで [問題X-2] の結果の肝心な点を言っておくと ($\displaystyle{\delta}$ は勿論クロネッカーのデルタ)、

\[
 \left(dx^{l}{\wedge}dx^{m}, \partial_{j}{\wedge}\partial_{k}\right) =
\begin{vmatrix}
 \partial_{j}x^{l} & \partial_{k}x^{l} \\
 \partial_{j}x^{m} & \partial_{k}x^{m} 
\end{vmatrix} =
\begin{vmatrix}
 \delta_{j}^{l} & \delta_{k}^{l} \\
 \delta_{j}^{m} & \delta_{k}^{m} 
\end{vmatrix}
= \delta^{l}_{j}\delta^{m}_{k}-\delta^{l}_{k}\delta^{m}_{j}
\]

これが、後出の計算中で、用いられているのである。

さて [問題X-3] の式の左辺 $\displaystyle{(d\sigma, \mathrm{v}{\wedge}\mathrm{w}) + (\sigma,[\mathrm{v},\mathrm{w}])}$ に上記の $\displaystyle{\sigma, \mathrm{v}, \mathrm{w}}$ の表式を代入すると

\begin{align*}
 (d\sigma, &\mathrm{v}{\wedge}\mathrm{w}) + (\sigma,[\mathrm{v},\mathrm{w}]) \\
           &= \left(d\left(\sum_{i}s_{i}dx^{i}\right),\left(\sum_{j}v^{j}\partial_{j}\right)\wedge\left(\sum_{k}w^{k}\partial_{k}\right)\right) 
              + \left(\sum_{i}s_{i}dx^{i},\left[\sum_{j}v^{j}\partial_{j},\sum_{k}w^{k}\partial_{k}\right]\right) \\
           &= \left(\inverse{2}\sum_{l,m}\left(\partial_{l}s_{m}-\partial_{m}s_{l}\right)dx^{l}{\wedge}dx^{m}, \inverse{2}\sum_{j,k}\left(v^{j}w^{k}-v^{k}w^{j}\right)\partial_{j}{\wedge}\partial_{k}\right)\\
           &\qquad + \left(\sum_{i}s_{i}dx^{i},\sum_{j,k}\left(v^{j}(\partial_{j}w^{k})-w^{j}(\partial_{j}v^{k})\right)\partial_{k}\right)\\
           &= \inverse{4}\sum_{j,k,l,m}\left(\partial_{l}s_{m}-\partial_{m}s_{l}\right)\left(v^{j}w^{k}-v^{k}w^{j}\right)\left(dx^{l}{\wedge}dx^{m}, \partial_{j}{\wedge}\partial_{k}\right)\\
           &\qquad + \sum_{i,j,k}s_{i}\left(v^{j}(\partial_{j}w^{k})-w^{j}(\partial_{j}v^{k})\right)\left(dx^{i},\partial_{k}\right)\\
\end{align*}

ここが問題の箇所である。これが次のように変形される。
\begin{align*}
           = \inverse{4}\sum_{j,k,l,m}\left(\partial_{l}s_{m}-\partial_{m}s_{l}\right)\left(v^{j}w^{k}-v^{k}w^{j}\right)(\delta^{l}_{j}\delta^{m}_{k}-\delta^{l}_{k}\delta^{m}_{j})\\
           \qquad + \sum_{i,j,k}s_{i}\left(v^{j}(\partial_{j}w^{k})-w^{j}(\partial_{j}v^{k})\right)\delta^{i}_{k}\\
\end{align*}

更に計算を進めると。。。

\begin{align*}
           &= \inverse{4}\sum_{j,k}\left\{\left(\partial_{j}s_{k}-\partial_{k}s_{j}\right)-\left(\partial_{k}s_{j}-\partial_{j}s_{k}\right)\right\}\left(v^{j}w^{k}-v^{k}w^{j}\right)\\
           &\qquad + \sum_{i,j}s_{i}\left(v^{j}(\partial_{j}w^{i})-w^{j}(\partial_{j}v^{i})\right)\\
           &= \inverse{2}\sum_{j,k}\left(\partial_{j}s_{k}-\partial_{k}s_{j}\right)\left(v^{j}w^{k}-v^{k}w^{j}\right) + \sum_{i,j}\left(s_{i}v^{j}(\partial_{j}w^{i})-s_{i}w^{j}(\partial_{j}v^{i})\right)\\
%           &= \sum_{i,j}\left(\partial_{j}s_{i}\right)\left(v^{j}w^{i}-v^{i}w^{j}\right) + \sum_{i,j}\left(s_{i}v^{j}(\partial_{j}w^{i})-s_{i}w^{j}(\partial_{j}v^{i})\right)\\
           &= \sum_{i,j}\left(\partial_{j}s_{i}\right)\left(v^{j}w^{i}-v^{i}w^{j}\right) + \sum_{i,j}\left(s_{i}v^{j}(\partial_{j}w^{i})-s_{i}w^{j}(\partial_{j}v^{i})\right)\\
           &= \sum_{i,j}\left((\partial_{j}s_{i})v^{j}w^{i}-(\partial_{j}s_{i})v^{i}w^{j}\right) + \sum_{i,j}\left(s_{i}v^{j}(\partial_{j}w^{i})-s_{i}w^{j}(\partial_{j}v^{i})\right)\\
           &= \sum_{i,j}\left((\partial_{j}s_{i})v^{j}w^{i}+s_{i}v^{j}(\partial_{j}w^{i})\right) - \sum_{i,j}\left((\partial_{j}s_{i})v^{i}w^{j}+s_{i}w^{j}(\partial_{j}v^{i})\right)\\
           &= \sum_{i,j}v^{j}\left((\partial_{j}s_{i})w^{i}+s_{i}(\partial_{j}w^{i})\right) - \sum_{i,j}w^{j}\left((\partial_{j}s_{i})v^{i}+s_{i}(\partial_{j}v^{i})\right)\\
           &= \sum_{i,j}v^{j}\partial_{j}\left(s_{i}w^{i}\right) - \sum_{i,j}w^{j}\partial_{j}\left(s_{i}v^{i}\right)\\
           &= \sum_{j}v^{j}\partial_{j}(\sigma,\mathrm{w}) - \sum_{j}w^{j}\partial_{j}(\sigma,\mathrm{v})\\
           &= \mathrm{v}\{(\sigma,\mathrm{w})\} - \mathrm{w}\{(\sigma,\mathrm{v})\}\\
\end{align*}

これで [問題X-3] の式が証明された。

| | コメント (0) | トラックバック (0)
|

高木貞治 [代数学講義改訂新版] pp.276-277 に於ける叙述・記号の混乱

周知事項かも知れていが、書いておく。[高木貞治]著 [代数学講義改訂新版] (1965年 共立出版 ISBN 978-4-320-01000-0) 第276頁-第277頁には、叙述・記号の混乱が見られる。こうした「混乱」と関連するかどうかは不明だが、第277頁の式 (12) には錯誤があり、結果として、混乱を輻輳させている。

一応ことわっておいた方が良かろうが、私は、[代数学講義] (現在、発行されているのは、その「改訂新版」)に否定的な評価を試みるもののではない。話題がやや古色を帯びるとはいえ、その故に、内容の生命力が減じている訣ではない。むしろ、活き活きとした知性の動きの現場に参入すると云う体験をすることで、「数学の愉しさ」を教えてくれる本の一冊だとさえ思っている。特に、その悠悠とした筆致など、凡百の類書に顔色なからしむるものだ。しかしながら、それはそれ、これはこれである。

細かい計算を開示する余裕はないので、表面的な事実を指摘するだけにとどめるが、その前に周辺事情を概説するなら、第276頁の前頁、第275頁における「n 次の行列式 A から mm 列を取って m 次の小行列式」作って、それを {A_{pq}}^{(m)} とし (第275頁では、一度 A_{p,q}^{(m)} と表記されているが、その後では、コンマは省略されている)、これを配列して作った、\nu=\binom{n}{m} として \nu\nu 列の (つまり \nu 次の) 行列の行列式を A^{(m)} と記すと云った言及を引き継いで (以上が、第275頁の記述、以下第276頁に入る)、更に、{A_{pq}}^{(m)} の余因子を {\vvec{A}_{pq}}^{(m)} とし (所謂 [ボールド体]、要するに [太字] になっていることに注意。以下同様に、フォントの太さに留意されたい)、余因子 {\vvec{A}_{pq}}^{(m)} からなる行列の行列式を \vvec{A}^{(m)} とする記号を導入した後で、行列式 \vvec{A}^{(m)} が行列式 A の冪乗の常数倍であることを証明して、式 (10)
\[
\vvec{A}^{m} = cA^{\mu}
\]
を導いている (第276頁)。

ここ迄は良い。

しかし、それに続いて、「(10) において, 指数 \mu を定めるには, 両辺の次数を比較すればよい.」(この次数は、行列式としての次数) として行っている計算が \mu つまり、余因子行列の行列式 \vvec{A}^{(m)} の行列式 A に対する指数ではなく、小行列式の行列の行列式 A^{(m)} の行列式 A に対する指数なのだ (ちなみに、c = 1 である)。

なぜなら、第276頁の下から4行目で、余因子の行列としての次数が n-m であることを踏まえて \vvec{A}^{(m)}=a^{(n-m)\nu} とすべき式を、\vvec{A}^{(m)}=a^{m\nu} としまっているからだ (ここで \nu=\binom{n}{m} は、小行列式行列と余因子行列双方の行列としての次数になっていることに注意)。

従って、第276頁の最終行で、行われている計算は、\mu= で始めっているものの、\mu を導き出すものではなく、m 次の小行列式から構成されるの行列の行列式 A^{(m)} が、行列式 A に対して有する冪乗の指数と云うことになる。

そして、この後、話の流れが切り替わってしまい。次頁の第277頁では、[定理8.21] として「n 次の行列式 A からの m 次の小行列式の行列式 A^{(m)}」が主題になっている 。

豆鉄砲を喰らった鳩になった気分で、サブセクション5の内容をチェックしながら読み進めて行くと、最後の最後で、そこにある式 (12) の確認がとれない。具体的には、右辺の A の指数 n(\nu - \mu)-m\nu が、出てこないのだ。

「何か、基本的な勘違いをしているのではないか」と云う思いが頭をかすめる。。。

しかし、叙述の混乱でこちらがミスリードされた思考の道筋をリセットして、原文を読み直してみると、こちらの理解が間違っているとは思えない。私の計算に拠るなら、A に係る指数は \binom{n-1}{m}-\mu でなければならない。そこで、改めて問題の指数を見てみると、n(\nu - \mu)-m\nu\binom{n-1}{m}-\mun 倍であることに気が付いた。

憶測するに、[代数学講義] の原稿段階において、式 (12) の、多項式としての「両辺の次数を比較」した際に、行列式 A の次数 n (A の要素は行列式ではなく、単純な変数なので、多項式としての次数と、行列としての次数が一致する) を相殺しないまま、最終の式に残してしまったのかもしれない。

蛇足ながら付け加えておくと。

その1
余因子行列の行列式 \vvec{A}^{(m)} の行列式 A に対する指数は、等式

\[
\vvec{A}^{(m)} = A^{\binom{n-1}{m}}
\]
で表される。

これに関連する等式
\[
\binom{n}{m} = \binom{n-1}{m-1} + \binom{n-1}{m}
\]
は、多分「高校数学」だろう。

その2
訂正後の式 (12) で \mu=0 と置くと、[蛇足その1] で示した余因子行列の行列式 \vvec{A}^{(m)} の行列式 A に対する指数の式が得られる。訂正前の n(\nu - \mu)-m\nu では、勿論そうはいかないが、n で割っ た (\nu - \mu) - \frac{m}{n}\nu\mu=0 を代入すると

\[
\nu - \frac{m}{n}\nu = \frac{m-n}{n}\binom{n}{m} = \binom{n-1}{m}
\]
が出てくる (表面上の違いを除けば [その1] と同じ計算)。

その3
書誌学的注意をしておくと、私は、たまたま、[代数学講義] の初版 (1930年。ただし、私のは1937年発行分) も所持しているが、この事案の箇所は、初版には存在しない。「改訂版」(1948年) 又は [改訂新版] (1965年) の段階で付加されたもののようである。

蛇足の蛇足
実は、[代数学講義](改訂新版) は、一度も通読したことがない。それでも、折に触れて手に取って、勉強している。自分に、代数学の地力が欠けていると痛感した時など、とりあえず関係している所を拡げてみる。具体的事例があるから、それを解いていくと、自分の思い込みの穴を見定めるのに丁度良いのだ。そして、錆びついた理解力にゴリゴリとヤスリを掛けられている気分は、心地よい。

何故、今、そうしたことをワザワザ書く気になったかと云うと、実は、彼の [解析概論] は今更読み返したいとは思わないことを言う必要があることに気が付いて、それとの「つり合い」を取りたくなったからだ。その一方で、私個人の、この気分の違いは、わざわざ一般化するほどの意味があるとは思えないと云うのも事実なわけで、まぁ、つまらないこどだ、と思いつつ、書くしかないことを、書いている自分がここにいたりする。

| | コメント (0) | トラックバック (0)
|

日本語版 Wikipedia の項「ラプラス作用素」の瑕疵

先日、必要があって、Wikipedia の記事、「ラプラス作用素」を、ザッと、読み流したのだが、その時に気が付いたことを書き留めておく。

勿論、ゴクささやかな、どうでもいいことなのだが。。。

初めに、書誌学的注意をしておくと、対象となる記事は、日本語版 Wikipedia の「ラプラス作用素」(タイムスタンプは 最終更新 2016年6月5日 (日) 02:46) である。そして、この記事は、少なくともおおむね、英文版 Wikipedia の記事、"Laplace operator" の訳文であるようだ (英文版の、本稿作成時のタイムスタンプは 7 June 2016, at 19:42)。Wikipedia ユーザーの個人設定の有無等に応じて、タイムスタンプは若干食い違う可能性はあるが。。。

で、私が引っかかったのは、[一般化] のセクションだ (その直前のセクション [スペクトル論] 中、「ラプラス=ベルトラム作用素」とあるのは、「ラプラス=ベルトラミ作用素」の誤りだが、ただの入力ミスだろうから、大量に発生しているのでもない限り、本稿では、話題にするに値しない類のものだ)。

[一般化] と云うセクションは、2つのサブセクション [ラプラス=ベルトラミ作用素] と [ダランベール作用素] とに分かれる。実は、この [ラプラス=ベルトラミ作用素] が、私が目ざしていた情報に関わると思われたので注目したのだ。

文脈をはっきりさせる為に、[ラプラス=ベルトラミ作用素] 全体を引用する。

ラプラス作用素の概念は、リーマン多様体上で定義されたラプラス=ベルトラミ作用素 (英語版) と呼ばれる楕円型作用素に一般化することができる。同様にダランベール作用素は擬リーマン多様体上の双曲型作用素に一般化される。ラプラス=ベルトラミ作用素を函数に適用すれば、その函数のヘッセ行列トレース

\Delta f = \mathrm{tr}(H(f))

が得られる。ただし、トレースは計量テンソルの逆に関して取るものとする。ラプラス=ベルトラミ作用素を同様の式でテンソル場に作用する作用素(これもまたラプラス=ベルトラミ作用素と呼ばれる)に一般化することができる。

ラプラス作用素の別な一般化として、擬リーマン多様体上で定義される外微分を用いた「幾何学者のラプラシアン」と呼ばれる

\Delta f = d^* d f

を考えることもできる。ここで d^* は余微分 (英語版) で、ホッジ双対を使って書くこともできる。これが上に述べた「解析学者のラプラシアン」とは異なるものであることには注意すべきである。そのことは大域解析学の論文を読むときには常に気を付けねばならない。 より一般に、微分形式 α に対して定義される「ホッジ」ラプラシアンは

\Delta \alpha = d^* d\alpha + dd^*\alpha

と書ける。これはまたラプラス=ドラーム作用素 (英語版) とも呼ばれ、ヴァイツェンベック不等式 (英語版) によってラプラス=ベルトラミ作用素と関係する。

(引用者註: α の位置が間違っていたので訂正した。)

で、私が引っかかったのは、

これ (引用者註:つまり、「幾何学者のラプラシアン」) が上に述べた「解析学者のラプラシアン」とは異なるものであることには注意すべきである。

の部分だった。「幾何学者のラプラシアン」と「解析学者のラプラシアン」では、呼び方が異なってているのだから、「日常的文章感覚」では「異なるもの」であるのは当然で、「注意すべき」も茄子のへったくれもない。

ダメ出し的なことを言うなら、これが、逆に、定義が異なっているにも関わらず、実は「幾何学者のラプラシアン」と「解析学者のラプラシアン」とが、同一のものだったと云う話の流れだったら、その同一性に「注意すべき」と云う表現がもっともになっただろう。

どう云う訣合だろうと思って、英語版の "Laplace operator" を見たら、疑問が氷解した (話が、後先にあるが 日本語版が実質英語版の翻訳であるのに、この時気が付いた。まぁ、いづれにしろ英語版も参照するのがルーチンワークだから、細かく言っても無意味だが)。

そこで、英語版も引用しておく。

The Laplacian also can be generalized to an elliptic operator called the Laplace–Beltrami operator defined on a Riemannian manifold. The d'Alembert operator generalizes to a hyperbolic operator on pseudo-Riemannian manifolds. The Laplace–Beltrami operator, when applied to a function, is the trace of the function's Hessian:

\Delta f = \mathrm{tr}(H(f))

where the trace is taken with respect to the inverse of the metric tensor. The Laplace–Beltrami operator also can be generalized to an operator (also called the Laplace–Beltrami operator) which operates on tensor fields, by a similar formula.

Another generalization of the Laplace operator that is available on pseudo-Riemannian manifolds uses the exterior derivative, in terms of which the “geometer's Laplacian" is expressed as

\Delta f = d^* d f

Here d^* is the codifferential, which can also be expressed using the Hodge dual. Note that this operator differs in sign from the "analyst's Laplacian" defined above, a point which must always be kept in mind when reading papers in global analysis. More generally, the "Hodge" Laplacian is defined on differential forms α by

\Delta \alpha = d^* d\alpha + dd^*\alpha

This is known as the Laplace–de Rham operator, which is related to the Laplace–Beltrami operator by the Weitzenböck identity.

大袈裟な準備をした挙句、[落ち] がアホらしくて申し訣ないが、

これが上に述べた「解析学者のラプラシアン」とは異なるものであることには注意すべきである。

の「原文」は

Note that this operator differs in sign from the "analyst's Laplacian" defined above,...

である。つまり、「訳者」は "in sign" を見落としてしまったのだ。そして、未熟練翻訳者にはありがちなこととはいえ、"differs" を機械的に「異なる」で置き換えてしまっている。確かに、"differs in sign" は「符号が異なる」としても、翻訳として及第点は貰えるだろうが、技術文では、「文章のエントロピー」とでも言うべきものを出来るだけ低くした方がいいので、ここは「符号が逆」とすべきだったろう。つまり

この作用素と、上記の「解析学者のラプラシアン」とでは、符号が逆になっていることに留意されたい。

とでもすべきだっただろう。

恥を忍んで告白するなら、この「結論」に達した途端、「この話、既にどこかの本で読んだことがある」ことを思い出した。私のマヌケさ加減も相当念が入っていると言うしかない。落ち着いて読んでおけば、Wikipedia の記事が、「解析学者のラプラシアン」と呼んでいる \Delta f = \mathrm{tr}(H(f)) が、フツーの「ラプラシアン」の形式上自然な拡張になっていることに、その場で気が付いたはずだったのだ (その前に、知識として知っておけよと、自分に言いたい気もする)。もっとも、それに気が付いたとしても、「異なる」=>「符号が異なる」=>「符号が逆」と迄、頭が回転したかどうか、自分の馬鹿さ加減を重々承知している身としては、自信がない。

それから、「ヴァイツェンベック不等式」は、英文版リンク先が "Weitzenböck identity" であることが示すように「ヴァイツェンベック恒等式」に訂正する必要がある。

微分幾何の楕円作用素間の関係を表す「Weitzenböck identity (ヴァイツェンベック恒等式)」の他に、平面幾何に「ヴァイツェンベック不等式 (Weitzenböck's inequality)」と云うものが実在するから、現状では、ミスリーディングする可能性が無いとは言えない。ちなみに、英文版の "Weitzenböck identity" の冒頭には 「"Weitzenböck's inequality" と混同するな」と書いてあったりする。vice versa.

ついでに書いておくと、次の小節 [ダランベール作用素] において

ここでは計量の符号を作用素の空間成分に関して負符号を許すようにしてあることに注意

と云う箇所があり、これの「原文」は

Note that the overall sign of the metric here is chosen such that the spatial parts of the operator admit a negative sign

である訣だが、「負符号を許すように」は、"admit" に引きずられ過ぎててしまっている。それに、その前の "the overall sign of the metric" が「計量の符号系」であることを (多分) 見落としている。「木を見て森を見ず」と云う奴だ。

ここでは、計量の符号系が、ダランベール作用素の空間部分の符号が負になるように選択されているのだと云うことに注意されたい。

ぐらいにすべきだっただろう。

| | コメント (0) | トラックバック (0)
|

語義: G.N.Watson "a treatise on the THEORY OF BESSEL FUNCTIONS" p.3 の "heavy chain"

G.N.Watson "a treatise on the THEORY OF BESSEL FUNCTIONS" p.3 (第1章) に、次の一文がある。

In 1738 Daniel Bernoulli published a memoir containing enunciations of a number of theorems on the oscillations of heavy chains.
1736年、ダニエル・ベルヌーイは、鎖の振動に関する幾つかの定理をまとめた覚え書きを発表した。

この "heavy" の語感は、「重い」よりも「(個々の環に)存在感がある」に近い。勿論「質量」にも関連していて、詳しくは「無視しえない質量線密度を有する」と云う含意だろう。だから、日本語としては「重い」より「太い」を使いたくなるが、単に「太い」と訳しても、原文における語感と隔たりがある。やや細かく「しっかりとした太さが感じられる鎖」としても、事態は改善されてない。"heavy" の語感を強調すべき文脈ではなく、サラリと訳す必要があるからだ。結局、日本語に訳すなら単に「鎖」とした方が良い。

単振子は「錘」に質量が集中し、錘と支点との間の桿は剛体でありながら、質量は無視されるが、「鎖」の場合は、独立した「錘」は存在せず、支点から懸下した、一定の長さを有する1次元延長体の全体に質量が一様に分布し、かつ、その延長体は、伸び縮みはしないが、自由に変形可能であることが想定されている。

なお、分子医学で、抗体 (antibody 機能名)、つまり、免疫グロブリン (immunoglobulin 物質名) の分子構造の「部品」として、英文で "heavy chain" 及び "light chain" と呼ばれるものがあり、それぞれ「重鎖」及び「軽鎖」と訳されることがあるが (「H鎖」及び「L鎖」と云う用語もある)、分野が異なり、しかも、文脈水準も「マクロな文脈」と「ミクロな文脈」とで異なるので、日を同じくして論ずる訣にはいかない。

| | コメント (0) | トラックバック (0)
|

より以前の記事一覧