投稿

線形代数⑮ 行列の対角化

行列の対角化の方法 行列の対角化とは 行列の対角化 正方行列$A$に対して、 \begin{align*} B=P^{-1}AP \end{align*} となる$B$が対角行列になるような正則行列$P$が存在するとき、行列$A$は対角化可能といいます。 対角化行列の性質 \begin{align*} B= \begin{pmatrix} b_1 & & & & \\ & b_2 & & & \\ && b_3 & & \\ & & & \ddots & \\ & & & & b_n \end{pmatrix} \end{align*} のとき、 \begin{align*} B^k= \begin{pmatrix} b_1^k & & & & \\ & b_2^k & & & \\ && b_3^k & & \\ & & & \ddots & \\ & & & & b_n^k \end{pmatrix} \end{align*} となることを利用します。$A$$=PBP^{-1}$が成り立つので、$P^{-1}P$$=E_n$(単位行列)を利用して、 \begin{align*} A^k &=(PBP^{-1})(PBP^{-1})\cdots(PBP^{-1}) \\ &=PBE_nBE_n\cdots E_nBP^{-1} \\ &=PB^nP^{-1} \\ \end{align*} また、$B^n$は先ほどのように簡単に計算できるので、 この式は任意の$n$に対して簡単

線形代数⑬ グラム・シュミットの直交化の方法

内積の定義とグラム・シュミットの直交化の方法 基底とは?基底の変換行列と表現行列 の記事で、基底というものを定義しましたが、グラム・シュミットの直交化の方法で正規直交基底を作り上げます。 内積とノルムの定義 一般には内積というのは、内積の公理を満たしていればどのようにとっても良いことになってます。 (参考: 内積と内積の公理 ) ただし、$n$成分ベクトル$\boldsymbol{a}$,$\boldsymbol{b}$に対しての内積は、多くの場合、 内積 \begin{align*} \boldsymbol{a}\cdot\boldsymbol{b}=a_1b_1+a_2b_2+\cdots +a_nb_n=\sum_{i=1}^na_ib_i \end{align*} と定義されます。特にベクトル解析の記事では3成分の場合について紹介していました。(参考: 内積とノルム ) また、ノルムを以下のように定義します。 ノルム ベクトル$\boldsymbol{a}$のノルムを以下のように定義します。 \begin{align*} \|\boldsymbol{a}\|=\sqrt{\sum_{i=1}^n a^2_i} \end{align*} 正規直交基底の定義 「正規」というのはノルムが1ということ、「直交」というのは内積が0ということを示します。つまり、基底$\{\boldsymbol{v}_1,\boldsymbol{v}_2,\cdots, \boldsymbol{v}_n\}$に対して、 \begin{align*} \boldsymbol{v}_i\cdot \boldsymbol{v}_j=\delta_{ij} \end{align*} が成り立つことを言います。ただし、右辺はクロネッカーのデルタというもので$i$$=j$のときのみ1、そのほかは0となるような基底のことを正規直交基底といいます。 グラムシュミットの方法 いま、基底$\{\boldsymbol{u}_1,\boldsymbol{u}_2,\cdots,\boldsymbol{u}_n\}$を用意します。ただし、いまはまだ正規化も直交化もされてい

線形代数⑫ 基底とは? 基底の変換行列と表現行列

表現行列とは? まず、基底を定義します。基底の変換行列を紹介したのちに表現行列というものに結び付けます。 基底とは何か? 基底 ベクトル空間$U$のベクトルの組$\{\boldsymbol{u}_1,\boldsymbol{u}_2,\cdots ,\boldsymbol{u}_n\}$について、 \begin{align} &\boldsymbol{u}_1&\boldsymbol{u}_2&\cdots &\boldsymbol{u}_n\text{は1次独立である} \label{eq:1}\\ & \text{ベクトル空間}U\text{上の任意のベクトルが}\boldsymbol{u}_1&\boldsymbol{u}_2&\cdots &\boldsymbol{u}_n\text{の線形和で表される。} \label{eq:2} \end{align} この2条件を満たすとき、$\{\boldsymbol{u}_1,\boldsymbol{u}_2,\cdots ,\boldsymbol{u}_n\}$を基底と呼びます。 \eqref{eq:2}のことを $U$を生成する ということもあります。 (参考: 1次独立・1次従属 ) 基底の変換行列とは? 基底の表し方はひととおりではないので、 \begin{align*} \begin{pmatrix} \boldsymbol{u}_1&\boldsymbol{u}_2&\cdots &\boldsymbol{u}_n \end{pmatrix} \to \begin{pmatrix} \boldsymbol{u}^\prime_1&\boldsymbol{u}^\prime_2&\cdots &\boldsymbol{u}^\prime_n \end{pmatrix} \end{align*} というように基底の変換を考えることができます。 基底の変換行列 以下の基底変換を結びつける行列$A$

線形代数⑪ 線形写像・核・像・退化次数の定義

線形写像・核・像・退化次数の定義 線形写像というものを定義して、その線形写像に対して核と像というものを定めます。核の次元が退化次数になります。 線形写像・像・核とは? 線形写像 ベクトル空間$U$から$V$への写像$T$について、$\boldsymbol{u},\boldsymbol{v}$$\in U$,$c$$\in\mathbb{C}$に対して、 \begin{align*} f(\boldsymbol{u})+f(\boldsymbol{v})&=f(\boldsymbol{u}+\boldsymbol{v}) \\ f(c\boldsymbol{u})&=cf(\boldsymbol{u}) \end{align*} が成り立つ$f$を線形写像といいます。 これが成り立つ例として、ベクトル$\boldsymbol{x}$と適当な行列$A$について、 \begin{align*} f(\boldsymbol{x})=A\boldsymbol{x} \end{align*} というものがあります。 像と核 ベクトル空間$U$から$V$への線形写像$f$の像(Image)と核(Kernel)をそれぞれ$\text{Im}(f)$、$\text{Ker}(f)$と表し、以下のように定義します。 \begin{align*} \text{Im}(f)&\stackrel{def}{=}\{f(\boldsymbol{u})|\boldsymbol{u}\in U\} \\ \text{Ker}(f)&\stackrel{def}{=}\{\boldsymbol{u}\in U|f(\boldsymbol{u})=\boldsymbol{0}\} \end{align*} 退化次数 ベクトル空間$U$から$V$への線形写像$f$の核(Kernel)について \begin{align*} \text{null}(f)\stackrel{def}{=}\text{dim}(\text{Ker}(f)) \end{align*}

線形代数⑩ 1次独立・1次従属

1次独立と1次従属の定義 1次というのは1次式ということなのですが、これは線形もいえるので、線形独立、線形従属という場合もあります。 1次独立・1次従属とは? ベクトル$\boldsymbol{u}_i$と$c_i$$\in \mathbb{C}$($i=$$1,2,\cdots ,n$,)に対して、線形結合 \begin{align*} \boldsymbol{v}=c_1\boldsymbol{u}_1+c_2\boldsymbol{u}_2+\cdots c_n\boldsymbol{u}_n \end{align*} と表される場合を考えます。ここで、$\boldsymbol{v}$$=\boldsymbol{0}$とすることを考えます。 1次独立・1次従属 \begin{align*} \boldsymbol{0}=c_1\boldsymbol{u}_1+c_2\boldsymbol{u}_2+\cdots c_n\boldsymbol{u}_n \end{align*} とした場合、解が \begin{align*} c_1=c_2=\cdots =c_n=0 \end{align*} に限る場合、1次独立といい、1次独立でない場合を1次従属といいます。 もし、1次従属の場合、さらに$c_n$$\ne 0$を仮定すると、 \begin{align*} \boldsymbol{0}=c_1\boldsymbol{u}_1+c_2\boldsymbol{u}_2+\cdots c_n\boldsymbol{u}_n \Rightarrow \boldsymbol{u}_n=-\dfrac{c_1}{c_n}\boldsymbol{u}_1-\dfrac{c_2}{c_n}\boldsymbol{u}_2-\cdots -\dfrac{c_{n-1}}{c_n}\boldsymbol{u}_{n-1} \end{align*} というように、あるベクトルがほかのベクトルで表されることになります。 [ 前の記事へ ] [ 次の記事へ ]

線形代数⑧ クラーメルの公式

クラーメルの公式とは? 連立方程式の解を求めたいときに、掃き出し法だとどうしても計算が煩雑になることがあります。そこで、クラーメルの公式という別の方法を紹介します。 ※行列式がうまく表示できない端末があるようです。 クラーメルの公式の内容 クラーメルの公式 \begin{align*} A&= \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{pmatrix} \\ \boldsymbol{b}&={}^t \begin{pmatrix}  b_1 & b_2 & \cdots & b_n \end{pmatrix} \\ \boldsymbol{x}&={}^t \begin{pmatrix}  x_1 & x_2 & \cdots & x_n \end{pmatrix} \end{align*} に対する連立方程式 \begin{align*} A\boldsymbol{x}=\boldsymbol{b} \end{align*} の解の$i$番目の成分は、 \begin{align*} x_i= \begin{vmatrix}  a_{11} & a_{12} & \cdots & a_{1,i-1} & b_1 & a_{1,i+1} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_

線形代数⑦ 余因子展開・余因子行列

余因子行列・余因子展開 行列式の計算がかなり大変だったので、もう少し別のやり方で計算できないか探ってみましょう。(いや、大変なままですがね...) ※行列式の両端の線がうまく表示できない端末があるようです。 余因子展開の導出 行列式の性質を用いて余因子展開を導出します。(参考: 行列式の定義・性質とサラスの公式 ) \begin{align*} \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\  a_{i1}+b_{i1} & a_{i2}+b_{i2} & \cdots & a_{in}+b_{in} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{vmatrix} &= \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\  a_{i1} & a_{i2} & \cdots & a_{in} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{vmatrix} + \begin{vmatrix}

線形代数⑥ 行列式の定義・性質とサラスの公式

行列式の定義と計算方法 ※行列式の両端の線がうまく表示できない端末があるようです。 行列式の定義 行列式の計算方法 $n$次正方行列$A=[a_{ij}]$についての行列式を$\det{A}$、または、具体的な成分を明示して、 \begin{align*} \begin{vmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ddots & \vdots \\ a_{n1} & a_{n2} & \cdots & a_{nn} \end{vmatrix} \end{align*} と表します。この計算は、全単射となる置換の集合$S$として、 \begin{align*} \det{A}=\sum_{\sigma\in S}\text{sgn}{(\sigma)}a_{1\sigma(1)}a_{2\sigma(2)}\cdots a_{n\sigma(n)} \end{align*} とします。 サラスの公式による計算例 2行2列の場合、置換として考えられるのは、$\sigma(1)=1$,$\sigma(2)=2$の場合(置換の符号は正)、または、$\sigma(1)=2$,$\sigma(2)=1$の場合(置換の符号は負)の2通りに限られます。よって、 \begin{align*} \begin{vmatrix} a_{11} & a_{12} \\ a_{21} & a_{22} \end{vmatrix} =a_{11}a_{22}-a_{12}a_{21} \end{align*} これが右斜め下向きに項をかけ合わせたものから左斜め下向きに項を掛け合わせたものをひいた定義になるので、特にサラスの方法といいます。3行3列の場合についても似たような方法で計算

線形代数⑤ 置換・互換

互換と置換の符号 線形代数の話とは直接は関係ないのですが、行列式の定義に用いるので先に紹介します。 置換とは? 置換 写像$\sigma$$\{1,2,\cdots,n\}$$\to$$\{1,2,\cdots,n\}$を置換と呼びます。この対応関係を \begin{align*} \begin{pmatrix} 1 & 2 & \cdots & n \\ \sigma(1) & \sigma(2) & \cdots & \sigma(n) \end{pmatrix} \end{align*} と書きます。特に、$\sigma$が全単射の時のみ(ある数を選べば対応する要素が必ずある場合)を置換と呼ぶことも多いようです。 たとえば、 \begin{align*} \begin{pmatrix} 1 & 2 & 3 & 4 \\ 3 & 4 & 2 & 1 \end{pmatrix} \end{align*} という場合は1を3に、3を2に、2を4に、4を1に、というように置き換えるということになります。さらにこれを以下の様に表現することができます。 \begin{align*} \begin{pmatrix} 1 & 3 & 2 & 4 \end{pmatrix} \end{align*} 互換とは? 互換とは以下のようなことをいいます。 互換 \begin{align*} \begin{pmatrix} a\ b \end{pmatrix} \end{align*} これは$a$と$b$を入れ替えるということを指し、互換といいます。また、置換を互換に分解する公式があって、 \begin{align*} \begin{pmatrix} k_1\ k_2 \ k_3\ \cdots \ k_n

線形代数④ 掃き出し法による連立方程式の解法

掃き出し法による連立方程式の解法 行列というツールを用いて、連立方程式の解を求めましょう。 行列の形で連立方程式を表す 前回用いていた行列$A$として、 \begin{align*} A= \begin{pmatrix} 1 & 1 & 1 \\ -1 & 0 & -1 \\ 2 & 0 & 1 \end{pmatrix} \end{align*} を用います。ここで3元の連立方程式 \begin{align*} x&+y&+z&=6 \\ -x& &-z&=-4 \\ 2x& &+z&=5 \end{align*} を解くことを考えましょう。以下のように、縦ベクトル$\boldsymbol{x}$と$\boldsymbol{b}$($3$$\times$$1$の行列)を用意します。いま、ベクトルは太字にして書きます。(一般的にベクトルのみを太字で書くことが多いです。) \begin{align*} \boldsymbol{x}&= \begin{pmatrix} x \\ y \\ z \end{pmatrix} \\ \boldsymbol{b}&= \begin{pmatrix} 6 \\ -4 \\ 5 \end{pmatrix} \end{align*} こうおくと、連立方程式は \begin{align*} A\boldsymbol{x}=\boldsymbol{b} \end{align*} となります。いま、$A$は係数を決める行列なので、 係数行列 といいます。上の式の辺々に左から$A^{-1}$をかけると、 \begin{align*} A^{-1}A\boldsymbol{x}=A^{-1}\bolds

線形代数③ 逆行列(掃き出し法と正則行列の定義)

掃き出し法による逆行列の計算 逆行列とはなにか?正則行列とはなにか?を定義してのちに逆行列を掃き出し法により求めます。 逆行列と正則行列の定義 逆行列と正則行列 $n$次正方行列($n\times n$の行列)$A$と$n$次の単位行列$E_n$について、 \begin{align*} AB=BA=E_n \end{align*} となる行列$B$を逆行列といい、$A^{-1}$とかきます。逆行列が存在する行列ような行列を正則行列といいます。 逆行列を持つためには正方行列でないといけません。また、 掃き出し法とは 掃き出し法による逆行列の計算 掃き出し法 $n$次正則行列$A$と$n$次単位行列$E_n$について、 \begin{align*} \begin{pmatrix} A & E_n \end{pmatrix} \end{align*} を簡約化すると、 \begin{align*} \begin{pmatrix} E_n & A^{-1} \end{pmatrix} \end{align*} が得られます。 \begin{align*} A=\begin{pmatrix} 1 & 1 & 1\\ -1 & 0 & -1\\ 2 & 0 & 1 \end{pmatrix} \end{align*} 前回簡約化を行った行列$A$の逆行列を掃き出し法によって求めましょう。以下のように右側に単位行列を加えた行列を簡約化します。(参考: 行列の簡約化 ) \begin{align*} \begin{pmatrix} 1 & 1 & 1 & 1 & 0 & 0 \\ -1 & 0 & -1 & 0 & 1 & 0 \\ 2 & 0 & 1 & 0 & 0 & 1 \end{pmatrix} \end{ali

微分積分⑭ ラグランジュの未定乗数法

ラグランジュの未定乗数法の計算 ラグランジュの未定乗数法って極値を求めるのに便利で、たとえば、物理では統計力学で頻繁に使います。ただ、この方法はあくまで極値の候補を求めるだけで、それが実際に極値かどうかは各点で判定する必要があります。 ラグランジュの未定乗数法の内容 ラグランジュの未定乗数法 条件$g(x,y)=0$の下で、関数$f(x,y)$の極値の候補は新たな関数 \begin{align*} L(x,y,\lambda)=f(x,y)-\lambda g(x,y) \end{align*} を設定し、 \begin{align*} \dfrac{\partial L}{\partial x}=\dfrac{\partial L}{\partial y}=\dfrac{\partial L}{\partial \lambda}=0 \end{align*} を満たす点となります。 これを厳密に証明するのは難しいので、具体的な計算例を紹介します。 ラグランジュの未定乗数法の計算例題 未定乗数法を用いて極値候補を出す 以下の関数 \begin{align*} g(x,y)=2x+y-5 \end{align*} に対しての$g(x,y)$$=0$の束縛条件のもとで \begin{align*} f(x,y)=x^2+y^2 \end{align*} の極小極大を求めましょう。新しく以下の関数を設定します。 \begin{align*} L(x,y,\lambda) &=f(x,y)-\lambda g(x,y) \\ &=x^2+y^2+\lambda(2x+y-5) \end{align*} \begin{align*} \dfrac{\partial L}{\partial x}&=2x+2\lambda=2(x+\lambda)=0 \\ \dfrac{\partial L}{\partial y}&=2y+\lambda =0 \\ \dfrac{\partial L}{\partial \lambda}&=2x+y-5=0 \end{align*} これは3元の連立方程式となります。解いてみる

微分積分⑫ 多変数のテイラー展開・マクローリン展開

多変数関数のテイラー展開・マクローリン展開 前提:1変数のテイラー展開の公式 1変数の場合のテイラー展開配下のようにあらわされたのでした。 1変数関数のテイラー展開 以下の式の右辺を$x=a$まわりのテイラー展開といいます。 \begin{align*} f(x)&=f(a)+\dfrac{1}{1!}f'(a)(x-a)+\dfrac{1}{2!}f''(a)(x-a)^{2}+\cdots\\\ \displaystyle\\ &=\sum_{k=0}^\infty \dfrac{1}{k!}f^{(k)}(a)(x-a)^{k}\end{align*} この式は左辺と右辺について、$x$$=a$での$n$次の微分係数が等しくなるように多項式を定めたのでした。この考えにのっとれば多変数への拡張もできます。(参考: 1変数のテイラー展開・マクローリン展開 ) 2変数のテイラー展開の公式 2変数関数のテイラー展開 点$(a,b)$周りのテイラー展開は以下の様に計算できます。 \begin{align*} f(x,y)=f(a,b)+\dfrac{1}{1!}\left(\left. \dfrac{\partial f}{\partial x}\right|_{(a,b)}(x-a)+\left. \dfrac{\partial f}{\partial y}\right|_{(a,b)}(y-b)\right)+\dfrac{1}{2!}\left(\left. \dfrac{\partial^2 f}{\partial x^2}\right|_{(a,b)}(x-a)^2+2\left. \dfrac{\partial^2 f}{\partial x\partial y}\right|_{(a,b)}(x-a)(y-b)+\left. \dfrac{\partial^2 f}{\partial y^2}\right|_{(a,b)}(y-b)^2\right) \end{align*} たとえば、この右辺を$x$で偏微分してみると、 \begin{align*} \left. \dfrac{\partial f}{\partial x}\right|_{(a,b)}

微分積分⑪ シュワルツの定理

シュワルツの定理の証明 前提条件:ラグランジュの平均値の定理 ラグランジュの平均値の定理より、以下のような式が言えました。 ラグランジュの平均値の定理 $f$を閉区間$[a,b]$で連続かつ$(a,b)$で微分可能な関数とする。 \begin{align*} \dfrac{f(b)-f(a)}{b-a}=f^\prime(c),a\lt c\lt b \end{align*} を満たす$c$が存在する。 この$c$というパラメータを置き換えて以下の形も得られます。 ラグランジュの平均値の定理の別ver. $f$を閉区間$[a,b]$で連続かつ$(a,b)$で微分可能な関数とする。$h$$=b-a$として、 \begin{align*} f(b)-f(a)=hf^\prime(a+\theta h),0\lt \theta\lt 1 \end{align*} を満たす$\theta$が存在する。 この定理は ロルの定理 を用いて証明できます。(参考: ラグランジュの平均値の定理 の証明) シュワルツの定理の内容 シュワルツの定理 定義域$D$で、$f_x$,$f_y$,$f_{xy}$が存在して$f_{xy}$が連続ならば$f_{yx}$も存在して \begin{align*} f_{xy}=f_{yx} \end{align*} が成り立つ。 シュワルツの定理の証明 求めたい式から変形していく 仮定より、$f_x$が存在しますが、これは 微分可能ならば連続 なので、いま、関数$f$は$x$に対して連続といえます。$y$についても同様です。というわけで、以下ではラグランジュの平均値の定理を用いて証明を進めます。 以下では、正の微小量$h_x$、$h_y$を考えます いま、$f_{yx}$($f_y$を$x$で偏微分)を計算してみたら$f_{xy}$と等しくなった、ということが示したいので、まず使う式は \begin{align*} f_{yx}(a,b)=\lim_{h_x\to 0}\dfrac{f_y(a+h_x,b)-f_y(a,b)}{h_x} \end{align*} となります。(参考: 偏微分 )この式を計算していきたいのですが

微分積分⑦ ロピタルの定理

ロピタルの定理の証明 コーシーの平均値の定理を用いてロピタルの定理の証明を書きます。 前提条件:コーシーの平均値の定理 コーシーの平均値の定理 $f,g$を閉区間$[a,b]$で連続かつ$(a,b)$で微分可能な関数とする。また、$g^\prime(x)\ne 0$($a \lt$$x$$\lt b$),$g(a)$$\ne$$g(b)$とする。 \begin{align*} \dfrac{f(b)-f(a)}{g(b)-g(a)}=\dfrac{f^\prime(c)}{g^\prime(c)} \end{align*} を満たす$c$が存在する。 この定理の仮定である閉区間上で関数が連続という条件が大事です。ロピタルの定理の証明の中でコーシーの平均値を用いるために閉区間を用意します。 (参考: コーシーの平均値の定理 ) ロピタルの定理の内容 0/0形のロピタルの定理 $f,g$を$\gamma \gt 0$に対して、$a-\gamma\lt x\lt a$,$a\lt x \lt a+\gamma$の区間で微分可能な関数とする。ただし、$g^\prime(x)\ne 0$とする。 \begin{align*} \lim_{x\to a}f(x)=\lim_{x\to a}g(x)=0 \end{align*} とする。このとき、 \begin{align*} \lim_{x\to a}\dfrac{f^\prime(x)}{g^\prime(x)} \end{align*} が存在するならば、 \begin{align*} \lim_{x\to a}\dfrac{f(x)}{g(x)}=\lim_{x\to a}\dfrac{f^\prime(x)}{g^\prime(x)} \end{align*} 実は...御覧のように前提条件が厳しくて...これをきっちり理解しないままロピタルの定理を使う場合が多くて... 0/0の形のロピタルの定理の証明 $x=a$で関数$f(x)$が極限が存在するとは、 \begin{align*} \lim_{x\uparrow a}f(x)=\lim_{x\downarrow a}f(x)

微分積分④ テイラーの定理

テイラーの定理とは 前提条件:コーシーの平均値の定理 コーシーの平均値の定理 $f,g$を閉区間$[a,b]$で連続かつ$(a,b)$で微分可能な関数とする。また、$g^\prime(x)\ne 0$($a \lt$$x$$\lt b$),$g(a)$$\ne$$g(b)$とする。 \begin{align*} \dfrac{f(b)-f(a)}{g(b)-g(a)}=\dfrac{f^\prime(c)}{g^\prime(c)} \end{align*} を満たす$c$が存在する。 (参考: コーシーの平均値の定理 ) これを前提としてテイラーの定理の証明を進めます。 テイラーの定理の内容とは? テイラーの定理 開区間$I$で、$n$階微分可能で、$x,b$$\in I$とする。 \begin{align*} f(x)&=f(a)+\dfrac{f^\prime(a)}{1!}(x-a)^1+\dfrac{f^{\prime\prime}(a)}{2!}(x-a)^2+\cdots+\dfrac{f^{(n-1)}(a)}{(n-1)!}(x-a)^{n-1}+\dfrac{f^{(n)}(c)}{n!}(x-a)^n \\ &=\sum_{k=0}^{n-1}\dfrac{f^{(k)}(a)}{k!}(x-a)^k+\dfrac{f^{(n)}(\xi)}{n!}(x-a)^n \end{align*} を満たす$a$と$x$の間の数$\xi$が存在する。 新しく関数$F$を定めますが、$a$を変数として以下のような関数を考えます。 \begin{align*} F(x)=f(b)-\sum_{k=0}^{n-1}\dfrac{f^{(k)}(x)}{k!}(b-x)^k \end{align*} この関数を微分します。$b$は$a$と無関係として定数とみます。 \begin{align*} F^\prime(x)&=-\left\{\sum_{k=0}^{n-1}\dfrac{f^{(k+1)}(x)}{k!}(b-x)^{k-1}+\sum_{k=1}^{n-1}\dfrac{f^{(k)}(x)}{(k-1)!}(b-x)^{

微分積分③ コーシーの平均値の定理

コーシーの平均値の定理とは 前提条件:ロルの定理 ロルの定理 $f$を閉区間$[a,b]$で連続かつ$(a,b)$で微分可能な関数とする。 \begin{align*} f(a)=f(b) \Rightarrow f^\prime(c)=0, a\lt c \lt b\text{を満たす}c\text{が存在する} \end{align*} このロルの定理を前提条件として証明を進めます。 (参考: ロルの定理 ) コーシーの平均値の定理とは? コーシーの平均値の定理 $f,g$を閉区間$[a,b]$で連続かつ$(a,b)$で微分可能な関数とする。また、$g^\prime(x)\ne 0$($a \lt$$x$$\lt b$),$g(a)$$\ne$$g(b)$とする。 \begin{align*} \dfrac{f(b)-f(a)}{g(b)-g(a)}=\dfrac{f^\prime(c)}{g^\prime(c)} \end{align*} を満たす$c$が存在する。 前回、ラグランジュの平均値の定理は、 \begin{align*} g(x)=f(x)-\left\{\dfrac{f(b)-f(a)}{b-a}(x-a)+f(a)\right\} \end{align*} とおいて、$g(x)$にロルの定理を適用させました。(参考: コーシーの平均値の定理 ) ここから類推して、以下の様な形の関数にロルの定理を用いましょう。 \begin{align*} F(x)=f(x)-\left[\dfrac{f(b)-f(a)}{g(b)-g(a)}\left\{g(x)-g(a)\right\}+f(a)\right] \end{align*} ここで、$F(a)$$=F(b)$$=0$となります。関数$F(x)$は、$[a,b]$で連続であり、$(a,b)$で微分可能なので、$F^\prime(c)=0$,$a\lt $$c$$\lt b$となる$c$が存在します。ここで、 \begin{align*} F^\prime(c)=f^\prime(c)-\dfrac{f(b)-f(a)}{g(b)-g(a)}g^\prime(c) \end{alig

微分積分② ラグランジュの平均値の定理

ラグランジュの平均値の定理の証明 前回導いたロルの定理を用いてラグランジュの平均値の定理を導きましょう。 前提条件:ロルの定理とは? ロルの定理 $f$を閉区間$[a,b]$で連続かつ$(a,b)$で微分可能な関数とする。 \begin{align*} f(a)=f(b) \Rightarrow f^\prime(c)=0, a\lt c \lt b\text{を満たす}c\text{が存在する} \end{align*} (参考: ロルの定理 ) ラグランジュの平均値の定理とは? ラグランジュの平均値の定理 $f$を閉区間$[a,b]$で連続かつ$(a,b)$で微分可能な関数とする。 \begin{align*} \dfrac{f(b)-f(a)}{b-a}=f^\prime(c),a\lt c\lt b \end{align*} を満たす$c$が存在する。 ちなみに、コーシーの平均値の定理はラグランジュの平均値の定理を経由せずにロルの定理から導きます。実はコーシーの平均値の定理で分母を$g(x)$$=x$としたものが今回のラグランジュの平均値の定理、ということになります。(参考: コーシーの平均値の定理 ) ラグランジュの平均値の定理の別ver. 同じことですが、$h$$=b-a$とおいて、 \begin{align*} c=a+\theta(b-a)=a+\theta h \end{align*} と表せば、ラグランジュの平均値の定理は、 \begin{align*} f(b)-f(a)=hf^\prime(a+\theta h), 0\lt \theta \lt 1 \end{align*} と書き換えることができます。 ラグランジュの平均値の定理の証明 まずロルの定理を用いるには、閉区間$[a,b]$で連続で、$(a,b)$で微分可能、$g(a)$$=g(b)$$となる関数を用意しなければなりません。この関数として以下の様な関数を用意します。 \begin{align*} g(x)=f(x)-\dfrac{f(b)-f(a)}{b-a}(x-a)-f(a) \end{align*} 確かに、$g(a)$$=g(b)$($=0$)が成り立ちま

微分積分① ロルの定理

ロルの定理の証明 前提条件:最大値・最小値の定理 最大値最小値の定理 有界な閉区間$[a,b]$($a$,$b$$\in$$\mathbb{R}$)て定義された連続関数$f$について、最大値と最小値が存在する。 さて、これってほぼ当たり前です。ただ証明を与える必要があるのですが、結構難しいのでここでは証明は省略します。 ロルの定理とは? ロルの定理 $f$を閉区間$[a,b]$で連続かつ$(a,b)$で微分可能な関数とする。 \begin{align*} f(a)=f(b) \Rightarrow f^\prime(c)=0, a\lt c \lt b\text{を満たす}c\text{が存在する} \end{align*} ロルの定理の証明 まずは、$f$が定数関数の場合と、それ以外の場合に分けて証明します。 定数関数の場合 $f(x)$が定数関数の場合には、 \begin{align*} f^\prime(x)=0 \end{align*} が常に成り立ちます。$a\lt$$c$$\lt b$となる$c$は定義域内にあるので、 \begin{align*} f^\prime(c)=0 \end{align*} となります。 定数関数でない場合 以下では微小な量$h$を考えて進めます。 端点が最大値にならない場合 $f(a)$$=f(b)$が最大値でない場合、最大値を取る座標を$x=\xi$とすると \begin{align*} a\lt \xi \lt b \end{align*} となります。このとき、$\xi+h$$\in [a,b]$をみたす$h$が取れて、 \begin{align*} f(\xi+h)\leq f(\xi) \end{align*} 辺々$f(\xi)$をひいて、$h$で割ります。$h$$\gt$$0$のとき、 \begin{align*} \dfrac{f(\xi+h)-f(\xi)}{h}\leq 0 \end{align*} が成り立ちます。最後に$h$$\to +0$の極限を取れば、仮定より$x$$=\xi$で微分可能なので、 \begin{align*} \lim_{h\to +0}\dfrac{f(\xi+h

微分積分⑬ ヘッセ行列による極値判定

イメージ
ヘッセ行列による極値判定 ヘッセ行列の定義 ヘッセ行列 スカラー値関数$f$について、以下の行列$H$を関数$f$のヘッセ行列といいます。 \begin{align*} H=[H_{ij}]=\left[\dfrac{\partial f}{\partial x_i \partial x_j}\right] \end{align*} 基本的に、微分を作用させる順序は交換しても変わりません。その場合、ヘッセ行列は$H_ij$$=H_{ji}$となる実対称行列です。 正定値行列と負定値行列 正定値行列 $A$を$n$$\times $$n$の行列として、零ベクトルでない任意の$n$成分の縦ベクトル$\boldsymbol{x}$に対して、 \begin{align*} {}^t\boldsymbol{x}A\boldsymbol{x}\gt 0 \end{align*} を満たす行列を正定値行列といい、$-A$が正定値行列の場合、負定値行列といいます。 実は、この正定値行列に関しては、たとえば、「固有値がすべて正」など、多くの性質がありますが、今回着目するのは、「首座行列(左上の$m$$\times$$m$行列)の行列式がすべて正」という性質です。 ヘッセ行列式による極値の判定方法 ヘッセ行列式による判定法 $f$を$C^{n+1}$級の関数とします。ある点で、すべての1次偏導関数が0になる場合、その点が極値の候補となり、 \begin{align*} \text{ヘッセ行列式が正定値}&\Rightarrow \text{極小} \\ \text{ヘッセ行列が負定値}&\Rightarrow \text{極大} \\ \text{ヘッセ行列が正定値でも負定値でもない}&\Rightarrow \text{極大でも極小でもない(鞍点)} \end{align*} ヘッセ行列式による判定方法の説明 一般の場合に証明するのは結構難しいので、$n=2$の場合に証明します。 点$(x_0,y_0)$で一次偏導関数が0となるとします。まず、この点周りに関数$f(x,y)$を2次の項までテイラー展開します。ただし、$f_{xy}$$=f_{yx}$が成り立つとし

微分積分㉑ n次元球

n次元球の体積・表面積の公式 以下のような式を考えます。 \begin{align*} x_1^2+x_2^2+x_3^2+\cdots+x_n^2\leq r^2 \end{align*} これを満たすような領域を$n$次元球といいます。以下、ガウス積分で証明する方法を紹介します。 n次元球の表面積・体積の次元を推測 ガウス積分を考える 以下のように$I$をおきます。 \begin{align*} I=\int_{-\infty}^\infty e^{-x^2}dx=\sqrt{\pi} \end{align*} ガウス積分の記事 を参照して、 \begin{align} I^n=\pi^\frac{n}{2} \label{eq:1} \end{align} となります。これを別の方法で計算できないか、ということを考えてみましょう。 \begin{align} I^n=\int_{-\infty}^\infty dx_1\int_{-\infty}^\infty dx_2\cdots\int_{-\infty}^\infty dx_n\ e^{-(x_1^2+x_2^2+\cdots+x_n^2)} \label{eq:2} \end{align} さて、右辺なのですが、この積分を変数変換することにしましょう。つまり、ヤコビアンにあたる部分を求めたいと思います。さて、具体例を考えましょう。 2,3次元のヤコビアンを考える 2次元では、$(x,y)$を$(r,\theta)$とおきかえたのでした。そして、このヤコビアン(ヤコビ行列式の絶対値)は、 \begin{align*} J_2(r,\theta)=r \end{align*} となりました。3次元では、$(x,y,z)$を$(r,\theta,\phi)$と置き換えたのでした。このときのヤコビアンは、 \begin{align*} J_3(r,\theta,\phi)=r^2\sin{\theta} \end{align*} となりました。つまり、 \begin{align*} dxdy&=J_2(r,\theta)drd\theta&= rdrd\theta \\ dxdydz&=J_3