31 Ağustos 2015 Pazartesi

Elips parçasından elipsin kütle merkezini cetvel ve pergel ile bulma

Daha önce bu blogda Kepler kanunları çerçevesinde elipsi çalışmış ve orijinin odaklardan birisiyle çakışık olduğu analitik düzlemde elipsin denklemini türetmiştik. Böyle bir yaklaşım astronomik uygulamalarda çok büyük kolaylık sağlıyordu çünkü referans noktamız güneş gezegenlerin yörüngesinin (kütle) merkezinde değil, odaklardan birisindeydi.

Şöyle bir problemle bugünkü konuyu motive edelim. Pluto'yu gözlüyorsunuz ve onu ilk keşfeden astronom sizsiniz. Kepler kanunlarından ve Newton'ın genel çekim teorisinden biliyorsunuz ki Pluto'nun yörüngesi bir elips, en azından yaklaşık olarak. Hemen şu soruyu soruyorsunuz: Pluto'nun yörüngesinin majör ve minör eksenleri nerede? Ah, unutmadan söyleyelim, bu farazi keşfinizde her şey canınızın istediği gibi değil. Güneş nedense kararmış, onu referans alamıyorsunuz. Yapabileceğiniz tek şey Pluto'nun yörüngesini bir süreliğine takip edip bir elips parçası çizmek. Yörüngenin parametrelerini çıkarabilmek için bir Pluto yılı bekleyecek kadar zamanınız yok. Sonuçta bir Pluto yılı yaklaşık 250 Dünya yılı tutuyor. Ne yapıp edip elips parçasından yörüngeyle ilgili parametreleri çıkarmanız gerekiyor. Ne yaparsınız?

Bu problemi kurdum ve çözmeden önce parabolde yaptıklarımızı (bak. Problem 17 ve 19) yineleyeceğimizi sandım ama durum o kadar kolay değildi. Öte yandan fazla da şikayet etmenin alemi yok. Sonuçta dermansız derde düşmüş değiliz! 250 yıl bekleyip Pluto'nun yörüngesinin ortaya çıkmasını bekleyebiliriz... Mürailik bir yana, biz işe operasyonel bazı lemmata ile başlayalım.

Lemma 1: Yarı majör ve yarı minör eksenleri sırasıyla $a$ ve $b$ olan elips ile $l: \ y=mx+n$ doğrusunun kesişim noktaları $P$ ve $Q$ olsun. O zaman \begin{eqnarray}\nonumber x_{P,Q} &=& \frac{-a^{2}mn \mp ab\sqrt{\Delta}}{\Delta + n^{2}} \\ \nonumber y_{P,Q} &=& \frac{b^{2}n \mp abm\sqrt{\Delta}}{\Delta + n^{2}} \end{eqnarray} ile verilir. Burada $\Delta := a^{2}m^{2}+b^{2}-n^{2}$ ile tanımlanıyor.
İspat: Elips ile doğru kesişiyorlarsa, kesiştikleri noktaların koordinatları hem elipsin hem de doğrunun denklemini sağlar. Koordinatları $(\xi,\eta)$ olan bir noktada elips ve doğru kesişsin. O zaman \begin{equation*} b^{2}\xi^{2} + a^{2}(m\xi+n)^{2} = a^{2}b^{2} \end{equation*} denklemini yeniden düzenlediğimizde aşağıdaki kuadratik denklemle karşılaşıyoruz. \begin{equation*} (b^{2}+a^{2}m^{2})\xi^{2} + 2a^{2}mn\xi + a^{2}(n^{2}-b^{2}) = 0 \end{equation*} Bu denklemin diskriminantı $4a^{4}m^{2}n^{2}-4a^{2}(n^{2}-b^{2})(a^{2}m^{2}+b^{2})$ ya da $4a^{2}b^{2}(a^{2}m^{2}+b^{2}-n^{2})$. Kuadratik formül kullanılarak $x_{P,Q}$ noktasını veren denklem ispatlanır. Bulduğumuz nokta doğru üzerinde olduğundan $\eta = m\xi + n$ ile de $y_{P,Q}$ noktasını veren denklemin ispatı tamamlanmış olur. QED

İşaret: $\Delta < 0$ ise, o zaman tabii ki elips ile doğru kesişmezler. Öte yandan $\Delta = 0$ elips ile doğrunun teğet olma şartıdır.

Şimdi birbirine paralel olacak şekilde elipse kiriş iki doğru, $c_{1}$ ve $c_{2}$ alalım. Bu doğruların eğimleri, $m$ olsun, aynıdır. Ama kesme noktaları, $n_{1}$ ve $n_{2}$ diyelim, farklıdırlar. Elips içinde birbirine paralel iki kirişin orta noktaları, $U_{1}$ ve $U_{2}$ olsun, Lemma (1) kanalıyla kolayca hesaplanılabilir. Örneğin \begin{eqnarray}\nonumber x_{U_{1}} &=& -\frac{a^{2}mn_{1}}{a^{2}m^{2}+b^{2}} \\ \nonumber y_{U_{1}} &=& \frac{b^{2}n_{1}}{a^{2}m^{2}+b^{2}} \end{eqnarray} olur. Devamla $U_{1}$ ve $U_{2}$ noktalarından geçen doğru, adına $l$ diyelim, analitik düzlemde $y = Mx + N$ denklemiyle verilsin. O zaman bu doğrunun eğimi aşağıdaki gibi olur. \begin{equation*} M=\frac{y_{U_{2}}-y_{U_{1}}}{x_{U_{2}}-x_{U_{1}}} = -\frac{b^{2}}{a^{2}m} \end{equation*} Yani kirişlerin orta noktalarını birleştiren doğrunun eğimi bu kirişlerin kesme noktalarından bağımsızdır. Ama daha önemlisi $N = y_{U_{1}}-Mx_{U_{1}}$ heaplanırsa tam olarak $N=0$ olduğu ortaya çıkar! Diğer bir ifadeyle

Lemma 2: Elips içinde birbirine paralel iki kirişin orta noktalarını birleştiren doğru, elipsin kütle merkezinden geçer.

Bu fikirleri kullanarak verilen bir elips parçasının kütle merkezini cetvel ve pergelle tayin edebiliriz.

Teorem 1: (Elips parçasından elipsin kütle merkezinin bulunması.)
  1. Verilen bir elips parçasının üstünde alınan iki farklı noktadan ($P$ ve $Q$) geçen kiriş ve bu kirişin orta noktası ($U$) tespit edilir. Bu kirişe paralel ikinci bir kiriş daha çizilir ve orta noktası $V$ tespit edilir. $U$ ve $V$ noktalarından geçen doğru $l_{1}$ çizilir.
  2. Yukarıdaki işlemler $PQ$ kirişine paralel olmayan (ama kendi aralarında paralel) başka iki kiriş için de tekrarlanır ve bu iki kirişin orta noktalarından geçen $l_{2}$ doğrusu çizilir.
  3. $l_{1}$ ve $l_{2}$ elipsin kütle merkezinde kesişirler.

27 Ağustos 2015 Perşembe

Astronomik uygulamalar için elips

Kepler kanunlarını veya bu kanunların hem bilim hem de hristiyanlık tarihindeki etkisini burada anlatmaya gerek görmüyorum. Güneş sistemindeki gezegenlerin hareketine dair olan bu kanunlardan ilkine göre gezegen odaklarından birisinde güneşin bulunduğu bir elips üzerinde hareket eder. Bu özel konumdan dolayı, astronomide güneş-gezegen dinamiği çalışılırken güneş (yani odaklardan birisi) orijinle çakışık olarak ele alınır. Bu genellikle bizim yabancısı olduğumuz bir konfigürasyondur, çünkü analitik geometride elipsin kütle merkezini orijine oturtmak daha kolaydır. O zaman bizim geometrici olarak vazifemiz Kepler kanunlarına uygun bir elips denklemi vermektir.

İşe elipsin tanımından başlayacağız: Adına odaklar denilen iki noktaya uzaklıkları toplamı sabit olan düzlemdeki bütün noktaların yerine elips denir. Kuşkusuz elipsin bundan başka tanımları da var. Ama tanımlardan birisini seçip, başlamak gerekiyor. Aynı zamanda mekanik olarak elips çizimi için en uygun tanım da budur.

Şimdi genelliği kaybetmeden odakları $F_{1}:=(-f,0)$ ve $F_{2}:=(f,0)$ noktalarına yerleştirelim. Elips $x$ eksenini $(a,0)$ noktasında kessin. O zaman, elipsin tanımı uygulandığında \begin{equation*} a - f + a + f = 2a =: K \ ({\rm bir \ sabit}) \end{equation*} olması gerektiği görülür. Devamla elipsin $y$ eksenini $(0,b)$ noktasında kestiğini kullanırsak, o zaman da yine elipsin tanımı gereği \begin{equation*} 2\sqrt{b^{2}+f^{2}} = K = 2a \end{equation*} olur. Her iki tarafın karesi alınıp bu denklem yeniden düzenlendiğinde odak uzaklığını ifade edebiliyoruz. \begin{equation*} f = \sqrt{a^{2}-b^{2}} \end{equation*} Son olarak herhangi bir nokta için de elipsin tanımını kullanalım. \begin{equation*} \sqrt{(x-f)^{2}+y^{2}} + \sqrt{(x+f)^{2}+y^{2}} = 2a \end{equation*} Her iki tarafın karesi alınıp sadeleştirmelerden sonra aşağıdaki sonuca ulaşıyoruz. \begin{equation*} x^{2}+f^{2}+y^{2} + \sqrt{\{(x-f)^{2}+y^{2}\}\{(x+f)^{2}+y^{2}\}} = 2a^{2} \end{equation*} Bu denklemde köklü ifade tek başına bırakılıp, her iki tarafın karesi bir daha alınırsa, o zaman bazı sadeleşmelerden sonra elips için aşağıdaki -liseden alışık olduğumuz- denkleme ulaşıyoruz. \begin{equation*} \bbox[5px,border:3px solid black]{b^{2}x^{2}+a^{2}y^{2}-a^{2}b^{2}=0} \end{equation*}

Şimdi şekilde görüldüğü gibi orijini odaklardan birisine mesela $F_{1}$ noktasına kaydıralım. Bu kaydırmayı elipsin denkleminde $x \to x-f$ koyarak ifade edebiliriz: $b^{2}(x-f)^{2}+a^{2}y^{2}=a^{2}b^{2}$ denklemini açıp sadeleştirmeleri ve gerekli yeniden düzenlemeleri yaptığımızda aşağıdaki sonuca ulaşıyoruz. \begin{equation*} x^{2} - b^{2} - 2fx + (a/b)^{2}y^{2} = 0 \end{equation*} Şimdi elipsle ilgili bir katsayıyı tanımlamanın zamanı geldi. Bir elipsin dışmerkezlilik katsayısı (hariç an'il-merkeziyyet, eccentricity) $\epsilon := \tfrac{f}{a} = \sqrt{1 - \tfrac{b^{2}}{a^{2}}}$ denklemiyle tanımlanıyor. $f>0 \Rightarrow a>b$ gerektirdiğinden, $\epsilon \in (0,1)$ olur. $\epsilon=0$ ise elips bir çemberdir. O zaman şöyle diyebiliriz. $\epsilon$ elipsin çemberden sapmasını ölçer. Dışmerkezlilik katsayısını kullanıp denklemlerden $b$ ve $f$ niceliklerini elediğimizde çalışmamız gerekli elips denklemi şöyle olur. \begin{equation*} x^{2} - (1-\epsilon^{2})a^{2} - 2\epsilon a x + \frac{1}{1-\epsilon^{2}}y^{2} = 0 \end{equation*}

Ne yazık ki astronomide bu da yetmiyor! Çünkü genel çekim kanununda güneş ile gezegen arasındaki mesafe $r := \sqrt{x^{2}+y^{2}} \geq 0$ kullanılıyor ve kutuplu koordinatlarda denklemleri ifade etmek problemin simetrisine de uyacağı için daha bir önem kazanıyor. O zaman $x=r\cos\phi$ ve $y = r\sin \phi$ dönüşümlerini uyguladığımızda elipsin kutuplu koordinatlardaki denklemi için bazı işlemlerden sonra $r^{2} - \{\epsilon r \cos \phi + (1-\epsilon^{2})a^{2}\}^{2}=0$ denklemine ulaşıyoruz. Bu denklemi çarpanlarına ayırıp $r$ için çözdüğümüzde Kepler ve diğer astronomların kullandıkları elips denklemine ulaşıyoruz. \begin{equation*} \bbox[5px,border:3px solid black]{r = \frac{(1-\epsilon^{2})a}{1 - \epsilon \cos \phi}} \end{equation*}

Güneşe en yakın mesafe perihelion $\phi = \pi$ durumunda ölçülür ve $(1-\epsilon)a$ kadardır. En uzak mesafe ise aphelion $\phi=0$ durumundadır ve değeri $(1+\epsilon)a$ kadardır. Aphelion ve perihelion ölçülerek gezegenin yörüngesi için $a$ (yarı majör eksen) ve $\epsilon$ değerleri kolayca tayin edilebilirler.

24 Ağustos 2015 Pazartesi

Cetvel ve pergelle parabol parçasının odağının, simetri ekseninin ve tepe noktasının bulunması

Daha önce bu blogda bir parabol parçası üzerinde verilen bir noktaya cetvel ve pergel ile teğet çizmeyi tarif etmiştik. Bugün aynı çerçevede konuyu ilerleteceğiz ve önceki postada (bundan sonra P1 diyelim) kullandığımız notasyondan ve önermelerden faydalanacağız.

Teorem 1: (Parabolün simetri eksenine paralel gelen ışınların yansıması.) Bir parabol parçası ve onun üzerinde bir $P$ noktası verilsin. Parabolün simetri eksenine paralel ve $P$ noktasından geçen $s$ doğrusu çizilsin. (bak. P1 Teorem (2)) Parabole $P$ noktasında $t$ teğeti çekilsin. (bak. P1 Teorem (3)) $P$ noktasından geçen ve $t$ teğetine dik $n$ doğrusu çizilsin. $s$ ve $n$ doğruları arasındaki açıya $\alpha$ diyelim. $n$ doğrusu ile $\alpha$ açısı yapan ikinci bir doğru, adına $r$ diyelim, çizilsin. $s$ ışını $P$ noktasından yansıdıktan sonra $r$ doğrusu üstünde kalır.
İspat: Bariz. QED (Buradaki açı dublikasyonunun temel Öklit çizimleriyle yapılabileceğini vurguluyoruz.)

Cetvel ve pergelle simetri eksenine paralel ve parabole teğet çizmeyi daha önceki yazımızda hallettiğimiz için burada yansıma kanununu ve temel Öklit çizimlerini kullanarak ışınların parabol yüzeyinden yansımasına dair çizimi yapmak kolay oldu. Şimdi aynı işi bir de analitik geometri çerçevesinde yapalım. Bu bize fen ve mühendisliğin pek çok branşında defalarca karşımıza çıkacak, çok kullanışlı bir sonuç verecektir.

Lemma 1: Parabole $P:=(\xi,\xi^{2})$ noktasında simetri eksenine paralel gelen ışın, bu noktadan yansıdıktan sonra $y=\tfrac{4\xi^{2}-1}{4\xi}x + \tfrac{1}{4}$ doğrusu üzerinde kalır.
İspat: Parabole $P$ noktasında çekilen teğetin eğimi $\tan \alpha := 2\xi$ kadardır. (bak. P1 Lemma (2)) Parabolün simetri eksenine paralel gelip $P$ noktasından yansıyan ışının eğimi $\tan(2\alpha - \tfrac{\pi}{2})$ kadar olması gerektiği üstteki şekilden görülür. Temel trigonometri kullanılarak bu değerin $(\tan^{2}\alpha -1)/2 \tan \alpha$ olduğu gösterilebilir. Demek ki yansıyan ışının eğimi $(4\xi^{2}-1)/4\xi$ kadarmış. Bu ışın $(\xi,\xi^{2})$ noktasından geçtiğine göre, basit argümanlar sonucunda kesme noktasının $1/4$ olması gerektiği görülür.

İşaret: Yansıyan ışın parabolün simetri eksenini $F:=(0,1/4)$ noktasında kesiyor. Bu noktanın koordinatı ışının parabol üzerinde hangi noktadan yansıdığından bağımsız! O zaman parabolün simetri eksenine paralel gelen her ışın $F$ noktasından geçer ve bu noktaya parabolün odağı denir. Parabolik bir aynayı güneşe tuttuğunuzda bütün ışınlar odak noktasından geçeceğinden, bu noktada sıcaklık aniden yükselecektir. Efsane doğruysa Arşimet, Roma donanmasının gemilerini parabolik aynalar kullanarak yakmıştır. (Bu konuya daha önce teferruatlı bir şekilde bu blogda değinmiştik.) Spektroskopide, optikte ve akustikte ışınları ve dalgaları odaklamaya çalışan insanlar parabolik aynalar ve kubbeler kullanırlar. Bu fikrin tersi de doğrudur. Noktasal bir ışın ya da dalga kaynağını parabolik bir aynanın odağına yerleştirdiğinizde, aynadan yansıyan ışınlar parabolün simetri eksenine paralel yayılırlar. Buna optik spektroskopide kolimasyon denir.

Teorem 2: (Parabol parçasının simetri ekseninin bulunması.) Verilen bir parabol parçası üzerinde $P$ ve $Q$ noktaları alınsın. Bu noktalara parabolün simetri eksenine paralel gelen $s_{P}$ ve $s_{Q}$ ışınları (bak. P1 Teorem (2)), sırasıyla $r_{P}$ ve $r_{Q}$ ışınları olarak yansısınlar. (bak. Teorem (1)) $r_{P}$ ve $r_{Q}$ ışınlarının kesişim noktasına $F$ diyelim. $F$ noktasından geçen ve $s_{P}$ doğrusuna paralel olan, adına $y$ diyelim, doğru parabolün simetri eksenidir.
İspat: (1) nolu lemmanın ispatından da görüleceği üzere parabolün simetri eksenine paralel gelen ışınlar, hangi noktadan yansıdıklarına bakılmaksızın, parabolün simetri eksenini sabit bir noktada, odak noktasında keserler. Teoremde verilen $r_{P}$ ve $r_{Q}$ ışınları odak noktasından geçeceğine göre, bu ışınların kesişim noktası simetri ekseni üzerindedir. QED

Parabol parçasının hem odak noktasını hem de simetri eksenini cetvel pergel çizimiyle bulmayı tarif ettik. Artık tepe noktasının bulunması nisbeten basit bir iştir.

Teorem 3: (Parabol parçasından parabolün tepe noktasının bulunması.) Önce parabol parçasının simetri ekseni bulunur. (bak. Teorem (2)) Parabol parçası üstündeki herhangi bir $P$ noktasından simetri eksenin dikme çekilir. Bu dikmenin ekseni kestiği noktaya $Q$ diyelim. Daha sonra parabole $P$ noktasından bir teğet çekilir. Bu teğetin simetri eksenini kestiği noktaya da $R$ diyelim. $Q$ ve $R$ noktalarının orta noktası $T$ tayin edilir. $T$ parabolün tepe noktasıdır.
İspat: $P=(\xi,\xi^{2})$ noktasının simetri eksenine izdüşümü $Q=(0,\xi^{2})$ olur. P1 Lemma (2) uyarınca parabole $P$ noktasında çekilen teğet simetri eksenini $R=(0,-\xi^{2})$ noktasında keser. Buradan $T=(0,0)$ olduğu barizdir. QED

İşaret: Daha önce parabolün $y$ (simetri) eksenini bulmuştuk. Tepe noktası ise $x$ ile $y$ eksenlerinin kesişmindedir. O zaman simetri eksenine tepe noktasından çekilen dikme basitçe $x$ eksenini verecektir.

20 Ağustos 2015 Perşembe

Descartes'in ovali ve mükemmel odaklama merceği

Henüz bu blogda anlatmadık ama elipsoid aynaların bir özelliği var: odaklarından birisinden yayılan ışınlar öbür odakta toplanıyor. Yansımayla yapılan bu işin bir benzerini de merceklerde Descartes'in ovoidi ile yapmak mümkündür. (Ovoid, oval adı verilen ve dördüncü dereceden cebirsel denklemlerin locus'u olan bir eğrinin optik eksen ya da simetri ekseni etrafında döndürülmesiyle oluşan üç boyutlu yüzeydir.) Kuşkusuz odaklamanın mükemmel olması isteniyorsa, o zaman ışığın monokormatik olması gerekir ama bu şimdilik bizim için ikinci planda kalan bir teferruat.

İşe problemin tanımı ve spesifikasyonlarıyla başlayalım. Bir noktadan çıkan ışınları (şekilde $F_{1}$), mercekte kırıldıktan sonra ve mercek içinde başka bir noktada (şekilde $F_{2}$) odaklamak istiyoruz. $F_{1}F_{2}$ doğrultusu $x$ ekseni ile çakışık, $O$ noktası ise karteziyen düzlemin orijini olsun. $|F_{1}O|=:s_{0}$ ve $|OF_{2}|=:s_{1}$ diyelim. Fermat'nın en kısa zaman ilkesi uyarınca $F_{1}OF_{2}$ rotasını takip eden ışınla $F_{1}PF_{2}$ rotasını takip eden ışın aynı zamanı harcarlar. O zaman $F_{1}OF_{2}$ rotası için \begin{equation*} t_{1} := \frac{s_{0}}{c/n_{0}} + \frac{s_{1}}{c/n_{1}} \ \Rightarrow \ ct_{1} = n_{0}s_{0} + n_{1}s_{1} \end{equation*} olsun. Benzer şekilde $P$ noktasının koordinatlarını $(x,y)$ olarak aldığımızda $F_{1}PF_{2}$ rotasında giden ışının harcadığı zaman için \begin{eqnarray}\nonumber &&t_{2}:= \frac{\sqrt{(s_{0}+x)^{2}+y^{2}}}{c/n_{0}} + \frac{\sqrt{(s_{1}-x)^{2}+y^{2}}}{c/n_{1}} \ \Rightarrow \ \\ \nonumber &&ct_{2} = n_{0}\sqrt{(s_{0}+x)^{2}+y^{2}} + n_{1}\sqrt{(s_{1}-x)^{2}+y^{2}} \end{eqnarray} eşitliği geçerlidir. Şimdi $1 < \eta := n_{1}/n_{0}$ tanımıyla $ct_{1}=ct_{2}$ eşitlediğimizde oval için bir denklem elde ediyoruz. \begin{equation*} K:= s_{0} + \eta s_{1} = \sqrt{(s_{0}+x)^{2}+y^{2}} + \eta \sqrt{(s_{1}-x)^{2}+y^{2}} \end{equation*} Burada $\eta, s_{0},$ ve $s_{1}$ ovali tanımlayan parametrelerdir. (Her ne kadar $K$ da bir parametre gibi görünse de, diğerlerinden bağımsız değildir.)

Yukarıdaki denklemlerde yer alan ifadeler öncelikle $K - \sqrt{(s_{0}+x)^{2}+y^{2}} = \eta \sqrt{(s_{1}-x)^{2}+y^{2}}$ şeklinde yeniden düzenlenir ve daha sonra da her iki tarafına karesi alınırsa aşağıdaki arasonuç elde edilir. \begin{eqnarray}\nonumber K^{2} &+& (s_{0}+x)^{2} + y^{2} - 2K\sqrt{(s_{0}+x)^{2}+y^{2}}\\ \nonumber &&=\eta^{2}((s_{1}-x)^{2}+y^{2}) \end{eqnarray} Burada da tekrar karekökü yalnız bırakıp, diğer ifadeleri açtığımızda aşağıdaki ikinci arasonuca ulaşıyoruz. \begin{equation*} s_{0} + \alpha x - \frac{\eta^{2}-1}{2K} (x^{2}+y^{2}) = \sqrt{(s_{0}+x)^{2}+y^{2}} \end{equation*}

$0 < \alpha := (s_{0}+\eta^{2}s_{1})/K$ denklemiyle tanımlanmıştır ve birimsiz bir niceliktir.

$K$ niceliğinin 1/uzunluk biriminde (ya da boyutunda) olduğunu gözleyiniz. Sistemi karakterize eden bu parametreyi, birimsiz nicelikleri tanımlamakta kullanacağız. \begin{equation*} X := \frac{\eta^{2}-1}{2K}x, \ \ \ Y := \frac{\eta^{2}-1}{2K}y \ \ \ {\rm ve} \ \ \ S_{0} := \frac{\eta^{2}-1}{2K}s_{0}. \end{equation*} Birimsiz nicelikler ovalin denklemine konulduğunda problemin iki parametreye kadar indirgenebileceğini görüyoruz: \begin{equation*} S_{0} + \alpha X - X^{2} - Y^{2} = \sqrt{(S_{0}+X)^{2}+Y^{2}}. \end{equation*} Nihayet bu denklemde de her iki tarafın karesi alınıp, $Y$'nin kuvvetlerine göre denklem yeniden düzenlenirse, o zaman ovalin denklemi için aşağıdaki cebirsel denkleme ulaşırız. \begin{eqnarray}\nonumber Y^{4} &+& (2X^{2}-2(S_{0}+\alpha X)-1)Y^{2} + X^{4} - 2\alpha X^{3} \\ \nonumber &&+ (\alpha^{2} - 2S_{0} - 1)X^{2} + 2S_{0}(\alpha -1)X = 0 \end{eqnarray}

Her ne kadar bu denklem $Y$ için dördüncü dereceden görünse de, aslında ikinci dereceden denklemler için bilinen yöntemlerle $Y^{2}$ için rahatça çözülebilir. Diskriminantı hesapladığımızda şaşırtıcı derecede küçük bir ifadeyle karşılaşıyoruz. \begin{eqnarray} \nonumber \Delta &:=& (2X^{2}-2(S_{0}+\alpha X)-1)^{2} - 4X^{4} \\ \nonumber &&+ 8\alpha X^{3} -4(\alpha^{2}-2S_{0}-1)X^{2} - 8S_{0}(\alpha-1)X \\ \nonumber &=& (2S_{0}+1)^{2} + 4(\alpha + 2S_{0})X \end{eqnarray} Bu diskriminantın $X > 0$ için, her zaman pozitif olduğu açıktır. Artık ovalin denklemini verebiliriz. \begin{equation*} \bbox[5px,border:3px solid black]{Y(X;\alpha, S_{0}) = \pm \sqrt{\frac{-2X^{2}+2(S_{0}+\alpha X) +1 \pm \sqrt{\Delta}}{2}}} \end{equation*}

Karekökün dışındaki işaretlerden her ikisini de alacağız. Çünkü bunlar ovalin $x$ eksenine göre simetrik olduğunu temsil etmek için vardır. Öte yandan karekökün içindeki işaretlerden sadece negatif olanını alacağız. Zira $X=0$ için biz $Y=0$ olsun istiyoruz. Ama \begin{equation*} Y(0;\alpha, S_{0}) = \pm \sqrt{\frac{2S_{0}+1 \pm (2S_{0}+1)}{2}} \end{equation*} olduğundan, $Y(0)=0$ ancak diskriminantın önündeki işaretin negatif olmasıyla mümkündür.

Ovalin şeklinin tam bir yumurtaya benzediğini gözleyiniz.

Sol: $s_{0}=5$ cm, $s_{1}=8$ cm ve $\eta=1.5$ için oval şekli ve odak noktaları gösteriliyor. Sağ: Aynı ovoidden merkezi $F_{2}$ olan bir küre oyularak yapılmış bir mercek. Bu işlem sayesinde ovoidin her iki odağı da hava ortamına taşınmış oluyor.

İşaret: Oval denkleminin çözümünde, karekökün içindeki $-2X^{2}$ terimi, $X$'in büyük değerleri için diğer terimleri bastıracağından, oval eğrisi her $X$ değeri için gerçel sayılarda tanımlı değildir.

İşaret: Ovoidin odaklarından birisi merceğin içinde olduğundan, bu haliyle spektroskopik dizaynlerde çok da fonksiyonel değildir. Ama ovoid merkezi $F_{2}$ olan bir küre ile oyulursa, o zaman $F_{2}$ odağı da hava ortamına geçmiş olur. Kürenin merkezi $F_{2}$ noktasından olduğundan $PF_{2}$ ışını küre yüzeyine dik gelmektedir ve kırınıma uğramaz.

İşaret: Ovoid, diaoptriksin temel kusurunu tevarüs etmiştir. Kırınım indisi dalgaboyuna bağlı olduğundan, $F_{1}$ ve $F_{2}$ noktaları sadece bir dalgaboyunda kesin bir biçimde odaklama yapabilirler.

Diğer dalgaboylarında bu özellik kaybolur. Kırınım indisi çalışılan dalgaboylarında fazla değişmeyen malzemeler ile ovoid yapılmalı ve kromatik aberasyon sorunu böylece aşılmalıdır.

Ödev

  1. Oval $x$ eksenini orijinde ve başka bir noktada daha kesmektedir. Bu nokta nasıl hesaplanır?
  2. Ovalin $y$ değerlerinin ekstremumlarını hesaplayınız.
  3. $F_{2}$'de toplanan ışın şiddetini maksimum yapmak için ovoidden oyulacak kürenin yarıçapı nasıl hesaplanır?

18 Ağustos 2015 Salı

Cetvel ve pergel ile parabol parçasındaki bir noktaya teğet çizimi

Geoffrey Taylor'ın hikayesini anlatırken bir ters çember problemi çözmüştük. Küresel bir ateş topunun fotoğrafı vardı ve bizim bu ateş topunun merkezini ve yarıçapını bulmamız gerekiyordu. Bu postada da benzer bir ters parabol problemi çalışacağız. Bize bir parabol veriliyor. Ama bu parabolün $x$ ve $y$ eksenlerini silmişler. Dahası parabolün hepsini de değil sadece bir parçasını vermişler. Sonra da şu soruyu sormuşlar: Bu parabol parçasının üstünde bir nokta veriliyor. Sadece cetvel ve pergel kullanarak parabole bu noktadan bir teğet çiziniz. Bu cetvelin Öklit cetveli olduğunu, yani uzunluk ölçmeyip sadece önceden tespit edilen iki noktayı birleştirerek düz bir doğru (ya da doğru parçası) çizebildiğini, pergelin de ayaklarıyla uzunluk taşımadığını vurgulayalım.

Gerekli çizimleri burada tek tek açıklayacağız. Ama çizimlerimizin doğruluğunu ispatlamak için analitik geometriyi kullanacağız. Kabul edelim ki bu çok da klasist bir çözüm değil. Ama klasik bir yaklaşım bu yazının uzunluğunu rahatlıkla iki kat arttırırdı. İşe parabollerin analitik formunu olabildiğince sadeleştirmekle başlıyoruz.

Lemma 1: $y=ax^{2}+bx+c$ formundaki bütün paraboller eksen kayması ve ölçek değişimi gibi dönüşümlerle $Y=X^{2}$ formuna getirilebilirler.
İspat: $x=:\xi - \tfrac{b}{2a}$ ile $x$ eksenini kaydıralım. (Bu dönüşüme cebir literatüründe von Tschirnhaus ya da Tschirnhausen dönüşümü denir.) \begin{equation*} y = a \left(\xi - \frac{b}{2a}\right)^{2} + b\left(\xi-\frac{b}{2a}\right) + c = a\xi^{2}+c-\frac{b^{2}}{4a} \end{equation*} Şimdi $y =: \eta + c - \tfrac{b^{2}}{4a}$ dönüşümü ile $y$ eksenini kaydıralım. O zaman barizdir ki bu eksenlerde parabolün denklemi $\eta = a \xi^{2}$ olur. Nihayet ölçü birimimizi $\xi =: X/a$ ve $\eta =: Y/a$ şeklinde değiştirirsek $Y=X^{2}$ ispatlanır. QED

İşaret: $xy \to \xi \eta \to XY$ dönüşümleri, parabol dediğimiz somut nesneyi değiştirmiyorlar. O, olduğu gibi kalıyor. Öte yandan $xy$ düzleminde üç parametreye bağlı olan parabol denklemi, $XY$ düzleminde hiç bir parametreye bağlılık göstermiyor. Bu hesaplamalarımızda büyük kolaylık sağlayacaktır.

Günlük hayatta bize paraboloid bir ayna ya da Boğaziçi Köprüsü gibi parabol şeklinde olan bir asma köprü verildiğinde hiç kimse bu nesnelerin $x$ ve $y$ eksenlerini ya da tepe noktalarını vermeyecektir. Ama parabollerle ilgili pek çok canalıcı mesele, örneğin odak noktaları gibi, simetri ($y$) eksenlerinde düğümlendiği için bir parabol parçasının simetri eksenini bulmak aslında epeyce önemli bir iş. Burada şimdilik simetri eksenini bulmayacağız. Ama ona paralel doğrular bulmakla yetineceğiz.

Teorem 1: (Parabolün simetri eksenine paralel bir doğru bulma.) Parabol parçası üzerinde farklı iki nokta, $Q$ ve $R$ diyelim, alınsın ve $QR$ kirişinin orta noktası, ona da $U$ diyelim, tespit edilsin. İkinci olarak parabol üzerinde $Q$ ve $R$ noktalarından farklı, adına $S$ diyelim, üçüncü bir nokta alınsın ve $S$ noktasından $QR$ kirişine paralel bir doğru çizilsin. Söz konusu doğru parabolü $T$ noktasında kessin ve $ST$ kirişinin orta noktasına da $V$ diyelim. Son olarak $V$ ve $U$ noktalarından geçen doğru parçası, adına $s_{1}$ diyelim, ya parabolün simetri eksenidir ya da ona paraleldir.
İspat: $QR$ kirişinin uzatılmasıyla elde edilen doğrunun denklemi $c_{Q}: \ y=mx+n$ olsun. Burada $m$ ve $n$ değerleri bize veriliyor. O zaman bu doğrunun $y=x^{2}$ parabolüyle kesişim noktaları ikinci dereceden $x^{2}=mx+n$ denkleminin çözümüyle kolayca bulunabilir: $x_{Q,R} = \tfrac{1}{2}(m \mp \sqrt{\Delta})$. Burada diskriminant $\Delta := m^{2}+4n$ denklemiyle tanımlanıyor ve $x_{Q}$ denildiğinde $Q$ noktasının $x$ koordinatı anlaşılmalıdır. Kurulum gereği $x_{U} = \tfrac{1}{2}(x_{Q}+x_{R})$ olduğundan $x_{U} = \tfrac{1}{2}m$ olur. Dikkat edilirse $U$ noktasının $x$ koordinatı sadece $c_{Q}$ doğrusunun eğimine bağlıdır. Yine kurulum gereği $ST$ kirişinin uzatılmasıyle elde edilen doğru $c_{Q}$ doğrusuna paralel olacağından, onun da eğimi $m$ olmak zorundadır. O zaman $x_{V}=m$ olur. Şimdi $s_{1}$ doğrusu $V$ ve $U$ doğrularından geçiyorsa eğimi sonsuzdur. O zaman $s_{1}$ doğrusu ya parabolün simetri ekseni olan $y$ eksenidir ya da ona paraleldir. QED

İşaret: Bu teoremde algoritmik bir sıralamayla verilen işlemlerin tamamen Öklit'in bize öğrettiği cetvel-pergel çizimleriyle yapılabileceğini gözleyiniz. Hatta öyle ki, bu işlemler için cetvelin düz kenarlı olması yeterli. Diğer bir ifadeyle cetvelle uzunluk ölçmüyoruz.

Teorem 2: (Parabolün üstünde verilen bir noktadan geçen ve simetri eksenine paralel doğruyu bulma.) Bir parabol parçası ve onun üzerinde bir $P$ noktası verilsin. (1) nolu teoremde tarif edildiği gibi parabolün simetri eksenine paralel bir doğru, adına $s_{1}$ diyelim, bulunsun ve bu doğru parabolü $p$ noktasında kessin. Genellikle $P \ne p$. İkinci olarak $P$ noktasından geçen ve $s_{1}$ doğrusuna paralel ikinci bir doğru daha, adına $s_{2}$ diyelim, kurulsun. Aranılan doğru $s_{2}$ doğrusudur.
İspat: Bariz. QED

Parabol üstünde verilen bir noktadan $y$ eksenine paralel bir doğru çizmeyi tarif ettik. Aynı noktaya teğet çekmek için küçük bir ön hazırlık yapmamız gerekiyor.

Lemma 2: Parabole $P:=(\xi,\xi^{2})$ noktasında çekilen teğetin denklemi $t_{P}: \ y = 2 \xi x - \xi^{2}$ ile verilir.
İspat: Aradığımız teğetin denklemi $y = mx+n$ olsun. Bu teğet parabole sadece $P$ noktasında dokunduğuna göre, $\xi^{2}=m\xi+n$ denkleminin sadece bir çözümü vardır. Bu ikinci dereceden cebirsel ifadenin diskriminantı $\Delta:=m^{2}+4n$ ise, o zaman teğet olma şartı $\Delta =0 \iff n=-\tfrac{1}{4}m^{2}$ ile verilir. Parabol ve doğrunun kesişimlerini bir kere daha kullanalım: $\xi^{2} = m\xi - \tfrac{1}{4}m^{2} \iff (m-2\xi)^{2}=0$ ya da $m=2\xi$ bulunur. QED

Şimdi bu lemma ve daha önce ispatladığımız önermeleri kullanarak cetvel ve pergelle parabole verilen bir noktadan teğet çekmeyi tarif edeceğiz.

Teorem 3: (Parabolün üstünde verilen bir noktaya teğet çekme.) Bir parabol parçası ve o parabol parçasının üzerinde bir $P$ noktası verilsin. (2) nolu teoremde tarif edildiği gibi bu noktadan parabolün simetri eksenine paralel, adına $s$ diyelim, bir doğru parçası çizilsin. $P$ noktasından geçen ve $s$ doğrusuna dik $r$ doğrusu çizilsin. $r$ doğrusu üzerinde $|AP|=|PB|$ şartını sağlayacak şekilde $A$ ve $B$ noktaları bulunsun. ($A$ noktası parabolün içinde, $B$ noktası dışında olmalıdır.) $A$ ve $B$ noktalarından geçen ve $r$ doğrusuna dik doğrular parabolü $Q$ ve $R$ noktalarında kessinler. $QR$ kirişi parabole $P$ noktasından çekilen teğete paraleldir.
İspat: $QR$ kirişinin orta noktası $V$ olsun. Kurulum gereği $P$ noktası $AB$ doğru parçasının tam ortasında olduğundan, üçgenlerin benzerliği kullanılarak $x_{V}=x_{P}$ olduğu rahatça ispatlanılabilir. (1) nolu teoremin ispatında da gösterildiği gibi $QR$ kirişinin eğimi $2x_{V}=2x_{P}$ olmalıdır. Ama lemma (2) uyarınca bu aynı zamanda parabole $P$ noktasından çekilen teğetin eğimi ile aynıdır. Temel Öklit çizimlerinin imkanları kullanılıp, $P$ noktasından geçen ve $QR$ kirişine paralel bir doğru çizilerek ispat tamamlanır.

14 Ağustos 2015 Cuma

G. I. Taylor sadece patlama fotoğraflarına bakarak atom bombasının enerjisini hesapladı

Birleşik Devletler Kara Kuvvetleri Komutanlığı (US Army) tarafından 16 Temmuz 1945 tarihinde Socorro (NM) şehrinin 56 km güneydoğusundaki White Sands Proving Ground'da gerçekleştirilen Trinity (teslis) kod adlı tatbikat aynı zamanda Atomik Çağ'ın da başlangıcını tespit eder. Bu tatbikatta patlatılan ve gayrıresmi kod adı The Gadget (alet edevat) olan silah, daha sonra 9 Ağustos 1945'te Nagasaki'ye atılan Fat Man (şişman adam) kod adlı bombayla aynı prensibe dayanarak çalışmaktaydı. Trinity Tatbikatı'nda 20 kilotonluk TNT'nin patladığında yaydığı enerjiye eşdeğer bir patlama üretilmiştir.

1947 yılında Birleşik Devletler Atomik Enerji Komisyonu'nun (US Atomic Energy Commission) Trinity Tatbikatı'ndaki patlamanın video görüntülerini yayınlamasıyla birlikte, akışkanlar mekaniği ve dalga teorisi alanlarında bir uzman olan İngiliz matematikçi ve fizikçi Sir Geoffrey Ingram Taylor şok cephesinin yayılmasıyla ilgili teorilerini kanıtlamak üzere bu görüntüleri kullanmıştır. Çalışmalarını 1950 yılında iki makale ile yayınlayan Taylor, sadece Atomik Enerji Komisyonu'nun yayınladığı görüntüleri kullanarak, Trinity Tatbikatı'nda kullanılan atom bombasından çıkan enerjiyi de kestirebilmiştir. Bu enerji değeri o zamanlar için askeri sır olarak kabul ediliyordu ve Taylor'ın yalnızca fotoğraflara bakarak bu değeri kestirebilmesi kamuoyunda ve siyasi çevrelerde bir süre konuşuldu. 50'li yılların, Soğuk Savaş dönemindeki nükleer silahlanma yarışına denk geldiği hatırlanacak olursa, Taylor'ın makalesinin NATO ittifakı için ne denli büyük bir istihbarat skandalı ve fiyaskosu olduğu daha net algılanabilir.

Taylor'ın teorisi bugün astrofizikteki süpernova patlamaları da dahil olmak üzere, küresel simetrik patlamaların olduğu pek çok alanda uygulanmaktadır. Biz bu postada Taylor'ın yaptığı veri analizinin temel ilkelerini anlatacağız. Literatürde Taylor-Sedov patlaması olarak bilinen enerji yoğunluğunun bir akışkan içinde yayılmasıyla ilgili teoriye göre, şok cephesinin yarıçapı ($R$) ile anlık patlamadan sonra geçen zaman ($t$) arasında aşağıdaki gibi bir kuvvet kanunu vardır. \begin{equation} R = At^{\mu} \end{equation} Burada $A$ bir sabit olup, patlamanın yaydığı enerjiyle bağlantılıdır. $\mu>0$ ise teoriye göre değeri $2/5$ olan bir kuvvettir. Şimdi bu denklemde her iki tarafın logaritmasını alırsak, o zaman \begin{equation} \log R = \mu \log t + \log A \end{equation} denklemini elde ederiz. $y:= \log R$ ve $x := \log t$ tanımlarıyla aslında bu denklemin $y = mx+n$ formunda bir doğru denklemi olduğu barizdir. Burada doğrunun eğimi $m=\mu$ ve kesme noktası da $n=\log A$ olur. İstatistiksel veri analizindeki en küçük kareler yöntemi Atomik Enerji Komisyonu'nun yayınladığı fotoğraflara uygulanırsa, o zaman hem $\mu$ hem de $A$ değerleri kestirilmiş olur. Çünkü fotoğrafların üzerinde patlamadan sonra kaç saniye geçtiği ve fotoğrafın ölçeği (yani birim uzunluğun kaç metreye tekabül ettiği) verilmektedir. Örneğin aşağıdaki fotoğraf patlamadan 15 ms sonra çekilmiştir.

Bizim geometrici olarak burada vazifemiz şok cephesinin yarıçapını hesaplamaktır. Bunu yapmanın bir kaç yolu var. Ateş topunun üstünde üç nokta seçelim ve bu üç noktadan oluşan $ABC$ üçgeninin kenar uzunluklarını ($a,b,c$) cetvelle ölçelim. Daha önce bu blogda kenarları verilen bir üçgen için çevral çemberin yarıçapını hesaplamayı anlatmıştık. \begin{equation} R = \frac{abc}{\sqrt{(a+b+c)(-a+b+c)(a-b+c)(a+b-c)}} \end{equation} Nihayet fotoğraf üzerinden ölçtüğümüz uzunluğun gerçekte kaç metreye tekabül ettiğini de ölçekten kolayca bulabiliriz.

Gerekmiyor ama ateş topunun merkezi de tespit edilebilir. Şekilde gösterildiği gibi $AB$, $AC$ ve $BC$ kenarlarının orta noktalarını tespit ettikten sonra, kenarlara bu noktalardan çekilen dikmeler ateş topunun merkezini (şekilde $O$ noktası) gösterir. Merkezin, patlamadan 15 ms sonra yaklaşık olarak yerden 30 m yüksekte olduğuna dikkat ediniz. Öldürme gücü daha yüksek olsun diye, atom bombaları zemine sıfırda patlatılmaz. Onun yerine zemine mesela 100 m gibi bir yükseklikteyken bomba düzeneği uzaktan kumandayla patlatılır.

Taylor'ın konuyla ilgili makaleleri

  1. G. Taylor, The Formation of a Blast Wave by a Very Intense Explosion. I. Theoretical Discussion, Proc. R. Soc. Lond. A 201, 159-174 (1950). doi: 10.1098/rspa.1950.0049
  2. G. Taylor, The Formation of a Blast Wave by a Very Intense Explosion. II. The Atomic Explosion of 1945, Proc. R. Soc. Lond. A 201, 175-186 (1950). doi: 10.1098/rspa.1950.0050

İkizkenar bir üçgenin eşit kenarlarına ve çevral çemberine teğet bir çemberin çizimi

IMO 1978/4: $ABC$ üçgeninde $|AB|=|AC|$ veriliyor. Bu üçgenin çevral çemberine ve eşit kenarlarına $P \in AB$ ve $Q \in AC$ noktalarında içten teğet bir çember çiziliyor. $PQ$ doğru parçasının orta noktasının $ABC$ üçgeninin iç teğet çemberinin merkezi olduğunu gösteriniz.

Biz bu problemi olimpiyat komitesinin önerdiği gibi değil de, postanın başlığında verildiği gibi çözeceğiz. Yani bir ikizkenar üçgen verilmiş. Bu üçgenin eşit kenarlarına ve çevral çemberine içten teğet bir çember nasıl çizilir, onunla uğraşacağız. Üçgenimiz ikizkenar olduğu için çözmemiz gereken problem de kolaylaşmış oluyor. (Henüz denemedim ama çeşit kenar bir üçgende aynı problemi çalışmak çok daha zor olabilir gibi bir sezgim var.)

İşe öncelikle şekilde verilen ikizkenar $ABC$ üçgeninin yüksekliğini bulmakla başlayalım. $|BC|=:a$, $|AB|=|AC|=:b$ ve $|AH|=:h$ olsun. O zaman yükseklik Pisagor teoreminden kolayca hesaplanılır. \begin{equation*} h = \frac{1}{2}\sqrt{4b^{2}-a^{2}} \end{equation*} Üçgen ikizkenar olduğu için çevral çemberin merkezi $AH$ doğrultusunun üstündedir ve dahi $AH$ doğrultusu $BAC$ açısını ikiye böler. Çevral çemberin merkezini şekilde $O$ noktası ile gösterdik. Hatırlanacağı üzere çevral çemberin merkezinden kenarlara indirilen dikmeler, kenarları iki eşit parçaya bölüyordu. O zaman $R \cos (A/2) = b/2$ olur. Burada $R$ çevral çemberin yarıçapıdır. Ama $ABH$ üçgeninden $\cos(A/2) = h/b$ eşitliğini gözlediğimizde \begin{equation*} R = \frac{b^{2}}{\sqrt{4b^{2}-a^{2}}} \end{equation*} olur. Ön hazırlığımızın sonuncu aşamasında iç teğet çemberin yarıçapını, $r$ değerini, hesaplayacağız. Bunu isterseniz $ABC$ üçgeninin toplam alanını kullanıp, $ah = (2b+a)r$ eşitliğini çözerek kolayca yapabiliriz. (İç teğet çemberin merkezinden kenarlara indirilen dikmelerin hepsi $r$ kadardır.) \begin{equation*} r = \frac{a}{2(2b+a)}\sqrt{4b^{2}-a^{2}} \end{equation*}

Şekilde iç teğet çemberin merkezini $I$ noktası ile gösterdik. $I$ noktası aynı zamanda $ABC$ üçgeninin iç açı ortaylarının kesişim noktası olduğundan, $I \in AH$ olduğu barizdir. Çizmemiz istenilen çember ikiz kenar üçgenin her iki kenarına da teğet olduğundan onun da merkezi $J \in AH$ olmak zorundadır. $PQD$ çemberinin yarıçapı $\rho$ olsun. O zaman barizdir ki $|JH|=h-|OA|-|OJ|$ ya da $|JH|=h-R-(R-\rho)=h-2R+\rho$ olur. Yine üçgenin toplam alanından gideceğiz ve $ah = 2b\rho + a|JH|$ denklemini kuracağız. Bu denklemde $|JH|$ yerine konulup $\rho$ için çözüldüğünde $\rho = 2aR/(2b+a)$ bulunuyor. Diğer bir ifadeyle \begin{equation*} \rho = \frac{2ab^{2}}{(2b+a)\sqrt{4b^{2}-a^{2}}} \end{equation*} olmaktadır.

Şimdi, $PQ$ doğru parçası $AH$ yüksekliğini $K$ noktasında kessin. (Şekilde bariz bir biçimde $K=I$ olması gerektiği görülüyor ama biz bunu henüz ispatlamadık!) O zaman $|HK|=|JH|+|JK|$ olur. $|JH|$ uzunluğunu daha önce bulduk. $|JK|=\rho \sin (A/2)$ olduğuna göre, $\sin(A/2)=a/2b$ ve daha önce bulduklarımızı kullandığımızda \begin{equation*} |HK| = h-2R+\rho + \rho \frac{a}{2b} = \frac{a}{2(2b+a)}\sqrt{4b^{2}-a^{2}} = r \end{equation*} olduğunu göstermiş oluyoruz. O zaman $|HK|=|HI|=r$ ve $I$ ile $K$ noktaları aynı doğrultu üzerinde olduklarına göre $I=K$ denkliği gösterilmiş oluyor.

Toparlayalım. İkizkenar bir üçgenin eşit kenarlarına ve çevral çemberine içten teğet bir çember çizmek için

  1. Üçgenin tepe noktasına ait açı ortay (aynı zamanda dikme ve kenar ortay) $AH$ çizilir.
  2. İç açı ortayların kesişim noktasından, iç teğet çemberin merkezi $I$ tespit edilir.
  3. $AH$ doğru parçasına $I$ noktasında dik doğrunun $AB$ kenarını kestiği nokta $P$ ve $AC$ kenarını kestiği nokta $Q$ tespit edilir.
  4. $AB$ kenarına $P$ noktasından çizilen dikme ile $AC$ kenarına $Q$ noktasından çizlen dikmenin kesişim noktası $J$ tespit edilir.
  5. Aranılan çemberin merkezi $J$ noktasında olup, yarıçapı ise $|JP|$ kadardır.

13 Ağustos 2015 Perşembe

Aynı köşeye ait iç açı ortayı, kenar ortayı ve yüksekliği verilen bir üçgenin kenar uzunluklarını bulmak - 1

Daha önce bu blogda ters üçgen problemlerinden bir tanesini çalışmıştık, üç yükseklik veriliyor ve kenarların uzunlukları isteniyordu. Bugün de başka bir ters üçgen problemini çalışacağız. Bir üçgenin aynı köşesine ait iç açı ortay, kenar ortay ve yükseklik veriliyor. Bu üçgenin kenar uzunluklarını hesaplayınız.

Cebirsel denklemler

Sürekli kullandığımız üzere bu blogda kenar uzunlukları verilen bir üçgene ait unsurların uzunluklarını hesaplamayı çalışmıştık. Şimdi aynı soruyu tersinden ele almamız isteniyor. İlkin, genelliği kaybetmeden, $ABC$ üçgeninin $A$ köşesine ait sırasıyla kenar ortay, iç açı ortay ve yüksekliklerin uzunluklarını daha önce yaptığımız çalışmadan buraya getirelim. \begin{eqnarray} &&m = \frac{1}{2}\sqrt{2b^{2}+2c^{2}-a^{2}} \\ &&l = \frac{1}{b+c}\sqrt{bc(a+b+c)(-a+b+c)} \\ &&h = \frac{1}{2a}\sqrt{(a+b+c)(-a+b+c)(a-b+c)(a+b-c)} \end{eqnarray} Bu denklem sisteminde $a,b,c$ bilinmeyenler ve $m,l,h$ ise bilinenlerdir. Amacımız bu denklem sistemini cebirsel yöntemlerle çalışmak. O zaman bu denklemleri köklü ifadelerden temizlekle işe başlayalım. Çok basit manipulasyonlar sonunda aşağıdaki sisteme ulaşıyoruz. \begin{eqnarray} &&4m^{2} = 2b^{2}+2c^{2}-a^{2} \label{ko} \\ &&l^{2}(b+c)^{2} = bc \left( (b+c)^{2} - a^{2}\right) \label{ao} \\ &&4h^{2}a^{2} = \left( (b+c)^{2} - a^{2}\right) \left( a^{2} - (b-c)^{2}\right) \label{yuk} \end{eqnarray} Bu sistem dördüncü dereceden terimler içeriyor ve lineer cebirin imkanları kullanılarak çözülemez. Öte yandan her üç denklemde de $a^{2}$ ifadesinin olduğuna, daha doğrusu $a$ bilinmeyeninin sadece bu formuyla denklemlerde yer aldığına dikkat edelim. O zaman ilk denklemden $a^{2} = 2b^{2}+2c^{2}-4m^{2}$ ifadesini çekip, bunu diğer iki denklemde kullandığımızda sistemimizi iki bilinmeyenli iki denkleme indirgemiş olacağız. \begin{eqnarray} &&b^{4}+c^{4}-2b^{2}c^{2}-8(m^{2}-h^{2})b^{2}-8(m^{2}-h^{2})c^{2}+16m^{2}(m^{2}-h^{2})=0 \label{bir}\\ &&b^{3}c+bc^{3}-2b^{2}c^{2}+l^{2}b^{2}+l^{2}c^{2}+(2l^{2}-4m^{2})bc = 0 \label{iki} \end{eqnarray} Bu sefer şansımız yaver gitmedi. Her ne kadar çalışılması gerekli sistemin değişken sayısını üçten ikiye indirgemiş olsak da, her iki denklemdeki $bc$ ve $b^{2}c^{2}$ çapraz terimler (cross terms) daha fazla bilinmeyen elememize imkan sunmuyorlar.

Sorunun kuruluşu gereği denklemlerimiz üç parametreye bağlı. Ama (\ref{bir}) ve (\ref{iki}) nolu denklemlerden bu parametrelerin $m^{2}-h^{2}$, $l^{2}$ ve $m^{2}$ şeklinde kendilerini gösterdiğini gözleyiniz. Acaba parametre sayısını üçten ikiye indirebilir miyiz? Bu maksatla öncelikle $m=h$ durumunda (\ref{bir}) ve (\ref{iki}) nolu denklemlerin sadece bariz olan $b=c$ çözümünü verdiklerini gözlüyoruz. Diğer bir ifadeyle $m=h(=l)$ ise, o zaman problem çözülemiyor! Problemin çözülebilir olduğu parametre uzayında ise, daha önce yaptığımız çalışmalar uyarınca, $m>h$ olmalıdır. O zaman genelliği kaybetmeden $0< d^{2} := m^{2}-h^{2}$ tanımlayalım ve denklem sistemimizdeki bütün uzunlukları $d$ biriminde ölçelim. $b =:yd$, $c =: zd$, $m =:Md$ ve $l=:Ld$ tanımlarıyla (\ref{bir}) ve (\ref{iki}) nolu denklemler şöyle olur. \begin{eqnarray} &&y^{4}+z^{4}-2y^{2}z^{2}-8y^{2}-8z^{2}+16M^{2}=0 \label{uc}\\ &&y^{3}z+yz^{3}-2y^{2}z^{2}+L^{2}y^{2}+L^{2}z^{2}+(2L^{2}-4M^{2})yz = 0 \label{dort} \end{eqnarray} Bu denklem sisteminin sadece iki parametreye bağlı olduğunu gözleyiniz.

İkinci yeni değişkenler

Yukarıdaki denklem sistemini cebirsel geometrideki Gröbner bazlarını kullanarak çözmek mümkün tabi, ama böylesine ileri dereceden bir yöntem için yapmamız gereken ön hazırlık çok fazla. Ben bu problemi değişken sayısını arttırarak çalışmayı deneyeceğim. Şimdi genelliği kaybetmeden $b>c \iff y>z$ olduğunu varsayalım. O zaman aşağıdaki nicelikler pozitiftir. \begin{eqnarray} \alpha &:=& y^{2}+z^{2} \\ \beta &:=& y^{2}-z^{2} \\ \gamma &:=& yz \end{eqnarray} Bu tanımlarla \begin{eqnarray} &&y = \sqrt{\frac{\alpha+\beta}{2}} \label{yee} \\ &&z = \sqrt{\frac{\alpha-\beta}{2}} \label{zee} \\ &&yz = \gamma = \sqrt{\frac{\alpha^{2}-\beta^{2}}{4}} \label{gamma1} \end{eqnarray} olduğu barizdir. Şimdi (\ref{uc}) nolu denklemi yeni değişkenler cinsinden ifade edelim. \begin{equation} \beta^{2} - 8 \alpha + 16M^{2} = 0 \end{equation} Bu denklem sayesinde $\beta$ niceliğini $\alpha$ cinsinden ifade etmiş oluyoruz: \begin{equation} \beta = \sqrt{8\alpha-16M^{2}} . \label{beta1} \end{equation} Benzer işlemleri (\ref{dort}) nolu denklem için de yapmamız gerekiyor. \begin{equation} \gamma (\alpha - 2\gamma) + L^{2}\alpha + (2L^{2}-4M^{2})\gamma = 0 \end{equation} Bu denklem $\gamma$ niceliğinin kuvvetlerine göre sıralandığında bize aşağıdaki denklemi verecektir. \begin{equation} 2\gamma^{2} + (4M^{2}-2L^{2}-\alpha) \gamma - L^{2} \alpha = 0 \end{equation} Kuadratik formülü kullanılarak bu denklem çözülebilir. \begin{equation} \gamma = \frac{-(4M^{2}-2L^{2}-\alpha) + \sqrt{(4M^{2}-2L^{2}-\alpha)^{2}+8L^{2}\alpha}}{4} \label{gamma2} \end{equation} (Okur bu denklemde neden diskriminantın önünde $+$ işaretini seçtiğimizi izah etmelidir.) Ama (\ref{gamma1}) ve (\ref{beta1}) nolu denklemler beraber kullanılırsa, $\gamma$ ile $\alpha$ arasında ikinci bir ilişki daha bulunur: \begin{equation} \gamma = \frac{1}{2} \sqrt{\alpha^{2}-8\alpha + 16M^{2}}. \label{gamma3} \end{equation} Elimizde $\gamma$ niceliğini $\alpha$ cinsinden veren iki denklem var. Bunları birbirlerine eşitlediğimizde çözüldüğünde $\alpha$ niceliğini veren bir denklem elde edebiliriz. \begin{equation} \frac{1}{2} \sqrt{\alpha^{2}-8\alpha + 16M^{2}} = \frac{-(4M^{2}-2L^{2}-\alpha) + \sqrt{(4M^{2}-2L^{2}-\alpha)^{2}+8L^{2}\alpha}}{4} \end{equation} Kesirleri temizlemek için her iki tarafı 4 ile çarpacağız. Kökleri ise iki aşamada temizleyeceğiz. Önce her iki tarafın karesini alalım. \begin{equation} 4(\alpha^{2}-8\alpha + 16M^{2}) = 2(4M^{2}-2L^{2}-\alpha)^{2} + 8L^{2}\alpha -2(4M^{2}-2L^{2}-\alpha)\sqrt{(4M^{2}-2L^{2}-\alpha)^{2}+8L^{2}\alpha} \end{equation} Daha sonra köklü terimi yalnız bırakacak şekilde eşitliği yeniden düzenleyelim. (Bu aşamada Maxima gibi bir bilgisayar cebir sistemi (computer algebra system) kullanmak hiç fena olmaz.) Her iki tarafın karesi alındığında köklü ifadeler tamamıyla temizlenmiş olacaktır ve çıkan denklem $\alpha$ niceliğine göre kübiktir. \begin{equation*} \bbox[5px,border:3px solid black]{ (M^{2}-L^{2}-1)\alpha^{3} + (2L^{2}M^{2}-8M^{2}+8L^{2}+8) \alpha^{2} + (16M^{6}-16L^{2}M^{4}-16M^{4}-16L^{2}M^{2}+4L^{4})\alpha + 32L^{2}M^{6}-8L^{4}M^{4} = 0} \end{equation*}

Bundan sonra yapılması gerekenler -eğer bir bilgisayar cebir sisteminiz varsa- basit: Kutu içindeki kübik denklemi çözüp $\alpha$ bulunacak. Daha sonra $\beta$ (\ref{beta1}) nolu denklemden hesaplanacak. Böylece (\ref{yee}) ve (\ref{zee}) nolu denklemler kanalıyla $y$ ve $z$ hesaplanılacak. $y$ ve $z$ bulundumu $b$, $c$ ve nihayet $a$ niceliklerinin hesaplanılması artık son derece kolaylaşmış oluyor.

Kutu içindeki kübik denklemin kök tasnifini de başka zaman yapalım.

Bir üçgenin aynı köşesine ait (iç) açı ortay, kenar ortay ve yüksekliklerinin sıralanması

Daha önce bu blogda bir üçgenin sırasıya iç açı ortay ($l$), kenar ortay ($m$) ve yüksekliklerinin ($h$) uzunluklarını üçgenin kenar uzunlukları $a,b,c$ cinsinden ifade etmiştik. Bulgularımızı özetleyelim. \begin{eqnarray} \nonumber &&l = \frac{1}{b+c}\sqrt{bc(a+b+c)(-a+b+c)} \\ \nonumber &&m = \frac{1}{2}\sqrt{2b^{2}+2c^{2}-a^{2}} \\ \nonumber &&h = \frac{1}{2a}\sqrt{(a+b+c)(-a+b+c)(a-b+c)(a+b-c)} \end{eqnarray} Hatırlatmak lazım ki burada verilen uzunluklar $ABC$ üçgeninin $A$ köşesine aittir. Bugünkü problemimiz şöyle: $l,m,h$ arasındaki sıralama nasıldır?

Öklit geometrisinin en meşhur kanunlarından birisi şudur: Bir nokta ile (o noktadan geçmeyen) bir doğru arasındaki en kısa yol, o noktadan doğru parçasına indirilen dikmenin uzunluğu kadardır. Ama $ABC$ üçgeninde $A$ köşesinden $BC$ kenarına indirilen dikme $h$ kadar olduğundan, en kısa olan unsuru, yani $h$ niceliğini, tespit etmiş oluyoruz.

Geriye $l$ ile $m$ arasında bir sıralama yapmak kaldı. Şimdi $l/m$ oranını bazı temel cebirsel manipulasyonlardan sonra şöyle ifade edebiliriz. \begin{equation} \frac{l}{m} = \frac{\sqrt{bc}}{\frac{b+c}{2}} \sqrt{\frac{b^{2}+2bc+c^{2}-a^{2}}{2b^{2}+2c^{2}-a^{2}}} \label{lbm} \end{equation} Bu oran bir eşitlik. Öte yandan bizim bir eşitsizliğe ihtiyacımız var.

Aritmetik-geometrik orta eşitsizliğini kullanacağız. $x$ ve $y$ pozitif sayılar ise, o zaman $(x-y)^{2} \geq 0$ eşitsizliği $\bbox[1px,border:1px solid black]{x^{2}+y^{2} \geq 2xy}$ şeklinde yeniden düzenlenebilir. Bu eşitsizlik sayılardan birisi negatif olduğunda da geçerlidir, ama burada eşitsizlik pozitif büyüktür negatif biçiminde aşikar (trivial) olmaktadır. Eşitsizlikte $x \to \sqrt{x}$ ve $y \to \sqrt{y}$ koyarsak, o zaman $\bbox[1px,border:1px solid black]{x+y \geq 2 \sqrt{xy}}$ elde edilir.

Bu ara bilgiden sonra (\ref{lbm}) nolu denkleme geri dönebiliriz. Şimdi, soldan ikinci köklü ifadenin pay kısmında $2bc$ yerine $b^{2}+c^{2}$ yazarsak, o zaman ifadenin tamamı daha da büyür. \begin{equation*} \frac{l}{m} \leq \frac{\sqrt{bc}}{\frac{b+c}{2}} \sqrt{\frac{b^{2}+b^{2}+c^{2}+c^{2}-a^{2}}{2b^{2}+2c^{2}-a^{2}}} = \frac{\sqrt{bc}}{\frac{b+c}{2}} \end{equation*} Burası çok önemli: Bu aşamadan sonra yaptığımız her manipulasyon eşitsizliğin sağ tarafını daha da büyütmeye yönelik olmalıdır. Aritmetik-geometrik orta eşitsizliğini bir kere daha kullanalım: \begin{equation*} \frac{l}{m} \leq \frac{\sqrt{bc}}{\frac{b+c}{2}} \leq \frac{\frac{b+c}{2}}{\frac{b+c}{2}} = 1. \end{equation*} Demek ki $l \leq m$ imiş!

Toparladığımızda, $h \leq l \leq m$ sıralamasını ispatlamış oluyoruz. Üçgen ikiz kenar ya da eşkenar ise, o zaman $b=c$ olacağından, bu özel durumda $h=l=m$ eşitliği sağlanır. (Lütfen deneyiniz.)

12 Ağustos 2015 Çarşamba

Açıların cebirsel olarak üçe bölünmesindeki totoloji

Eski Yunan'dan günümüze kalan en meşhur problemlerden birisi de cetvel ve pergelle bir açıyı üçe bölmektir. Öklit ve daha sonra gelen geometriciler bu problemi çözemediler. Biz de bu postada $\cos (\theta)$ (ve dolayısıyla $\sin (\theta)$) değeri verilen bir açı için $x:=\cos (\theta/3)$ değerinin nasıl hesaplandığına bakacağız.

Şimdi trigonometri argosunda 433 diye bilinen formülden faydalandığımızda $4x^{3}-3x=\cos(\theta)$ ya da çalışılması gerekli kübik denklem \begin{equation*} {\rm K:} \ \ \ x^{3} - \frac{3}{4}x - \frac{1}{4}\cos(\theta) = 0 \label{bir} \end{equation*} olmaktadır. Daha önce burada kübik denklemleri Cardano'nun yöntemiyle çözmüştük. K etiketli denklemin depressed formunda olduğunu gözleyiniz. $p:=-3/4$ ve $q:=-\cos(\theta)/4$ tanımıyla hemen diskriminatı hesaplayalım. \begin{equation*} \Delta = \frac{4p^{3}}{27}+q^{2} = -\frac{\sin^{2}(\theta)}{16} \end{equation*} Çözümde ara basamak olarak \begin{equation*} U_{1,2} = \sqrt[3]{\frac{-q\pm \sqrt{\Delta}}{2}} = \frac{1}{2}\sqrt[3]{\cos(\theta) \pm i \sin(\theta)} \end{equation*} niceliklerine ihtiyaç duyuyoruz. Her ne kadar $\cos(\theta)$ ve $\sin(\theta)$ değerleri verilse de problemin çözümünü bitirmek için küpkökü hesaplamak zorundayız. Şimdi sakın $\cos(\theta) \pm i \sin(\theta) = \exp(i\theta)$ özdeşliğinden faydalanarak \begin{equation*} U_{1,2}=\frac{1}{2} \exp(\pm i\theta /3) = \frac{1}{2} (\cos(\theta/3) \pm i \sin (\theta /3)) \end{equation*} olur demeyin. Çünkü çözümü bilinmeyenler cinsinden vermiş olursunuz.

Görünen o ki, Cardano yönteminin cevabı vermek için bizi karmaşık sayıların küpköklerine mecbur etmesi bizi aynı zamanda bir totolojiye getirmektedir. Örneğin \begin{equation*} \cos(\theta/3) = x = U_{1}+U_{2} = \cos(\theta /3) \end{equation*} gibi. Kübik denklemleri cebirsel olarak evet çözebiliyoruz, ama bunu trigonometriye bir açıyı üçe bölmek biçiminde uyguladığımızda bu bize bir totoloji veriyor. Mesela bu yüzden daha önce $\cos(3^{\rm o})$ değerini hesapladık ama bu sonucu kullanarak $\cos(1^{\rm o})$ değerine gidemedik. Aklımızda bulunsun: Kuartik denklemler de genellikle resolvent cubic diye tabir edilen üçüncü dereceden bir ara denkleme ihtiyaç duyarlar. Onların da çözümünde totolojiler çıkması kuvvetle muhtemeldir.

11 Ağustos 2015 Salı

Düzgün onüçgenin trigonometrisi

Daha önce bu blogda düzgün onyedigenin trigonotmetrisini Casey'nin A Treatise on Plane Trigonometry adlı kitabından bir algoritma eşliğinde çalışmıştık. Benzer bir çalışmanın düzgün onüçgen için nasıl yapılacağını alıştırmalar şeklinde yine Casey'nin kitabından (sayfa 64) aktaracağım. Takip edilen basamaklar hemen hemen düzgün onyedigen için yaptıklarımızla aynı. Bir çemberi merkezinden birbirine eşit 13 parçaya dilimlediğimizde tepe açısı $2\pi/13$ olan açılar ortaya çıkacaktır. Biz bu postada $\alpha := \pi /13$ açısının trigonometrisine bakacağız. Alıştırmanın basamakları yan sütundadır.

Alıştırmaların son basamğından da görüleceği üzere $\cos(\pi /13)$ için üretilen cebirsel denklem kuartik yani dördüncü dereceden. O zaman bu denklem analitik yöntemlerle (mesela Ferrari-Cardano metoduyla) çözülebilir. Kuartik denklemlerin bir sakıncası genelde çözümleri için ara basamakta resolvent cubic diye tabir edilen üçüncü dereceden denklemlere ihtiyaç duyulmasıdır. (Kübik denklemlerin çözümünü daha önce bu blogda çalıştık.) Bu ise çoğu zaman karmaşık sayılara başvurmayı mecburi kılar. Düzgün onyedigeni eğer şimdi çalıştığımız yöntemle çalışsaydık, yani Chebyshev polinomlarının $T_{9}(z)=T_{8}(z)$ eşitliğinin köklerini soruştursaydık, o zaman karşımıza sekizinci dereceden bir denklem çıkacaktı. Tabii ki en genel haliyle sekizinci dereceden cebirsel denklemler çözülemez. Ama bizim orada uyguladığımız algoritma bu sekizinci dereceden denklemi üç defa kuadratik formülünü uygulayarak çözmüştü.

  1. $n$ pozitif bir tamsayı olmak üzere $\theta := \pi /(2n+1)$ tanımlanıyor. \begin{equation*} \sum_{k=0}^{n-1} \cos((2k+1)\theta) = \frac{1}{2} \end{equation*} olduğunu gösteriniz.
  2. $\cos \alpha+\cos 3\alpha+\cos 9\alpha$ ve $\cos 5\alpha+\cos 7\alpha+\cos 11\alpha$ niceliklerinin \begin{equation*} x^{2} - \frac{1}{2}x - \frac{3}{4} = 0 \end{equation*} denkleminin kökleri olduğunu gösteriniz.
  3. $\cos((k+1)\theta) = 2\cos(\theta) \cos(k\theta) - \cos((k-1)\theta)$ olduğunu gösteriniz. Bu aynı zamanda Chebyshev polinomları için de geçerli olan yineleme bağıntısıdır.
  4. Çalıştığımız açı $\cos(9 \alpha)=-\cos(4\alpha)$ denklemini sağlar. Bunu köklerden birisinde yerine koyarak $z:=2\cos(\alpha)$ tanımıyla \begin{equation*} z^{4}-z^{3}-4z^{2}+2z+\frac{5+\sqrt{13}}{2}=0 \end{equation*} olduğunu gösteriniz.

10 Ağustos 2015 Pazartesi

Düzgün onyedigenin trigonometrisi

Cetvel ve pergelle eşkenar üçgeni, kareyi, düzgün beşgeni ve altıgeni çizmeyi bize Öklit öğretti. Gauss ise çok genç yaşlarında düzgün onyedigenin cetvel ve pergelle çizilebileceğini ispatladı. Burada cetvel pergel çizimlerinden ziyade düzgün onyedigendeki tepe açısının trigonometrisine bakacağız. Bir çemberi merkezinden 17 eşit parçaya dilimlersek, o zaman düzgün onyedigeni de 17 denk ikizkenar üçgenin yamalanmış hali gibi çizebiliriz. Bu üçgenlerin tepe açısı $\alpha := 2 \pi / 17$ kadardır. Bu açıyı tarif etmek için onun trigonometrik değerlerine, mesela $\cos(\alpha)$ değerine, bakabiliriz. O zaman amacımız netleşti: $\cos(\alpha)$ değerini hesaplamak.

Casey'nin A Treatise on Plane Trigonometry adlı kitabının 220. ve 221. sayfalarında bu hesaplamanın nasıl yapılacağına dair bir algoritma var. Kitap bir trigonometri ve cebir harikası, basım tarihi 1888 ve şimdiki ders kitaplarına kıyasla da son derece kaliteli. Casey bu algoritmayı alıştırmalar şeklinde sunmuş. Ben de o alıştırmaları burada çözerek $\cos(2\pi/17)$ değerinin nasıl hesaplanacağını izah etmeye çalışacağım. Öncelikle merkezi bir lemma ile işe başlıyalım.

Lemma: $n$ tamsayı olsun ve $\gamma:=2\pi/(2n+1)$ tanımlayalım. O zaman \begin{equation} \sum_{j=1}^{n} \cos(j\gamma) = -\frac{1}{2} \end{equation} olur.
İspat: Verilen toplamı $\sin(\gamma)$ ile çarpıp bölelim ve trigonometrik fonksiyonların $\sin(a)\cos(b) = \frac{1}{2}(\sin(a+b)+\sin(a-b))$ özdeşliğinden faydalanalım. \begin{eqnarray} \nonumber \frac{1}{\sin(\gamma)}\sum_{j=1}^{n} \sin(\gamma) \cos(j\gamma) &=& \frac{1}{2\sin(\gamma)} \left\{ \sum_{j=1}^{n}\sin((j+1)\gamma) - \sum_{j=1}^{n}\sin((j-1)\gamma)\right\} \\ \nonumber &=&\frac{1}{2\sin(\gamma)} \left\{ \sum_{k=2}^{n+1}\sin(k\gamma) - \sum_{k=0}^{n-1}\sin(k\gamma)\right\} \\ \nonumber &=&\frac{1}{2\sin(\gamma)} (\sin((n+1)\gamma)+\sin(n\gamma)-\sin(\gamma)) = - \frac{1}{2} \end{eqnarray} İspatı bitirmek için $(n+1)\gamma+n\gamma=2\pi$ bilgisini kullandık.
Biz bu lemmayı aşağıdaki formuyla kullanacağız. \begin{equation} \cos(\alpha) +\cos(2\alpha) +\cos(3\alpha) +\cos(4\alpha) +\cos(5\alpha) +\cos(6\alpha) +\cos(7\alpha) +\cos(8\alpha) = -\frac{1}{2} \label{toplam} \end{equation}

Birinci aşamada \begin{equation} x^{2}+x-4=0 \label{kuad1} \end{equation} denkleminin köklerini $\cos(j\alpha)$ trigonometrik polinomları cinsinden temsil etmekle işe başlıyoruz. \begin{eqnarray} a_{1} &:=& 2(\cos(\alpha)+\cos(2\alpha)+\cos(4\alpha)+\cos(8\alpha)) \ \ \ {\rm ve} \\ a_{2} &:=& 2(\cos(3\alpha)+\cos(5\alpha)+\cos(6\alpha)+\cos(7\alpha)) \end{eqnarray} tanımları verildiğinde (\ref{toplam}) nolu denklem uyarınca $a_{1}+a_{2}=-1$ olduğunu gözleyiniz. Dolayısıyla $a_{1}$ ve $a_{2}$ (\ref{kuad1}) nolu denklemin kökler toplamına uymaktadır. Tahmin ettiğiniz gibi kökler çarpımına da bakacağız. Ama bu biraz kıllı. \begin{eqnarray}\nonumber a_{1}a_{2} &=& 4(\cos(\alpha)+\cos(2\alpha)+\cos(4\alpha)+\cos(8\alpha)) (\cos(3\alpha)+\cos(5\alpha)+\cos(6\alpha)+\cos(7\alpha)) \\ \nonumber &=& 4(\cos(\alpha)\cos(3\alpha)+\cos(\alpha)\cos(5\alpha)+\cos(\alpha)\cos(6\alpha)+\cos(\alpha)\cos(7\alpha) \\ \nonumber &&+ \cos(2\alpha)\cos(3\alpha)+\cos(2\alpha)\cos(5\alpha)+\cos(2\alpha)\cos(6\alpha)+\cos(2\alpha)\cos(7\alpha) \\ \nonumber &&+ \cos(4\alpha)\cos(3\alpha)+\cos(4\alpha)\cos(5\alpha)+\cos(4\alpha)\cos(6\alpha)+\cos(4\alpha)\cos(7\alpha) \\ \nonumber &&+ \cos(8\alpha)\cos(3\alpha)+\cos(8\alpha)\cos(5\alpha)+\cos(8\alpha)\cos(6\alpha)+\cos(8\alpha)\cos(7\alpha)) \\ \nonumber &=&2( \cos(4\alpha)+\cos(2\alpha)+\cos(6\alpha)+\cos(4\alpha)+\cos(7\alpha)+\cos(5\alpha)+\cos(8\alpha)+\cos(6\alpha) \\ \nonumber &&+\cos(5\alpha)+\cos(\alpha)+\cos(7\alpha)+\cos(3\alpha)+\cos(8\alpha)+\cos(4\alpha)+\cos(9\alpha)+\cos(5\alpha) \\ \nonumber &&+\cos(7\alpha)+\cos(\alpha)+\cos(9\alpha)+\cos(\alpha)+\cos(10\alpha)+\cos(2\alpha)+\cos(11\alpha)+\cos(3\alpha) \\ \nonumber &&+\cos(11\alpha)+\cos(5\alpha)+\cos(13\alpha)+\cos(3\alpha)+\cos(14\alpha)+\cos(2\alpha)+\cos(15\alpha)+\cos(\alpha)) \\ \nonumber &=&2(4\cos(\alpha)+3\cos(2\alpha)+3\cos(3\alpha)+3\cos(4\alpha)+4\cos(5\alpha)+2\cos(6\alpha)+3\cos(7\alpha) +2\cos(8\alpha) \\ \nonumber &&+2\cos(9\alpha)+\cos(10\alpha)+2\cos(11\alpha)+\cos(13\alpha)+\cos(14\alpha)+\cos(15\alpha)) \\ \nonumber &=&8(\cos(\alpha) +\cos(2\alpha) +\cos(3\alpha) +\cos(4\alpha) +\cos(5\alpha) +\cos(6\alpha) +\cos(7\alpha) +\cos(8\alpha)) \\ &=&-4 \end{eqnarray} Bu denklemde $\cos(a)\cos(b) = \frac{1}{2}(\cos(a+b)+\cos(a-b))$ ve $\alpha$ açısının özel değerinden ötürü $\cos(j\alpha)=\cos((17-j)\alpha)$ özdeşlikleri ile (\ref{toplam}) nolu denklemden faydalandık. $a_{1}$ ve $a_{2}$ hem kökler toplamını hem de kökler çarpımını sağlıyorlar. O zaman bunlar (\ref{kuad1}) nolu denklemin köküdür. Bariz olanı ifade edelim. \begin{eqnarray} a_{1} &&= \frac{-1+\sqrt{17}}{2} \\ a_{2} &&= \frac{-1-\sqrt{17}}{2} \end{eqnarray}

Algoritmanın ikinci aşamasında \begin{eqnarray} b_{1} &:=& 2(\cos(\alpha)+\cos(4\alpha)) \\ b_{2} &:=& 2(\cos(2\alpha)+\cos(8\alpha)) \end{eqnarray} tanımlıyoruz ve bu niceliklerin \begin{equation} x^{2}-a_{1}x-1=0 \label{kuad2} \end{equation} denkleminin köklerini temsil ettiğini gösteriyoruz. Yöntem bir önceki basamaktakiyle tamamen aynı. Öncelikle $b_{1}+b_{2}=a_{1}$ net bir şekilde gözleniyor. Ardından \begin{eqnarray} \nonumber b_{1}b_{2} &=& 4(\cos(\alpha)+\cos(4\alpha))(\cos(2\alpha)+\cos(8\alpha)) \\ \nonumber &=& 4(\cos(\alpha)\cos(2\alpha)+\cos(\alpha)\cos(8\alpha)+\cos(4\alpha)\cos(2\alpha)+\cos(4\alpha)\cos(8\alpha)) \\ \nonumber &=&2(\cos(3\alpha)+\cos(\alpha)+\cos(9\alpha)+\cos(7\alpha)+\cos(6\alpha)+\cos(2\alpha)+\cos(12\alpha)+\cos(4\alpha)) \\ \nonumber &=&2(\cos(\alpha) +\cos(2\alpha) +\cos(3\alpha) +\cos(4\alpha) +\cos(5\alpha) +\cos(6\alpha) +\cos(7\alpha) +\cos(8\alpha)) \\ &=&-1 \end{eqnarray} ile kökler çarpımına da uyduğundan ispatımız tamamlanmış oluyor. \begin{eqnarray} b_{1} &=& \frac{a_{1}+\sqrt{a_{1}^{2}+4}}{2} \\ b_{2} &=& \frac{a_{1}-\sqrt{a_{1}^{2}+4}}{2} \end{eqnarray} denklemlerinde $a_{1}$ sayısal değeri bilindiğinden, $b_{1}$ ve $b_{2}$ de sadece karekök işlemi kullanılarak hesaplanmış olmaktadır. Okur bir alıştırma olarak \begin{equation} x^{2}-a_{2}x-1=0 \label{kuad2.5} \end{equation} denkleminin köklerinin \begin{eqnarray} c_{1} &:=& 2(\cos(3\alpha)+\cos(5\alpha)) = \frac{a_{2}+\sqrt{a_{2}^{2}+4}}{2}\\ c_{2} &:=& 2(\cos(6\alpha)+\cos(7\alpha)) = \frac{a_{2}-\sqrt{a_{2}^{2}+4}}{2} \end{eqnarray} olduğunu göstermelidir. Burada $c_{1}$ ve $c_{2}$ sayısal değerlerinin hesaplanabildiğini vurguluyoruz.

Algoritmanın üçüncü ve son aşamasında \begin{equation} x^{2}-b_{1}x+c_{1}=0 \label{kuad3} \end{equation} denkleminin köklerini temsil etmeye çalışacağız. \begin{eqnarray} d_{1} &:=& 2 \cos(\alpha) \\ d_{2} &:=& 2 \cos(4\alpha) \end{eqnarray} tanımlayalım. $d_{1}+d_{2}=b_{1}$ olduğu barizdir. Devamla $d_{1}d_{2} = 4\cos(\alpha)\cos(4\alpha) = 2(\cos(3\alpha)+\cos(5\alpha))=c_{1}$ olduğundan kökler temsil edilmiş olur. Ama \begin{equation} \cos(\alpha) = \frac{1}{2}d_{1} = \frac{b_{1}+\sqrt{b_{1}^{2}-4c_{1}}}{4} \end{equation} olduğundan, hesaplamamız sonlanmıştır.

7 Ağustos 2015 Cuma

Nostaljik bir uluslararası olimpiyat sorusu

IMO 1964/3: Kenar uzunlukları $a,b,c$ olan $ABC$ üçgenine bir iç teğet çember çiziliyor. Üçgenin kenarlarına paralel olacak şekilde bu çembere teğetler çekiliyor. Bu teğetlerden her biri $ABC$ üçgeninden bir üçgen keserler. Bu kesilen üçgenlere de iç teğet çemberler çiziliyor. Dört çemberin toplam alanını $a,b,c$ cinsinden bulunuz.

Şimdiki olimpiyat sorularına bakınca gerçekten de son derece kolay bir soru bu. $ABC$ üçgeni, soruda geçen dört çember ve paraleller şekilde gösteriliyor. Şimdi $AH \perp BC$ olacak şekilde, $A$ köşesinden $BC$ tabanına bir dikme indirelim. İç teğet çemberin merkezinden kenarlara çizilen doğru parçaları da kenarlara diktir. O zaman $AH \parallel WX$ olur. $r := |IX|$ ve $h_{a}:=|AH|$ tanımları ve üçgenin alanından hareketle \begin{equation*} \frac{r}{h_{a}} = \frac{a}{a+b+c} \end{equation*} diyebiliriz. $APQ$ üçgeninin iç teğet çemberinin yarı çapına $r_{A}$ diyelim. (Benzer şekilde $r_{B}$ ve $r_{C}$ uzunlukları da tanımlanabilir.) $\triangle ABC \sim \triangle APQ$ kullanıldığında \begin{equation*} \frac{r_{A}}{r} = \frac{h_{a}-2r}{h_{a}} \end{equation*} benzerlik oranını da yazabiliyoruz. Bu iki denklem beraber çözüldüğünde bize \begin{equation*} r_{A} = r \frac{-a+b+c}{a+b+c} \end{equation*}

eşitliğini verecektir. Diğer bir ifadeyle $r_{A}$ değeri, $r$ cinsinden ifade edilmiş olur. Tamamen benzer yöntemlerle \begin{equation*} r_{B} = r \frac{a-b+c}{a+b+c} \ \ \ {\rm ve} \ \ \ r_{C} = r \frac{a+b-c}{a+b+c} \end{equation*} sonuçlarına da ulaşabiliriz. Aradığımız toplam alanı yukarıdaki yarı çap ilişkileri ile sadece $r$ cinsinden ifade etme imkanı doğdu. \begin{equation*} S:=\pi (r^{2}+r_{A}^{2}+r_{B}^{2}+r_{C}^{2}) = \frac{4\pi(a^{2}+b^{2}+c^{2})r^{2}}{(a+b+c)^{2}} \end{equation*} Soruyu bitirmek için daha önce bu blogda yer alan Kenarları verilen bir üçgene ait unsurların uzunlukları başlıklı postadan iç teğet çemberin yarı çapını kullanıyoruz. \begin{equation*} S = \frac{\pi (a^{2}+b^{2}+c^{2})(-a+b+c)(a-b+c)(a+b-c)}{(a+b+c)^{3}} \end{equation*}

6 Ağustos 2015 Perşembe

Viète-Girard simetrik fonksiyonları, Newton toplamları ve von Tschirnhaus dönüşümüyle kübik denklemler

Daha önce bu blogda Cardano'nun yöntemiyle kübik denklemleri çalışmıştık. En genel haliyle $Ax^{3}+Bx^{2}+Cx+D=0$ şeklinde verilen bir kübik denklem, $A\ne 0$ ise önce monik forma getiriliyordu: $x^{3}+bx^{2}+cx+d=0$. Daha sonra kaydırma dönüşümü uygulanarak $x=:y - b/3$ tanımlandığında, denklemde ikinci dereceli terimin yok edildiği gözlenmiş ve İngilizce literatürde kübik denklemlerin depressed formu denilen eşitliğe ulaşılmıştı. \begin{equation} y^{3} + py + q = 0 \label{kubik} \end{equation} Burada $p$ ve $q$ katsayıları $b,c,d$ cinsinden cebirsel bir biçimde ifade edilebilirler. von Tschirnhaus dönüşümüyle bu denklemden birinci dereceli terimi de uzaklaştıracağız ve bütün kübik denklemlerin $z^{3}+r=0$ formuna getirilebileceğini göstereceğiz. Ama bunu yapması belki söylemesi kadar kolay değil.

Simetrik fonksiyonlar

Monik formda $n$. dereceden bir polinom verilsin: $p(x) := x^{n}+a_{n-1}x^{n-1}+\cdots+a_{0}$. Cebirin temel teoremi uyarınca bu polinom $p(x)=(x-x_{1})\cdots (x-x_{n})$ şeklinde çarpanlarına ayrılabilir. Burada $\{x_{1},\ldots,x_{n}\}$ polinomun kökleridir. Polinomun katsayıları ve kökleri arasındaki ilişki genelde lise eğitiminde gösterilir ve şöyledir: \begin{eqnarray} s_{1}(x_{1},\ldots,x_{n}) &:=& x_{1} + \cdots + x_{n} = -a_{n-1} \ \ \ (n \ {\rm terim}) \\ s_{2}(x_{1},\ldots,x_{n}) &:=& x_{1}x_{2} + \cdots +x_{n-1}x_{n} = a_{n-2} \ \ \ (n(n-1)/2 \ {\rm terim}) \\ \nonumber &\vdots& \\ s_{n}(x_{1},\ldots,x_{n}) &:=& x_{1}x_{2} \cdots x_{n} = (-1)^{n}a_{0} \ \ \ ({\rm tek \ terim}) \end{eqnarray} Bu fonksiyonlara Viète-Girard simetrik fonksiyonları diyeceğiz. Herhangi iki argümanının yerleri değiştirildiği halde değerini koruyan fonksiyonlara simetrik fonksiyonlar denir. Örneğin üç değişkenli bir simetrik fonksiyon $s(x,y,z)=s(y,x,z)=s(x,z,y)=\cdots$ özdeşliklerini sağlar. Viète-Girard simetrik fonksiyonlarının gerçekten de simetrik olduklarını gözleyiniz. Konumuz kübik denklemler olduğu için (\ref{kubik}) nolu denklemin köklerinden elde edilen simetrik fonksiyonları burada not edelim. \begin{eqnarray} \sigma_{1} &:=& s_{1}(y_{1},y_{2},y_{3}) = y_{1}+y_{2}+y_{3} = 0 \\ \sigma_{2} &:=& s_{2}(y_{1},y_{2},y_{3}) = y_{1}y_{2}+y_{2}y_{3}+y_{1}y_{3} = p \\ \sigma_{3} &:=& s_{3}(y_{1},y_{2},y_{3}) = y_{1}y_{2}y_{3} = -q \end{eqnarray}

$n$ tane değişkenden (ya da kökten) $n$ tane Viète-Girard simetrik fonksiyonu kurabiliyoruz. Ama $n$ değişkenden kurulabilecek bütün fonksiyonlar, bunlardan ibaret değil! Derecesi $k$ olan Newton toplamlarını tanımlayalım. \begin{equation} N_{k}(x_{1},\ldots,x_{n}) := x_{1}^{k} + \cdots + x_{n}^{k} \end{equation} Bütün Newton toplamlarının simetrik fonksiyonlar olduğunu gözleyiniz. Hatta $N_{0} = n$ ve $N_{1} = s_{1}$ olduğunu da rahatça çıkarabiliriz. Diğer Newton toplamları için biraz cebir kullanmamız gerekecek. Örneğin \begin{equation*} s_{1}^{2} = x_{1}^{2}+\cdots+x_{n}^{2} + 2(x_{1}x_{2}+\cdots+x_{n-1}x_{n}) = N_{2}+2s_{2} \end{equation*} ifadesi yeniden düzenlenerek $N_{2}=s_{1}^{2}-2s_{2}$ sonucuna (bir Newton özdeşliğine) ulaşabiliriz. Bütün Newton toplamları, Viète-Girard simetrik fonksiyonları (dolayısıyla polinomun katsayıları) cinsinden ifade edilebilirler. Böyle denklemlere Newton özdeşlikleri denir. Çalıştığımız kübik denklemler için ikinci dereceden Newton toplamını verelim. \begin{equation} \nu_{2} := y_{1}^{2}+y_{2}^{2}+y_{3}^{2} = \sigma_{1}^{2} - 2\sigma_{2} = -2p \end{equation}

Aşağıdaki simetrik fonksiyonlara bu postada daha sonra gereksinim duyacağız. Amacımız hepsini Viète-Girard simetrik fonksiyonları cinsinden ifade etmektir. İlkin \begin{equation} \Sigma_{2}^{2} := y_{1}^{2}y_{2}^{2} + y_{1}^{2}y_{3}^{2} + y_{2}^{2}y_{3}^{2} \end{equation} ile başlayalım. Sanki $\sigma_{2}$'nin karesiymiş gibi duruyor ve gerçekten de $\sigma_{2}^{2}$ ifadesi açıldığında bu fonksiyonun (\ref{kubik}) nolu denklemdeki katsayılar cinsinden ifadesine ulaşabiliriz. \begin{equation} \Sigma_{2}^{2} = \sigma_{2}^{2} - 2\sigma_{1}\sigma_{3} = p^{2} \end{equation} Bir başka simetrik fonksiyon $\sigma_{1}^{3}$ ifadesinin açılmasıyla elde edilebilir. Şimdi \begin{equation*} \sigma_{1}^{3} = y_{1}^{3} + y_{2}^{3} + y_{3}^{3} + 3(y_{1}^{2}y_{2}+y_{1}y_{2}^{2}+y_{1}^{2}y_{3}+y_{1}y_{3}^{2}+y_{2}y_{3}^{2}+y_{2}^{2}y_{3}) + 6y_{1}y_{2}y_{3} = \nu_{3} + 3 \Sigma_{1}^{3} + 6 \sigma_{3} \end{equation*} sonucunu elde ediyoruz. Burada \begin{equation} \Sigma_{1}^{3}:=y_{1}^{2}y_{2}+y_{1}y_{2}^{2}+y_{1}^{2}y_{3}+y_{1}y_{3}^{2}+y_{2}^{2}y_{3}+y_{2}y_{3}^{2} =\frac{1}{3} \sigma_{1}^{3} - \frac{1}{3} \nu_{3} - 2 \sigma_{3} \end{equation} ve \begin{equation} \nu_{3} := y_{1}^{3}+y_{2}^{3}+y_{3}^{3} \end{equation} ile veriliyorlar. Henüz üçüncü dereceden Newton toplamını hesaplamaldığımız için ne $\Sigma_{1}^{3}$ ne de $\nu_{3}$ katsayılar cinsinden ifade edilemiyorlar. Şimdi basitçe yerine koyarak okur \begin{equation} \Sigma_{1}^{3} = \sigma_{1}\sigma_{2} - 3\sigma_{3} = 3q \end{equation} olduğunu gösterebilir. Nihayet üçüncü dereceden Newton toplamı da böylece çıkmış olur. \begin{equation} \nu_{3} = -3q \end{equation}

İspatına yer vermeyeceğiz ama Newton toplamları için geçerli olan durum aslında bütün cebirsel simetrik fonksiyonlar için de geçerlidir: Bütün cebirsel simetrik fonksiyonlar Viète-Girard simetrik fonksiyonları cinsinden ifade edilebilir.

von Tschirnhaus dönüşümü

Simetrik fonksiyonlara borçlarımızı ödedik. Şimdi \begin{equation} z := y^{2} + \alpha y + \beta \label{vt1} \end{equation} ile yeni bir değişken tanımlayalım ve (\ref{kubik}) nolu denklemi \begin{equation} z^{3}+r=0 \label{vt2} \end{equation} formuna getirmeye çalışalım. Literatürde (\ref{vt1}) nolu denkleme von Tschirnhaus dönüşümü, (\ref{vt2}) nolu denkleme de kübik denklemlerin standart formu denir. Bu dönüşümü tamamlayabilmek için $\alpha,\beta,r$ bilinmeyenlerini $p$ ve $q$ parametreleri cinsinden ifade etmemiz gerekiyor. Kullanacağımız teknoloji simetrik fonksiyonlardan ibaret. Şimdi \begin{equation*} 0=z_{1}+z_{2}+z_{3}=y_{1}^{2}+y_{2}^{2}+y_{3}^{2}+\alpha(y_{1}+y_{2}+y_{3})+3\beta=\nu_{2}+\alpha \sigma_{1}+3\beta \end{equation*} eşitliği gözlendiğinde ve (\ref{kubik}) nolu denklemin köklerinden oluşan simetrik fonksiyonlar kullanıldığında kolayca \begin{equation} \beta = \frac{2p}{3} \end{equation} sonucuna ulaşıyoruz.

İkinci simetrik fonksiyonu kullanalım. \begin{eqnarray} \nonumber 0&=&z_{1}z_{2}+z_{1}z_{3}+z_{2}z_{3}=(y_{1}^{2}+\alpha y_{1}+\beta)(y_{2}^{2}+\alpha y_{2}+\beta) + (y_{1}^{2}+\alpha y_{1}+\beta) (y_{3}^{2}+\alpha y_{3}+\beta) + (y_{2}^{2}+\alpha y_{2}+\beta) (y_{3}^{2}+\alpha y_{3}+\beta) \\ \nonumber &=&(y_{1}^{2}y_{2}^{2}+y_{1}^{2}y_{3}^{2}+y_{2}^{2}y_{3}^{2})+\alpha^{2}(y_{1}y_{2}+y_{1}y_{3}+y_{2}y_{3})+3\beta^{2} +\alpha(y_{1}^{2}y_{2}+y_{1}y_{2}^{2}+y_{1}^{2}y_{3}+y_{1}y_{3}^{2}+y_{2}^{2}y_{3}+y_{2}y_{3}^{2}) +2\alpha \beta (y_{1}+y_{2}+y_{3}) \\ \nonumber &\ & + 2\beta(y_{1}^{2}+y_{2}^{2}+y_{3}^{2}) \\ \nonumber &=& \Sigma_{2}^{2} + \alpha^{2} \sigma_{2} + 3 \beta^{2} + \alpha \Sigma_{1}^{3} + 2\alpha \beta \sigma_{1} + 2\beta \nu_{2} \end{eqnarray} Daha önce çalıştığımız simetrik fonksiyonlar kullanıldığında $\alpha$ katsayısını tayin etmek için çözülmesi gerekli denklem şöyle oluyor. \begin{equation} p\alpha^{2} + 3q \alpha - \frac{p}{3} = 0 \label{alfa} \end{equation} Şaka gibi gelebilir ama bu denklemin diskriminantı daha önce Cardano'nun yöntemini çalışırken karşımıza çıkan diskriminantla aynı! $p\ne 0$ için \begin{equation} \alpha = -\frac{3q}{2p} \pm \frac{1}{2\sqrt{3}p}\sqrt{4p^{3}+27q^{2}} \label{alfa2} \end{equation} olur. ($p=0$ için (\ref{kubik}) nolu denkleme von Tschirnhaus dönüşümünü uygulamaya zaten gerek yoktur.) İşaret seçiminde herhangi bir kriterimiz yok. İstediğimizi seçebiliriz.

Son olarak $r$ katsayısını da $p$ ve $q$ cinsinden ifade etmek kaldı. Bunun için açıldığında toplamda 27 terim içeren bir çarpımla uğraşacağız. \begin{eqnarray} \nonumber -r &=& z_{1}z_{2}z_{3} = (y_{1}^{2}+\alpha y_{1}+\beta) (y_{2}^{2}+\alpha y_{2}+\beta) (y_{3}^{2}+\alpha y_{3}+\beta) \\ \nonumber &=& y_{1}^{2}y_{2}^{2}y_{3}^{2} + \alpha y_{1}y_{2}y_{3}(y_{1}y_{2}+y_{1}y_{3}+y_{2}y_{3}) +\beta (y_{1}^{2}y_{2}^{2} + y_{1}^{2}y_{3}^{2} + y_{2}^{2}y_{3}^{2}) +\alpha^{2} y_{1}y_{2}y_{3}(y_{1} + y_{2} + y_{3}) +\beta^{2}(y_{1}^{2}+y_{2}^{2}+y_{3}^{2}) \\ \nonumber &&+\alpha \beta (y_{1}^{2}y_{2}+y_{1}y_{2}^{2}+y_{1}^{2}y_{3}+y_{1}y_{3}^{2}+y_{2}^{2}y_{3}+y_{2}y_{3}^{2} ) +\alpha^{3}y_{1}y_{2}y_{3} + \beta^{3} + \alpha^{2}\beta (y_{1}y_{2}+y_{2}y_{3}+y_{1}y_{3}) +\alpha \beta^{2}(y_{1}+y_{2}+y_{3}) \\ \nonumber &=& \sigma_{3}^{2} + \alpha \sigma_{2}\sigma_{3} + \beta \Sigma_{2}^{2} + \alpha^{2}\sigma_{1}\sigma_{3} + \beta^{2}\nu_{2} + \alpha \beta \Sigma_{1}^{3} + \alpha^{3}\sigma_{3} + \beta^{3} + \alpha^{2}\beta\sigma_{2} + \alpha \beta^{2}\sigma_{1} \end{eqnarray} Yukarıdaki simetrik fonksiyonların hepsini de daha önce hesaplamıştık. Yerlerine koyalım. \begin{equation} -r = \frac{2p^{3}}{27}-q^{3} + pq\alpha + \frac{2p^{2}}{3}\alpha^{2}-q\alpha^{3} \end{equation} (\ref{alfa}) nolu denklem gereği, $\alpha$ katsayısının bütün pozitif kuvvetleri sadece lineer bir biçimde ifade edilebilirler. Dolayısıyla \begin{eqnarray} \alpha^{2} &=& \frac{1}{3} - \frac{3q}{p} \alpha \\ \alpha^{3} &=& -\frac{q}{p} + \left(\frac{1}{3} + \frac{9q^{2}}{p^{2}} \right) \alpha \end{eqnarray} olur. Böylece $r$ için verilen denklemi daha da sade bir biçimde ifade etme imkanımız oluyor. \begin{equation} -r = \frac{2p^{3}}{27}-q^{3} + \frac{2p^{2}}{9} + \frac{q^{2}}{p} -\left(pq + \frac{q}{3} + \frac{9q^{3}}{p^{2}}\right) \alpha \end{equation} $\alpha$ için verdiğimiz (\ref{alfa2}) nolu denklemdeki ifadeyi yukarıda yerine korsak, o zaman von Tschirnhaus dönüşümü tamamlanmış oluyor.

Sonuçta aradığımız kökler $z_{1}=(-r)^{1/3}$, $z_{2}=(-r)^{1/3}\omega$ ve $z_{3}=(-r)^{1/3}\omega^{*}$ ile verilmelidir. Hatırlanacağı üzere $\omega := \exp(2 \pi i /3)$ şeklinde tanımlanmıştı. Bu kökler ile (\ref{vt1}) nolu denkleme geri dönersek, o zaman toplamda 6 tane $y$ değeriyle karşılaşırız. Ama bizim bunlardan sadece üçüne ihtiyacımız var. Hangilerinin gerçekten de (\ref{kubik}) nolu denklemin kökü olduğunu anlamak için yerine koyup kontrol etmemiz gerekir. Evet, fazla fiyakalı gelmeyebilir ama.. deneme yanılma metodunu kullanacağız! Öte yandan deneme kümesi toplamda 6 elemandan oluştuğu için, bu çok da zor bir iş olmasa gerek...

4 Ağustos 2015 Salı

Kübik denklemlerin çözümü

En genel haliyle \begin{equation} Ax^{3}+Bx^{2}+Cx+D=0 \end{equation} şeklinde verilen denklemlere kübik denklemler diyeceğiz. Burada $A$, $B$, $C$ ve $D$ katsayılar, $x$ ise bilinmeyen olup, problemin çözümünde amaç bilinmeyeni katsayılar cinsinden (sadece kök almayı ve diğer aritmetik işlemleri kullanarak) ifade etmektir. Katsayılara aynı zamanda problemimizin parametreleri diyeceğiz ki, görünürde bunlar toplamda dört tanedir.

$A=0$ ise, o zaman problem ikinci dereceden (kuadratik) bir denkleme indirgenmiş olur ki, bu denklemlerin çözümü ortaöğretimde gösterilmektedir. Bu postada okurun ikinci dereceden denklemleri çözebildiğini varsayacağız ve genelliği kaybetmeden $A\ne 0$ kabul edeceğiz. $b := B/A$, $c := C/A$ ve $d := D/A$ tanımladığımızda (1) nolu denklem aşağıdaki forma kolayca getirilebilir. \begin{equation} x^{3}+bx^{2}+cx+d=0 \end{equation} Hem (1) hem de (2) nolu denklemler çözüldüklerinde aynı $x$ değer(ler)ini vereceklerdir. Ama (2) nolu denklem üç parametreye bağlı olduğu için, onu çalışmak daha avantajlıdır. (2) nolu denklemde en yüksek dereceli terimin katsayısı birdir. Böyle polinomlara literatürde monik polinomlar denir.

Şimdi $x =: y - b/3$ şeklinde yeni bir değişken tanımlayalım. $y$ bilinirse $x$ de kolayca bulunabilir. Bu tanımı (2) nolu denklemde yerine kor ve $y$ niceliğinin kuvvetlerine göre yeniden düzenlersek, o zaman \begin{equation} y^{3} + py + q = 0 \end{equation} denklemine ulaşıyoruz. Burada \begin{eqnarray} p &:=& - \frac{b^{2}}{3} + c \\ q &:=& \frac{2b^{3}}{27} - \frac{bc}{3} + d \end{eqnarray} olduklarını okur binom teoremini uygulayarak kolayca gösterebilir. Bakıldığında (3) nolu denklemin -hiç genellik kaybedilmeden- sadece iki parametreye bağlı olduğu görülecektir. Yola devam etmeden önce bu noktada bazı özel durumları incelememiz gerekiyor.

Özel durum 1: $q=0$. O zaman (3) nolu denklem $y^{3}+py=0$ halini alır ki, bu denklemi köklerinin $\{0,\pm \sqrt{-p} \}$ olduğu çok barizdir.

Özel durum 2: $p=0$. O zaman denklemimizin kökleri yine birin küpkökleri cinsinden kolayca bulunabilir. Aradığımız kökler $\{\sqrt[3]{-q}, \sqrt[3]{-q} \omega , \sqrt[3]{-q} \omega^{*}\}$ kümesindedir. Burada $\omega := \exp (2\pi i/ 3)$ denklemiyle tanımlanıyor. $\omega^{2}=\omega^{*}$ ve $\omega^{3}=1$ olduğunu gözleyiniz.

Genel durum: $p \ne 0$ ve $q \ne 0$. (1) nolu denklemde en genel haliyle dört parametreye bağlıymış gibi görülen kübik denklemlerin aslında sadece iki parametreye bağlı olduğunu (3) nolu denklemle gördük. Domuzdan kıl koparsak kar mantığına sahip haris bir cebirci acaba parametre sayısını ikiden bire indirebilir miyim diye düşünür. Ona yardımcı olalım, $y =: \sqrt{|p|} z$ denklemiyle yeni bir değişken daha tanımlayalım ve bu ifadeyi (3) nolu denklemde yerine koyalım. O zaman $z$ değişkeni için çalışmamız gerekli denklem \begin{equation} z^{3} + sz + r =0 \end{equation} halini alır. Burada $r := q/|p|^{3/2}$ ve $p/|p| =: s \in \{ \pm 1 \}$ oldukları kolayca görülebilir. Dolayısıyla en genel haliyle (6) nolu denklemde verilen kübik denklemler aslında sadece bir parametreye bağlıymış! ($s$ sadece bir işaret olduğu için, onu parametreden saymayacağız.)

Şimdiye kadar yaptığımız kaydırma ($x \to y$) ve skala ($y \to z$) dönüşümleri çok geneldir ve kübik denklemlere özgü değildir. Bundan sonra kübik denklemleri çözebilmek için Cardano'nun yöntemini uygulayacağız. Her ne kadar bir parametreli denklemleri çalışmak daha ucuz olsa da, mutlak değer ve işaret teferruatı ile uğraşmamak için biz (3) nolu denklemle yola devam edeceğiz. Cardano'nun yöntemi \begin{equation} y =: u+v \end{equation} şeklinde iki tane yardımcı değişken tanımıyla başlar. Bu ifadeyi (3) nolu denkleme kor ve yeniden düzenlersek aşağıdaki eşitliği elde ederiz. \begin{equation} u^{3}+v^{3} + (p+3uv)(u+v) + q = 0 \end{equation} $u$ ve $v$ değişkenlerinin tanımlanmasında iki tane serbestiyet derecesi var. Bunlardan birisi (7) nolu denklemle tayin edilmiş. Ötekini ise (8) nolu denklemi sadeleştirecek şekilde biz tayin edebiliriz. Şimdi $p+3uv=0$ ya da $v = -p/3u$ dersek, o zaman bize çözülüdüğünde $u$ niceliğini veren denklem ortaya çıkar. \begin{equation} u^{6} + q u^{3} - \frac{p^{3}}{27} = 0 \end{equation} Kübik denklemlerle uğraşacağız derken sekstik (altıncı dereceden) denklemlere daldık! (9) nolu denklem bize bunu söylüyor. Neyse ki $t := u^{3}$ tanımıyla aslında bu denklemin ikinci dereceden (kuadratik) denklemlere mahsus yöntemle çözülebileceğini gözlüyoruz. \begin{equation} u_{1}^{3} := \frac{-q + \sqrt{q^{2} + 4p^{3}/27}}{2} \ \ \ {\rm ve} \ \ \ u_{2}^{3} := \frac{-q - \sqrt{q^{2} + 4p^{3}/27}}{2} \end{equation} $u_{1}$ ve $u_{2}$ ifadelerine tekabül eden $v$ değerlerini kolayca hesaplayabiliriz. Okur $v_{1}^{3} = - 1/27u_{1}^{3} = u_{2}^{3}$ ve $v_{2}^{3} = - 1/27u_{2}^{3} = u_{1}^{3}$ olduğunu kolayca gösterebilir. Şimdi \begin{equation} U_{1} := \sqrt[3]{\frac{-q + \sqrt{q^{2} + 4p^{3}/27}}{2}} \ \ \ {\rm ve} \ \ \ U_{2} := \sqrt[3]{\frac{-q - \sqrt{q^{2} + 4p^{3}/27}}{2}} \end{equation} tanımlarsak, o zaman $u_{1}$ (ya da $v_{2}$) için çözümler $\{U_{1},U_{1}\omega,U_{1}\omega^{*}\}$ şeklinde olur. Benzer şekilde $u_{2}$ (ya da $v_{1}$) için çözümler de $\{U_{2},U_{2}\omega,U_{2}\omega^{*}\}$ şeklinde olmalıdır. Bizim (3) nolu denklemin köklerini bulmamız gerekiyor. Bunun için (7) nolu denklemi kullanacağız ama seçtiğimiz $u$ ve $v$ değerleri $uv = -p/3$ şartına uyacaklar. Aşağıdaki çözümlerin bu şarta uyduklarını kendiniz ispatlayınız. \begin{eqnarray} y_{1} &:=& U_{1} + U_{2} \\ y_{2} &:=& U_{1} \omega + U_{2} \omega^{*} \\ y_{3} &:=& U_{1} \omega^{*} + U_{2} \omega \end{eqnarray} $y$ değerleri bulunduğuna göre, filmi geriye sararak $x$ değerlerini de hesaplayabiliriz.

Katsayıları gerçel kübik denklemlerin kök tasnifi

(11) nolu denklemde kareköklerin gerçel olması için $q^{2} + 4p^{3}/27 \geq 0$ şartını gözleyiniz. Bu şart yeniden düzenlendiğinde $4p^{3}+27q^{2} \geq 0$ halini alır ve hem $U_{1}$ hem de $U_{2}$ değerleri gerçel olurlar. $\Delta := 4p^{3}+27q^{2}$ tanımlayalım. Aşağıdaki maddelerin ispatını okura bırakıyoruz.

  • $\Delta > 0$: $y_{1}$ gerçel ama $y_{3} = y_{2}^{*}$ olacak şekilde diğer iki kök karmaşık.
  • $\Delta = 0$: Her üç kök de gerçel ve (en az) ikisi çakışık. $y_{1}=2U_{1}$ ve $y_{2}=y_{3}=-U_{1}$.
  • $\Delta < 0$: Her üç kök de gerçel.
$\Delta <0$ durumunda gerçel kökler hesaplanırken mutlaka karmaşık sayıların kullanılması gerektiğini görebiliyor musunuz? Buna İngilizce literatürde Gerçel sayılara giden yol, karmaşık sayılardan geçer. deniliyor.

Ödev: Gerçel köklerin pozitiflik ve negatiflik durumlarını da siz inceleyiniz.

Katsayıları gerçel kübik denklemlerin köklerini hesaplamak için C codu

Aşağıdaki cardano adlı C dilinde yazılmış fonksiyon burada yaptığımız çalışmaları özetliyor. cardano fonksiyonunu pürüzsüz çalıştırabilmek amacıyla kendimiz ayrıca küpkök ve ters trigonometrik fonksiyonlar için küçük modifikasyonlara gerek duyduk. C dilindeki math.h kütüphanesi bu kodu çalıştırmak için gereklidir.

void cardano(double a, double b, double c, double d, int *nr, double *x) /* * Kubik denklem ax^3+bx^2+cx+d=0 formunda ve a kesinlikle 0 degil! * Fonksiyon calistiginda cikti olarak * *nr: gercel koklerin adedini * x[0..2]: gercel koklerin sayisal degerlerini * geri doner. */ { double twopi = 2.0*3.14159265358979323846; double p, q, disc, u, v, r, ct, st, theta; b = b/a; c = c/a; d = d/a; p = c - b*b/3.0; q = 2.0*b*b*b/27.0 - b*c/3.0 + d; disc = p*p*p/27.0 + q*q/4.0; if(disc > 0.0){ *nr = 1; disc = sqrt(disc); u = cuberoot(-0.5*q + disc); v = cuberoot(-0.5*q - disc); x[0] = u + v - b/3.0; } else if(disc == 0.0){ *nr = 2; disc = cuberoot(-0.5*q); x[0] = 2.0*disc - b/3.0; x[1] = -disc - b/3.0; } else { *nr = 3; r = sqrt(-p*p*p/27.0); ct = -0.5*q/r; st = sqrt(-disc)/r; theta = angle(ct,st); r = 2.0*sqrt(-p/3.0); x[0] = r*cos(theta/3.0) - b/3.0; x[1] = r*cos((theta+twopi)/3.0) - b/3.0; x[2] = r*cos((theta-twopi)/3.0) - b/3.0; } } double cuberoot(double x) /* * math.h kutuphanesindeki pow kupkokleri hesaplarken bogulma tehlikesi geciriyor... */ { double ans = pow(fabs(x),1.0/3.0); if(x < 0.0) ans = -ans; return(ans); } double angle(const double c, const double s) /* * c: acinin kosinusu * s: acinin sinusu * cikti: acinin radyan biriminde degeri. */ { double pi = 3.14159265358979323846; if(s >= 0.0) return(acos(c)); else return(2.0*pi-acos(c)); }

3 Ağustos 2015 Pazartesi

Neden suyun kaldırma kuvveti var?

Antik Yunan kültürünün ve dahi insanlık tarihinin en nadide dahilerinden Arşimet'i (MÖ 287 — 212) bilmeyenimiz yoktur. Efsanede hazretin suyun kaldırma kuvvetini keşfettiğinde, hamamdan çıplak bir vaziyette Evreka! Evreka! (yani Buldum! Buldum!) diye bağırarak çıktığı rivayet olunur. Ortaokuldan beri bize öğretirler şu vebatançarpıdesıvı formülünü de, hiç kimse izah etmez neden böyle bir kuvvet var diye! İzaha ihtiyacı mı var? Evet efendim, var. Çünkü fizikçiler bize doğada sadece dört temel kuvvet olduğunu söylüyor: genel çekim, elektromanyetik, zayıf çekirdek ve güçlü çekirdek. Şimdi bu listede suyun kaldırma kuvveti yok. O zaman bizim ne yapıp edip suyun kaldırma kuvvetini buradaki kuvvetler cinsinden ifade etmemiz lazım.

Konunun en genel haliyle ispatı için akışkanlar mekaniği çerçevesinde çok değişkenli vektör analizindeki Stokes teoremi gibi önermelere ihtiyacımız var. Burada o kadar derinlere inmeyeceğiz ve daha basit bir konfigurasyon olan suya (ya da sıvıya) tamamen batmış bir küpü inceleyeceğiz. Hatta o kadar basitleştireceğiz ki problemi, küpün alt yüzeyinin orientasyonunu da yere tamamen paralel -daha doğrusu çekim ivmesine dik- kabul edeceğiz. Şimdi küpe etki eden kuvvetlere bir bakalım. Öncelikle şekilde yeşil renkli vektörle gösterildiği gibi çekim kuvveti var. Bu kuvvet sayesinde küpün bir ağırlığı oluyor. Bu ağırlığın formülü \begin{equation*} {\mathbf W} = m{\mathbf g} \end{equation*} şeklindedir. Burada $m$ küpün kütlesi, $g \approx 9,81$ m/s2 ise dünya yüzeyindeki yerçekimi ivmesidir. Küpe etki eden diğer kuvvetler su basıncından kaynaklanacaktır. Ama burada dikkat etmemiz gereken bir husus var: Küpün bize göre sol yüzeyine belli bir seviyede etki eden sıvı basıncının tamamen aynısı sağ yüzeyine de etki ettiği için sol ve sağ yüzeylere etki eden basınçlar birbirlerini nötralize ederler. Tamamen aynı argüman küpün ön ve arka yüzeyleri için de öne sürülebilir. O zaman geriye sadece küpün üst ve alt yüzeyleri kalıyor. Üst ve alt yüzeylere etki eden basınçlar sırasıyla $p_{1} = \rho g h$ ve $p_{2} = \rho g (h+a)$ ile verilir. Burada $\rho$ sıvının yoğunluğu, $h$ küpün üst yüzeyinin sıvı yüzeyine olan uzaklığı ve $a$ küpün kenar uzunluğudur. Aşağıdaki basıncın daha büyük olduğunu gözleyiniz. Aşağı yönü pozitif alırsak küpe etki eden net kuvvet şöyle verilir. \begin{equation*} F_{\rm net} = mg + p_{1}a^{2} - p_{2}a^{2} = mg - \rho g a^{3} = gV(d - \rho) \end{equation*}

Burada $V=a^{3}$ küpün hacmi, $d := m/V$ ise küpün yoğunluğudur. O zaman $d>\rho$ ise küp aşağı doğru hareket eder (yani batar), öte yandan $d<\rho$ ise küp yukarı doğru hareket eder (yani yüzer.) $d = \rho$ durumunda ise deneye başlandığı andaki hızı neyse o hızı korur: Askıdaysa askıda kalır, batıyorsa batmaya, yüzeye çıkıyorsa da yüzeye çıkmaya devam eder. Hangi durum geçerli olursa olsun, sıvının uyguladığı kaldırma kuvveti $gV\rho$ kadardır. Bu formül küpün ne kadar derine battığından bağımsızdır!

İşin kinematiğine geldiğimizde ivme vektörünü hesaplamamız gerekiyor. Hareketin ikinci kanunu gereği $F_{\rm net} = ma = gV(d-\rho)$ ya da \begin{equation*} a = g \left( 1 - \frac{\rho}{d} \right) \end{equation*} olur. (Maalesef küpün kenarı $a$ ile, hareketin ivmesi $a$ aynı sembolle gösterildi.) Bu formülde küpün ne hacmi var, ne de kütlesi! O zaman rahatlıkla şunu söyleyebiliriz. Sıvıya batan küp ister kolloid boyutunda mikroskopik, isterse de denizaltı boyutunda makroskopik bir cisim olsun, aynı kinematiği tecrübe edecektir.

Toparladığımızda, suyun kaldırma kuvvetinin aslında genel çekim kanunu ve cisimlerin geometrilerinin bir sonucu olduğunu söyleyebiliriz.

Ödev: Zırhlı savaş gemileri kalın metal alaşımlardan yapılıyorlar. Bu alaşımların yoğunluğu deniz suyundan bir kaç kat daha fazla. Neden savaş gemileri batmıyor? Açıklayınız.

Çaprazlama duran iki merdiven - 2: "Biz Sturmcular!"

Daha önce bu blogda Çaprazlama duran iki merdiven - 1 başlıklı postada Martin Gardner'ın bir kitabında gördüğüm bir problemi çalışmış ve problemin çözümünü dördüncü dereceden bir denklemin kök bulma problemine kadar indirgemiştik. Orada kullandığımız notasyonla çözmemiz gereken denklem şöyle idi: \begin{equation} k^{4} - 2ck^{3} + (a^{2}-b^{2})k^{2} - 2(a^{2}-b^{2})ck + (a^{2}-b^{2})c^{2} = 0 \end{equation} Burada $c>0$ ve $a>b>0$ şartlarını not edelim. Ayrıca $k$ bilinmeyeninin sadece $k>c$ şartını sağlayan değerlerini çözüm kabul edeceğimiz de problemin geometrisinden anlaşılmalıdır.

(1) nolu denklemin parametre sayısı üç: $a,b,c$. Ama dikkatle bakıldığında $a$ ve $b$ ayrı ayrı değil hep $a^{2}-b^{2}=:d>0$ formunda bulunuyorlar. O zaman biz (1) nolu denklemi şöyle de ifade edebiliriz. \begin{equation} k^{4} - 2ck^{3} + dk^{2} - 2cdk + c^{2}d = 0 \end{equation} (2) nolu denklemle çalışmak daha avantajlıdır. Çünkü burada parametre sayısı üçten ikiye düşmüştür. Devamla, problemimizdeki uzunlukları $c$ biriminde ölçüp, $k =: cx$ ve $d =: c^{2}D$ birimsiz niceliklerini (2) nolu denklemde yerine korsak, o zaman sadeleştirmelerden sonra aşağıdaki denkleme ulaşıyoruz. \begin{equation} g(x) := x^{4} - 2x^{3} + Dx^{2} - 2Dx + D = 0 \end{equation} (3) nolu denklemde sadece bir tane parametre var! Cebirsel denklemlerden parametreleri ayıklayabildiğimiz kadar ayıklamak problemin hammaliyetini her zaman azaltacaktır ve asla boşa bir uğraş değildir. Problemin başında koyduğumuz $k>c$ şartının yeni değişkenlerde $x>1$ şeklinde okunması gerektiğini gözleyiniz. Gardner, kitabında (1) nolu denklemin kestirme (approximation) bir yöntemle çözülebileceğini söylüyor. Yazara katılmamak için üç nedenimiz var.

  • Vahşi batının en hızlı hesap makinesi çeken mühendisi gibi kökleri soruşturmadan önce, aradığımız şartları sağlayan kökler var mı, öncelikle onu bir kontrol etmemiz gerekir.
  • Aradığımız şartları sağlayan köklerden en çok bir tane olduğunun da garantisi yok. O zaman bulduğumuz sonucun tekliğini de (uniqueness, biriciklik) soruşturmamız gerekiyor.
  • Yaklaşık 500 yıl önce Lodovico Ferrari ve Gerolamo Cardano kübik (üçüncü dereceden) ve kuartik (dördüncü dereceden) denklemleri cebirsel yöntemle, sadece kök almayı kullarak, çözmüşlerdir! Kapalı formu bilinen bir çözümde kestirme yöntemi kullanmak manasızdır. Zira kestirme yöntemler çözümü kapalı formda ifade edilemeyen problemler için vardır.

Varlık ispatına başlamadan önce çalıştığımız polinomun hiç negatif kökü olmadığını not edelim. Çünkü \begin{equation*} g(-\xi)= \xi ^{4} + 2\xi ^{3} + D\xi ^{2} + 2D\xi + D > 0 \end{equation*} olduğundan, negatif bir sayı $g(x)=0$ denklemini çözemez. O zaman $g$ polinomunun (varsa) bütün gerçel kökleri pozitif olmak durumundadır.

Bolzano'nun teoremi ile devam edeceğiz.

Sürekli bir fonksiyon bir aralıkta işaret değiştiriyorsa, o zaman o aralıkta en az bir tane kökü vardır.
Süreklilik şartını hiç düşünmüyoruz çünkü süreklilik ve türevlenebilirlik yönünden polinomlar dünyanın en güzel fonksiyonları. Biz Bolzano'nun teoremini şöyle kullanacağız: $g$ polinomu için $g(x_{1})g(x_{2}) < 0$ ise, o zaman $(x_{1},x_{2})$ aralığında $g$ polinomunun en az bir kökü vardır. Maalesef Bolzano teoreminin teorik uygulamalarında sistematik bir yöntem yok. Onun yerine sezginizle deneme yanılma metodunu kullanmanız gerekiyor. Şimdi $g(0)=D>0$ ve $g(1)=-1<0$ olduğundan, $g$ polinomunun $(0,1)$ aralığında en az bir kökünün olduğunu gözleyiniz. Ayrıca $g(2)=D>0$ olduğundan, $(1,2)$ aralığında da en az bir kök vardır. $(0,1)$ aralığındaki kök (ya da kökler) problemin fiziksel şartlarına uymadığı için kabul edilemez. Öten yandan $x>1$ şartını sağladığı için, $(1,2)$ aralığındaki kökü (ya da kökleri) çözüm olarak kabul edeceğiz.

Biriciklik ispatına geçmeden önce $r(x):=g(x)/(x-1)^{2}$ tanımlayalım. $x>1$ ise, o zaman $g(x)=0 \iff r(x)=0$ olduğunu gözleyiniz. Diğer bir ifadeyle $r(x)$ ve $g(x)$ aynı kökleri paylaşırlar. Şimdi \begin{equation} r^{\prime}(x) = \frac{2x^{2}}{(x-1)^{3}}(x^{2}-3x+3) \end{equation} türevini kolayca alabiliriz. Bu denklemdeki kuadratik terimin, $x^{2}-3x+3$, diskriminantı $\Delta = 3^{2}-4 \cdot 3 = -3 < 0$ ve başkatsayısı pozitif olduğundan hiç kökü yoktur. Dolayısıyla $x>1$ için $r^{\prime}(x)>0$ diyebiliriz. Sözel olarak ifade etmek gerekirse, $x>1$ için $r(x)$ artan bir fonksiyondur.

$r(x)$ fonksyionunun $(1,2)$ aralığında en az bir kökü olduğunu biliyoruz. Bu köke $\xi_{1}$ diyelim. Bu kök biriciktir. Olmayana ergiden (abese irca, reductio ad absurdum) gideceğiz. Eğer mümkünse $(1,2)$ aralığında, $\xi_{2}$ diyelim, başka bir kök daha olsun. O zaman Rolle'nin teoremi uyarınca $r^{\prime}(\eta)=0$ eşitliğini sağlayan bir $\eta \in (\xi_{1},\xi_{2}) \subset (1,2)$ değeri vardır. Ama $r$ çalıştığımız aralıkta artan bir fonksiyon olduğu için bu bir çelişkidir. Demek ki $(1,2)$ aralığında sadece bir tane kök varmış. Nisbeten benzer bir yöntemle $(2,\infty)$ aralığında $r(x)$ (dolayısıyla $g(x)$) fonksiyonunun hiç kökünün olmadığının ispatını da okura bir alıştırma olarak bırakıyorum.

Toparlayalım. $g$ polinomunun hiç negatif kökü yok. $(0,1)$ aralığında pozitif kökü (ya da kökleri) olsa dahi, biz onları dışlıyoruz. $(1,2)$ aralığında tam olarak bir tane kökü var, ki biz de onu aradığımız çözüm olarak kabul edeceğiz. Bu polinomun başka da gerçel kökü yok.

Açık konuşmak gerekirse (1) nolu denklemi ilk defa Gardner'ın kitabında gördüğümde, biriciklik ispatını Sturm teoremiyle yapabileceğimi düşündüm. Her kök bulma problemine Sturm teoremini önerdiğim için, Osman Çağlar Akın Hocam bana "Siz Sturmcular!" derdi. Yazının başlığı o hatırama atıfta bulunuyor. Belirtmek lazım ki Sturm teoremi bu postada kullandığımız Bolzano ve Rolle teoremlerine kıyasla çok daha kuvvetli ve pahalı bir yöntemdir. Sıra gelirse onu da bir gün çalışırız.

Aradığımız çözümün varlığı ve birliği ile uğraşacağız derken, çözümün bizzat kendisini hesaplamaya yine sıra gelmedi. Ferrari-Cardano yöntemi ile dördüncü dereceden kök bulma algoritmasını da başka bir zaman tarif edelim.

Ödev: $g$ polinomunun $(0,1)$ aralığında da sadece bir tane kökü olduğunu ispatlayınız.