T.C.
İSTANBUL ÜNİVERSİTESİ
SOSYAL BİLİMLER ENSTİTÜSÜ
FELSEFE ANABİLİM DALI
YÜKSEK LİSANS TEZİ

DERİN ÖĞRENMENİN FELSEFİ TEMELLERİ

GÜLNİHAL PEHLİVAN

2501140185

TEZ DANIŞMANI

DOÇ. DR. ÖZGÜÇ GÜVEN

İSTANBUL-2019

ÖZET

DERİN ÖĞRENMENİN FELSEFİ TEMELLERİ
GÜLNİHAL PEHLİVAN

Çalışmamızın temel amacı yapay zekâ başlığı altında insan beynini model alan derin öğrenmenin gelişim sürecini inceleyerek anlamlı bir bütün oluşturmak ve yeni bir öngörü ortaya koymaktır. Bu amaçla ilk bölümde tarih boyunca matematikalanında ortaya çıkan, makinelere duyulan ihtiyacın ne şekilde ilerlediği ele alınmıştır. İkinci bölümde, yapay zekâ alanında önemli öngörülerde bulunmuş olan Alan Turing’in “Hesaplama Makineleri ve Zekâ” isimli makalesi incelenmiştir. Ardından Turing’in öngörülerine farklı bir açıdan yaklaşan J. Searle’ün Çin Odası Deneyi ve bilinç tartışmasına yer verilmiştir. Son bölümde ise makine öğrenmesi kavramı, derin öğrenme ve yapay sinir ağları bağlamında incelenmiştir. İnsan beyninin yapısı model alınarak geliştirilen yapay sinir ağları ve derin öğrenmenin mimari yapılarındaki gelişim değerlendirilmiştir. Bu alanda şimdiye kadar yapılmış olan çalışmalardan yola çıkılarak düzeltilebilecek hatalar ve bundan sonrası içingidilebilecek yeni yollar ortaya konulmuştur.

ÖNSÖZ

Matematik bölümünde tamamladığım lisans öğrenimim boyunca teori ve ispatlar üzerinde yaptığımız çalışmalarımızın kullanım alanlarına olan merakım, beni teorik olarak öğrendiğim matematiği pratik olarak uygulayabileceğim yazılım alanına yönlendirdi. Aldığım yazılım eğitimi ve özel sektörde edindiğim programlama deneyimim sırasında bu alanda ne kadar ileri gidilebileceği konusu ile ilgilenmeye başladım. Yazılım alanında gidilebilecek en ileri noktanın kendi kendini programlayabilen/geliştirebilen bir program olduğunu düşündüm. İnsanın bilişsel yetenekler ediniminde önemli bir rol oynayan öğrenme sürecinin makineler için farklı şekillerde işleyen makine öğrenmesi yöntemleriyle karşılık buluşunu ve bu tekniklerin farklı alanlarda kullanım örneklerini inceledim. Bu öğrenme yöntemlerinin insandan elde edilen eğitim verileri olmadan çok daha başarılı sonuçlara ulaşması ile makinelerin başarılı olamayacağı öngörülen birçok alanda başarı göstermiş olması bu alana olan merakımı arttırdı. Bu alanda yapılan çalışmaların sağlam temeller üzerinde ilerleyebilmesi ve doğru soruların sorulabilmesi için hesap makinelerinden başlayarak bilgisayar teknolojisindeki tüm bu tarihi sürecin felsefi bir bakış açısıyla ele alınmasının faydalı olacağını düşünerek araştırmalarıma başladım.

Matematik felsefesi alanında ilerlemek için başladığım yüksek lisans öğrenimim araştırmalarım için yol gösterici oldu. Yüksek lisans ders döneminde aldığım matematik felsefesi dersiyle genel olarak matematiksel bilginin doğasına ilişkin yeni sorularım oluştu. Sorularım sayesinde bilgisayarların -dolayısıyla yapay zekânın- matematiksel mantık ile matematiğin sınırları ve gücü hakkındaki felsefi sorunları aydınlatmak için ortaya çıkmış olduğunu gördüm. Böylece günümüzde enileri yapay zekâ teknolojisi olarak kabul edilen derin öğrenmenin gelişim sürecini felsefe yardımıyla araştırmayı ve bu çalışma alanına katkı sağlayabilmeyi amaçedindim. Bu konuya olan ilgi ve merakımın artmasının nedenlerinden biri de matematik felsefesi dersini, değerli hocam Doç. Dr. Özgüç Güven gibi işine değer katarak yapan birinden almış olmamdır. Tez yazma sürecimde yönlendirmeleri ve tezime yaptığı katkılarından dolayı saygıdeğer tez danışmanın Doç. Dr. Özgüç Güven’e ve tez içeriği ile ilgili düzeltme ve yönlendirmelerinden istifade ettiğim Dr. Öğr. Üyesi Vedat Kamer’e teşekkürü bir borç bilirim.

Tez süresince fizik alanında tüm sorularımı sabırla yanıtlayan sevgili kuzenimDr. Özlem Pehlivan’a ve hayatım boyunca her zaman bana destek olan ailemesonsuz teşekkür ederim.

GÜLNİHAL PEHLİVAN

İSTANBUL, 2019.

GİRİŞ

Felsefe tarihi boyunca insanın düşünce sistemi, beyin yapısı, öğrenme mekanizması, hayatı algılayışı felsefecilerin üzerinde durduğu konular olmuştur. Sokrates, Platon ve Aristoteles insanın düşünce sistemi, dil yeteneği, beyin ve zihin kavramları üzerinde araştırmalar yapmış ve fikir üretmişlerdir. Ancak bu konularda bilimsel ve teknolojik açıdan önemli ilerlemeler 19. yüzyılın sonlarında yaşanmıştır. Matematik dünyasında bir eşik noktası kabul edilen; matematiği formelleştirme çalışmaları ve bu bağlamda Hilbert’in ortaya attığı sorular, algoritmik işlemleri temsileden matematiksel kavramların ve bu kavramlarla çalışabilen soyut makinelerin geliştirilmesiyle sonuçlanmıştır. Bu matematiksel yaklaşımların en genelleştirilmiş hali 1937'de Alan M. Turing tarafından ortaya atılan Turing makineleridir. Turing bu buluşundan sonra insan zekâsının taklit edilebilirliği üzerinde düşünmüş ve bu düşüncelerini 1950 yılında yayınlanan Hesaplama1 Makineleri ve Zekâ (Computing Machinery and Intelligence) makalesiyle ortaya koymuştur. Turing bu makalesinde insan zekâsının makinelerle taklit edilip edilemeyeceğini, makinelerin bir zekâya sahip olup olamayacağını, düşünüp düşünemeyeceğini sormuş ve bu sorularüzerinden kendi görüşlerini açıklamış ve karşıt görüşleri de değerlendirmiştir.

1 Burada dilimize “hesaplama” olarak çevrilen “calculate” ve “compute” kelimeleri arasındaki anlam farkını irdeleyebiliriz. Anlam farkını anlamanın en kolay yolu bu kelimelerden türetilmiş kelimelere bakmaktır: “calculator” (hesap makinesi) ve “computer” (bilgisayar). Basit aritmetik işlemleri yapmakiçin kullanılan araç olan hesap makinesi ve genellikle karmaşık algoritmalar içeren karmaşık işleri yapmak için kullanılan bilgisayar kelimeleri farklı anlamlar içeren kelimelerdir. Bu nedenle sadelik içeren işlemleri hesaplamayı belirtmek için “calculate” ve “calculation” kelimelerini ve karmaşıklık içeren işlemlerin hesaplanmasını belirtmek için “compute” ve “computation” kelimeleri kullanılır.Ayrıca bkz. Maryanne Cline Horowitz, New Dictionary of the History of Ideas, Charles Scribner's Sons, 2005, s. 255.

Turing’den sonra insan beyninin fonksiyonlarının makineler tarafından taklit edilebileceği düşüncesi yeni hedefler belirlenerek ilerlemiştir. İnsanların ve makinelerin sınırları, neleri yapabilecekleri, neleri yapamayacakları gibi konular tartışılmıştır. Böylece günümüzde yapay zekâ, bilgisayar bilimlerinin bir alt dalı gibi görülmektedir fakat konusu ne olursa olsun bütün bilimlerin ortaya koyduğu çalışmalar yapay zekânın gelişimine katkı sağlayan çalışmalar olarak kabul edilmektedir.

Yapay Zekâ’nın çalışma alanlarından biri olan Makine Öğrenmesi ise bilgisayarların kodlar aracılığı ile komut almasının yanında veri kümelerinden de öğrenerek çıkarımlar yapmasını sağlar. Bir makine öğrenmesi tekniği olan derin öğrenmede ise insan beynindeki sinir ağları örnek alınarak oluşturulan yapay sinir ağları ile işlemler gerçekleştirilir. Derin öğrenmenin gelişimi, diğer teknolojik gelişmelerle de ilişkilidir örneğin fotoğraflardaki ve videolardaki çözünürlüğün ve kullanılan GPU (Grafik İşleme Birimi) performansının artması derin öğrenme tekniğinin işlevselliğini arttırmıştır.

Çalışmamızda derin öğrenmenin felsefi temellerini inceleyebilmek için öncelikle makinelerin tarihi gelişimine yer vereceğiz. Birinci bölümde ilk hesapmakinelerinden günümüz bilgisayarlarına uzanan bu süreci ve makinelerin yapabileceklerine dair ortaya atılan fikirleri inceleyeceğiz. Makinelerin hesaplamaişlerinde kullanımının yaygınlaşması ile oluşan fikirlerden biri Leibniz’in tüm düşünme işlerini makinelere yaptırma fikridir. Buna göre Leibniz günlük hayatta yaşanan tüm tartışmaların, matematiksel işlemlerde olduğu gibi sembolik bir şekilde makinelere aktarılması bu yol ile kesin ve net bir şekilde tek bir sonuca ulaşılmasını, insanlar arasında yaşanan anlaşmazlıkların böylece son bulmasını hayal etmiştir. Leibniz’in evrensel dil fikri onun hedeflediği şekilde gelişmese de, onun çalışmaları üzerinden mantık ve biçimsel diller geliştirilmiş bu yolla günümüzde iletişim ve bilgiye erişim çok daha kolay hale gelmiştir.

Bilgisayarların tarihi gelişim süreci incelendikten sonra Turing’in bilgisayarların düşünebilme yeteneğini sorguladığı “Hesaplama Makineleri ve Zekâ” makalesine yer vereceğiz. Bu makale üzerinden Turing’in “Bilgisayarlar düşünebilir mi?” sorusuna eş değer olarak önerdiği taklit oyununu ele alacağız. Ardından bu konu ile ilgilieleştirileri tartıştığı ikinci bölümden yola çıkarak günümüz teknolojisi ve bakış açısıyla Turing’in görüşlerini inceleyeceğiz. Sonrasında Turing’in görüşlerini eleştiren John Searle’ün Çin odası deneyi üzerinden bilinci tartışacağız.

Son bölümde ise makine öğrenmesi teknikleri ve yapay sinir ağları ilegeliştirilen derin öğrenmenin ne olduğunu ve nasıl çalıştığını ele alacağız. Derinöğrenmenin yapısal özelliklerini inceledikten sonra bilinci açıklama iddiasıyla hâlihazırda sürdürülen Mavi Beyin Projesi’nden söz edeceğiz. Son olarak beynin modellenmesi ve modellenen bu beyinde bilincin oluşmasına ilişkin görüşlere yervereceğiz.

BİRİNCİ BÖLÜM

HESAPLAMA MAKİNELERİNİN TARİHİ

Beyindeki yapı ve işlevler örnek alınarak tasarlanmış olan yapay sinir ağları üzerinde çalışan; algoritma ve modeller derin öğrenme denilen çalışma alanını oluşturur. Derin öğrenmenin felsefi temellerini inceleyebilmek, bu alanda bugünyapılan çalışmaları anlayabilmek ve bu gelişim içinde ortaya çıkan sorunlara değinebilmek için öncelikle makinelerin gelişim sürecinden bahsedeceğiz.

1.1 İlk Hesap Makineleri

İlk hesap makineleri olarak bilinen abaküslerin bundan 3000 yıl önce kullanıldığı tahmin edilmektedir. Mekanizması el ile çalıştırılan ilk hesap makinesini ise Blaise Pascal (1623-1662) geliştirmiştir. 2

2 Georges Ifrah, Rakamların Evrensel Tarihi: Akdeniz Kıyılarında Hesap, Tubitak, 1995, s. 109.

Pascal 1642'de, babasının ticari hesapları için ona yardımcı olacak bir hesap makinesi yapmıştır. Pascal’ın geliştirdiği makinenin mekanizması, bir kutunun kapağındaki pencerelerden pozisyonları görülebilen bir sayı tekerleği dizisinden oluşmuştur. 3 Bu makine sayesinde hesaplanacak numaralar seçiliyor ve dişli çarklar döndürülerek, verilen iki sayı üzerinde toplama ve çıkarma işlemleri gerçekleştirilebiliyordu. Pascaline olarak bilinen bu makine 1645’ten bugüne Paris Sanat Müzesi’nde sergilenmektedir.

3 Gerard O'Regan, A Brief History of Computing, Springer Science- Business Media, 2012, s. 25.

1.1.1 Leibniz’in Hayâli

1671’de ise Gottfried Wilhelm Leibniz (1646-1716) sadece toplama veçıkarmayı değil dört aritmetik işlemin dördünü de yapabilecek bir makinegeliştirmek için çalışmalar yapmıştır. 4 Leibniz aynı zamanda dört işlemi yapabilen buluşunun uzun vadedeki sonuçlarına, getirebileceği yenilik ve kolaylıklara da odaklanmıştır. Hesap makinesini tamamladıktan sonra hesaplama gibi uzun ve yorucu bilişsel bir işin, makinelere yaptırılabildiğini görmüş ve insan akıl yürütüşünün önemli bir kısmının da hesaplamalara indirgenebileceğini düşünmüştür. Böylece akıl yürütmelerimizi sembolik mantık ve matematik ile ifade edebildiğimiz gibi tüm akıl yürütmelerimiz için ortak bir ifade şekli olursa her şeyi mekanik olarak yani somutlaştırarak daha kolay çözebileceğimizi öngörmüştür.

4 Deborah J. Bennett, Logic Made Easy, W.W. Norton & Co, 2004, s.148.

Şekil 1 Leibniz’in dört işlem yapan hesap makinesi (Deutsches Museum, Munich)5

Leibniz’in evrensel bir dil ve akılyürütme konusundaki hayali, kendi ünlü sözleriyle de şu şekilde özetlenmiştir:

“...Akılyürütmelerimizi arındırmanın tek yolu onları matematikçilerin ele aldığı gibi somutlaştırmaktır, böylelikle hatalarımızı tek bakışta bulabilir ve bireyler arasında anlaşmazlık çıktığında şunu söyleyebiliriz: Hadi hesaplayalım! [Calculemus!] Aceleye getirmeden kimindoğru olduğunu görebilmek için...”6

5 Edwin D. Reilly, Milestones in Computer Science and Information Technology, Greenwood Publishing Group, 2003, s. 152.

6 Gottfried Wilhelm Von Leibniz, G. W. Philosophical Essays (Çev: R. Ariew & D. Garber), Hackett Publishing Company, 1989, s. 5-10.

Bu söyleminde Leibniz’in, düşünme ve akılyürütme gibi işleri insanlar için yapabilecek bir makine sistemi hayâl ettiği görülmektedir. Leibniz bu sisteme “calculus ratiocinator” (akıl yürütmenin hesabı) adını vermiştir. Düşünme işlerini insanların yerine yapabilen böyle bir sistemin oluşturulması için Leibniz kendigeliştirdiği hesap makinesini örnek almıştır. Kendi tasarımı olan hesap makinesinde sayıların temsil edilişi gibi, düşüncelerde geçen kavramların da matematiksel olarak temsil edilebilmesini sağlayan sembolik bir dile gereksinim duymuştur. Buna göre Leibniz, doğruluk tartışmalarında duyusallıktan kaynaklanan düşünce ayrılıklarının son bulması için düşüncenin biçimselleştirilmesi gerektiğini savunmuştur. Düşüncenin önemli bir kısmını biçimselleştirmek için de, matematikte kullandığımız türden simgelerin ve kuralların gerektiğini öne sürmüştür.

Leibniz’in, “New Essays On Human Understanding” (Evrensel Bir Karakteristiğe Önsöz) başlıklı makalesinde açıkladığı gibi, characteristica universalis (evrensel dil) aracılığıyla düşüncelerimizin alfabesi ortaya çıkacak, temel kavramların analizi yapılabilecektir. Böylece insan düşüncesindeki her şey hesapsal olarak kesin bir şekilde yargılanacaktır. Öyle ki, iki farklı görüşü savunan kişilerin çatışmasına gerek kalmayacak; “calculemus” eş deyişle “buyurun hesaplayalım” dendiğinde kimin haklı olduğu hesaplanabilecektir. Böyle bir sistem inşa edildiğinde Leibniz’e göre, iki filozof arasında iki muhasebeciden daha fazla bir tartışma gerekmeyecektir.7 Burada geçen characteristica universalis düşüncesi de bir tür hesapsal formülleştirmedir. Eğer insan düşüncelerini tam anlamıyla ifade edebilecek karakterler bulunursa, aritmetik ve geometride yapılabilecek herhangi bir işlem bu semboller ile insan akılyürütmesi üzerinde de yapılabilecektir. Lebniz’e göre insan akıl yürütmesinde yapılabilecek tüm araştırmalar bu karakterlerle aktarılarak (transpose) ve bunun matematiğin bir kolu olması sağlanarak geliştirilebilir. Böylece karmaşık görünen akılyürütmeler, karakterler yoluyla basitleştirilebilir ve ifade edilebilir.

Leibniz karakteristik üzerine ilk yazılarında, cebir yerine evrensel bir dil ya da alfabe olduğunu düşünmekteydi. 1676’da düşüncenin cebirini kavradı, geleneksel cebiri ve onun simgesini de ekleyerek modelledi.

Leibniz’in böyle bir düşünceyi ortaya atmasındaki esas sebep; siyasi veya felsefi tartışma ve araştırmaların matematiksel bir yöntem izlemediğinin farkına varmasıydı. Leibniz’e göre, matematikçiler de hata yapabilir fakat bu hataların ne olduğunu fark etmelerini sağlayan yöntem/araçları da vardır; bu araçlara sahip olmayan felsefeciler ve siyasetçiler ise daha fazla hata yapabilirler.8

7 Gottfried Wilhelm Von Leibniz, New Essays On Human Understanding, (Der. P. Remmant J. Bennet), New York: Cambridge University Press, 1997, s. 282

8 Bekir S. Gür, Leibniz’in Matematik(sel) Düşüncesi, Matematik Dünyası, 2005 Güz, s. 91.

Leibniz, yaşamı boyunca Aristoteles’in kurduğu biçimsel mantığa büyük önem verir. Aristoteles’in kıyas teorisini, düşüncenin formüle edilişi bakımından önemli biradım olarak görür. Fakat Leibniz, characteristica universalis anlayışına uygun olarak insan düşüncesindeki her bileşeni hesapsal olarak kesin bir şekilde yargılamayı, Aristoteles mantığı üzerinden gerçekleştirmeye çalışsa da başarılı olamamıştır. Yine de Leibniz sembolik mantık konusunda ilk sistemli çalışmaları gerçekleştirmiş veİngiliz matematikçi George Boole'un (1815-1864) cebirsel mantık çalışmalarına da altyapı sağlamıştır.

1.2 İlk Mekanik Bilgisayar

19. yüzyılda, Newton ve Leibniz’in matematik alanında yaptığı çalışmalar ile birlikte, mühendislikte kullanılan bazı fonksiyonların yerine bu fonksiyonların yerini alabilen polinomların kullanılabileceği anlaşılmıştır. Charles Babbage (1791-1871) bu tür polinomlarla işlemleri gerçekleştirecek makineler tasarlamayı düşünmüştür. Leibniz’in icat ettiği dört işlem yapabilen hesap makinesinden sonra bilgisayar tarihindeki en büyük teknik ilerleme olarak Charles Babbage’ın bu tasarımları sayılabilmektedir; Fark Makinesi (Difference Engine) ve Analitik Makine (Analytical Engine).

Pascal’ın ve Leibniz’in hesap makineleri, Babbage'ın yapmayı planladığı hesaplama makinesinden önemli bir açıdan farklıydı, onlarınki elle işletilen (manuel) hesap makineleriydi, ama Babbage tasarımında makinenin otomatik olmasını planlamıştı. Pascal’ın ve Leibniz’in her aşamada dikkatli bir insan müdahalesi gerektiren çalışmalarının aksine Babbage’ın makineleri sonuçları otomatik olarak üretmek için tasarlanmıştı.

Babbage öncelikle, Cambridge Üniversitesinde matematik öğrencisi iken, denizcilikte çok fazla kullanılan matematik tabloları9 hesaplayıp, basan bir hesap makinesi fikrini ortaya atar. Bu dönemde matematik tablolar, hesaplama işinden sorumlu insanlarca hazırlanmaktaydı. Bu matematik tabloların oluşturulması kavramsal olarak zor değildi, fakat onları oluşturmak için yapılması gereken çok sayıda hesaplama ve bu hesaplamaları yaparken ortaya çıkan hatalar, Babbage'ın çok fazla zamanını alıyordu. Buna çözüm olarak Babbage, sayısal tabloları mekanik olarak ve dolayısıyla hatasız düzenleyebilecek bir makine üretmeye çalışmıştı.

9 Trigonometrik, logaritmik ve diğer fonksiyonların değerlerinin listelendiği kitaplara matematik tablolar denir. Astronomi, mühendislik, denizcilikte önemli bir kullanımı vardır.

Şekil 2. 1991’de Babbage’ın doğumunun 200. yılında fark makinesi tamamlandı ve çalıştırıldı.

(Londra Bilim Müzesi)10

Babbage’ın ilk tasarımı Fark Makinesi olmuştur. Bu makine teoride polinom fonksiyonları, girilen başlangıç değerlerine göre onluk tabanda hesaplayabiliyordu, bu hesaplama sırasında da çarpma ve bölme işlemlerini kullanmıyor sonlu farklar yönteminden11 faydalanıyordu.

Babbage, Fark Makinesi’ni yapabilmek için yeterli finansal desteği almış olmasına karşın onu tamamlayamadı.12 Bunun önemli bir nedeni de, Babbage’ın makinenin tasarımına sürekli yeni fikirler eklemek istemesi böylece tasarım sürecini asla tamamlayamaması, gösterilmektedir.13

10 Londra Bilim Müzesi resmi web sitesi fotoğraf veri tabanından (Çevrimiçi)https://collection.sciencemuseum.org.uk, 12 Aralık 2019.

11 Bu yöntemle sonlu fark denklemleriyle diferansiyel denklemlerin analitik çözümlerine yaklaşılır.

12 Fark Makinesi demir, bronz ve çelikten üretilmiş 4,000 parçadan oluşan 3 ton ağırlığında, 8 metregenişliğinde ve 4 metre yüksekliğinde bir makine olarak tasarlanmıştı ve 1800’lerde böyle bir tasarımın yapımı oldukça zordu. Ayrıca bkz. Gerard O'Regan, A Brief History of Computing, Springer Science- Business Media, 2012, s. 42.

13 Gerard O'Regan, a.g.e., s. 42.

Babbage, Fark Makinesi’nin özel amaçlara yönelik bir hesaplayıcı olmasından ötürü bir süre sonra daha işlevsel olan başka türde bir hesaplayıcı oluşturulabileceğini düşünür. Bu kez özel amaçlarla sınırlı olmayan daha genel amaçlar için, her formüle uygun “programlanabilecek” bir makine tasarlamaya başlar. Babbage, çok daha güçlü ve esnek bir makine üretilebileceğini fark ettiğinde Fark Makinesi’ne olan ilgisini kaybeder. Artık ilgisi Analitik Makine adını verdiği tasarıma yönelmiştir. Analitik Makine’nin mekanik yapısı, Fark Makinesi’nde kullanılan dişli sütunlarına benzer, ancak Fark Makinesi’nde yalnızca sekiz sütun varken, Analitik Makine’de 20.000 sütun olması gerekir.14 Babbage bir önceki projesiolan Fark Makinesi’ni tamamlayamamış olmasından dolayı, maddi destek için tekrar başvuru yaptığında İngiliz hükümetinden yeterli desteği alamamıştır. Bu nedenle Analitik Makine de tasarım olarak kalmış, hayata geçirilememiştir.15

14 Gerard O'Regan, a,g.e., s. 27.

15 Gerard O'Regan, a.g.e., s.44.

Yapımı tamamlanmamış olsa da, Babbage tasarımlarıyla ilgili 1842'de, Torino Üniversitesi'nde bir konferans vermiştir. Sonrasında, bir matematikçi olan Luigi Menabrea (1809-1896), konferansta anlatılanlardan söz eden Fransızca bir makale hazırlamıştır. Babbage bu makaleyi İngilizceye çevirtmek için, sonraları hesapmakineleri tarihinde bir başka dönüm noktası olacak Ada Lovelace’ı (18151852) görevlendirmiştir. Lovelace dokuz ay üzerinde çalıştıktan sonra çevirisini, orijinal belgenin üç katı uzunluğunda bir dizi notla birlikte yayınlamıştır. Çeviriye eklediği notlarda Bernoulli sayılarının, Babbage’ın makinesiyle nasıl hesaplanacağını ayrıntılı olarak anlatmıştır.

Şekil 3. Analitik Makine tasarımı: Soldaki büyük dairesel tekerleklerin etrafında düzenlenmiş yapı, mantıksal ve analitik işlem birimi (CPU) iken, sayfadan sağa doğru uzanan kısım bellektir.

Bilim Müzesi (Londra)16

Babbage, Analitik Makine’de mantıksal ve analitik işlem birimi17, veri depolama birimi (bellek), giriş çıkış üniteleri18 kullanmayı planlamıştır. Ayrıca hesapmakineleri tarihinde ilk defa jakarlı dokuma tezgâhında19 kullanılan delikli kart (punch card) kullanımı örnek alınmıştır. Böylelikle delikli kartlarla girilen komutlar ileherhangi bir aritmetik işlemin makine tarafından yapılabilmesi öngörülmüştür. Burada delikli kart vurgusunun önemi makine ile insan etkileşimini sağlayan bir arabirim olarak iş görmesiyle ilgilidir. Delikli kartlar ilk defa insanın makineye çeşitli komutları verebilmesini sağlamıştır.

16 Computer History Museum (Çevrimiçi), https://www.computerhistory.org/atchm/the-analytical- engine-28-plans-and-counting/, 12 Aralık 2019.

17 Aritmetik işlemler: Toplama, çarpma, çıkarma, bölme. Mantıksal İşlemler: Karşılaştırma, karar verme.

18 Giriş/Çıkış Üniteleri: Verilerin kullanıcıdan girdi olarak alınması ve işlenmiş sonuçların yazılı olarak ekran ya da diğer çıkış birimlerinde gösterimi.

19 J. M. Jacquard, Fransa’da 1805’te patentini aldığı bugün jakarlı dokuma tezgâhı olarak bilinen tezgâhta, desen üzerinde hangi renk ipliğin nerede kullanılacağı karttaki deliklerin pozisyonu ile belirlenmekteydi. Ayrıca bkz. W. A. Atherton, From Compass to Computer: History of Electrical and Electronics Engineering, Macmillan International Higher Education, 1984, s. 269.

Babbage’ın Analitik Makine için kullandığı söz konusu tasarım, günümüz bilgisayarlarının çalışma temellerini oluşturur. Bu temeller üzerine çalışan Ada Lovelace, Analitik Makine’de kullanılmak üzere Bernoulli sayılarını hesaplayan bir diyagram hazırlar. Bu diyagram dünyanın yayınlanmış ilk bilgisayar programı olarak nitelenir. Ada Lovelace bununla da kalmaz Analitik Makine’nin, sayıların ötesine geçebileceğini fark eder. Öyle ki çevirisine eklediği notlarında, müzik, söz dizimi veya görüntüler gibi sayılara dönüştürülebilecek herhangi bir şeyin bilgisayar algoritmaları tarafından manipüle edilebileceğini öne sürer.

1.1.2.1 Makale ve Ada Lovelace’ın Notları

Charles Babbage Tarafından İcat Edilen Analitik Makinenin Kısa Tarifi20

Menabrea’nın makalesinde, Fark Makinesi’nin nasıl çalıştığı hakkında kısa bir bilgilendirme yapılmış ve ardından Analitik Makine’nin nasıl Fark Makinesi’nden daha üstün bir makine olabileceği anlatılmıştır. Menabrea, Analitik Makine’nin basit bir lineer denklem sistemini nasıl çözebileceğini ve iki binom ifadenin bu makine ilenasıl genişletilebileceğini gösteren, makinenin yeteneklerine dair, örnekler vermiştir. Lovelace, bu örneklere ek olarak Not A’da, Analitik Makine’nin Bernoulli Sayılarını nasıl hesaplayacağını anlatan bir diyagram hazırlamıştır.

Makinenin tasarım süreçlerinde Babbage saplantılı olarak sadece sayılarla ilgilenmiştir, Analitik Makine ile sayılar dışında işlem yapılabileceğini düşündüğünü gösteren herhangi bir belge bulunmamaktadır. Ada Lovelace bu noktada notlarında,Analitik Makine ile ilgili Babbage’ın düşünmediği yepyeni bir şey söylemiştir; böyle bir makinenin sadece sayılarla sınırlı olmadığını, eğer makineye müziği sayısal olarak gösterebilirsek müzik de besteleyebileceğinden bahsetmiştir. Analitik makinenin harfler ve sembollerle, sayıları birlikte ele alması için diyagramların nasıl oluşturulabileceğini açıklamıştır. Ayrıca, Analitik Makine’nin, bilgisayar programlarının bugün kullandığı ve döngü (loop) olarak bilinen, bir işlem dizisini tekrar etmesi için bir yöntem teorisi geliştirmiştir. 21

20 L. F. Menabrea, Sketch of The Analytical Engine Invented by Charles Babbage, Çev. Ada Lovelace, 1842. (Çevrimiçi) http://www.fourmilab.ch/babbage/sketch.html#NoteG, 12 Aralık 2019.

21 A.e., s.2.

Ada’nın, Bernoulli sayılarının Analitik Makine ile nasıl hesaplanabileceğini gösteren diyagramını daha iyi anlayabilmek için öncelikle Bernoulli sayılarının ne olduğunu inceleyebiliriz.

1.1.2.2 Kuvvetler Toplamı ve Bernoulli Sayıları

1’den n’ye kadar olan doğal sayıların k’ıncı kuvvetlerinin toplamı eski çağlardan beri matematikçileri meşgul etmiştir.22

İngiliz matematikçi Thomas Hariot (1560-1621), dördüncü kuvvetlere kadar olan toplamları veren simgesel bir formül bulan ilk matematikçi olmuştur. 1631’de, Alman Johann Faulhaber (1580-1635) Academia Algebra adlı kitabında toplamları 17’nci kuvvete kadar hesaplamıştır. İsviçreli matematikçi Jacob Bernoulli (1654- 1705), sabit bir B0, B1, B2, B3, ... dizisi kullanılarak kuvvetlerin toplamını tek seferdeveren bir formül bulan ilk matematikçi olmuştur.

Formülü oluşturmak için Pascal Üçgeni’ni23 kullanan Bernoulli, bu polinomlarıntahmin edilebilir bir model izlediğini fark etmiştir. Bernoulli tarafından Pascal Üçgeni kullanılarak formüllerin üçüncü kuvvete kadar düzenlenmiş hali şu şekildedir:

Bernoulli’nin keşfi, herhangi bir üs için n’ye kadar olan tamsayıların toplamını hesaplamanın önemsiz olduğu anlamına gelmemektedir. Bu yöntemle de belirli bir kuvvete yükseltilen n’ye kadar tüm pozitif tamsayıların toplamını hesaplamak için, belirlenen kuvvete kadar her Bernoulli sayısını bilmek gerekir. Çünkü her Bernoulli sayısı, yalnızca önceki Bernoulli sayıları biliniyorsa hesaplanabilir. Ancak uzun bir Bernoulli sayıları dizisi hesaplamak, her bir güç formülü toplamını elde etmekten çok daha kolaydır, bu nedenle Bernoulli’nin keşfi matematik için büyük bir ilerleme olmuştur.

Bernoulli bir mektubunda “Bu cetvel (yani Bk dizisi) sayesinde, 1000’e kadar olan sayıların onuncu kuvvetlerinin toplamının 1.409.924.241.424.243.424.241.924.242.500 olduğunu bulmak bir çeyrek saatin yarısından daha az zamanımı aldı,” diye yazmıştır. 24

22 Bu konuda çalışan öncü matematikçilerden bazıları; Pisagor (MÖ 572-497), Arşimet (MÖ 287-212),Hintli Aryabhata (doğumu 476), İranlı Ebubekir el Karacı (doğumu 1019), Mısırlı Al Haytam’dır (965- 1039).

23 Adını Fransız matematikçi Blaise Pascal‘dan alan binom katsayılarını içeren üçgene benzeyen yapısından ötürü bu adla anılan bir matematiksel sayı dizisidir. Pascal üçgeninde öncelikle tepeye 1 yazılır. Her satır 1 ile başlayıp 1 ile son bulmalıdır. Örüntü üstteki iki sayının toplamının alta yazılması şeklinde devam eder.

24 Ali Nesin, Bernoulli Sayıları Üzerine, Matematik Dünyası, 2009-III-IV, s. 113.

Şekil 4- Ada Loveloce’ın Note-G başlığıyla yayınladığı notlarında yer alan, Bernoulli Sayıları’nın Analitik Makine tarafından hesaplanması için kullanılan diyagram.25

25 Ada Augusta Lovelace, Sketch of The Analytical Engine Invented by Charles Babbage By L. F. MENABREA of Turin, Officer of the Military Engineers from the Bibliothèque Universelle de Genève,October, 1842, No. 82 With notes upon the Memoir by the Translator Ada Augusta, Countess OfLovelace (Çevrimiçi) http://www.fourmilab.ch/babbage/sketch.html#NoteG, 12 Aralık 2019.

Makalenin devamında Lovelace, etkileyici özellikleri olsa da, Analitik Makine'nin gerçekten (insanlar gibi) düşünebileceğinin söylenemeyeceğini savunur. Not G'nin bu bölümü, Alan Turing'in daha sonra “Hesaplama Makineleri ve Zekâ” isimli makalesinde bilgisayarların düşünmesiyle ilgili itirazlar bölümünde “Leydi Lovelace'ın İtirazı” olarak bahsedeceği kısımdır. Çalışmamızın ileriki bölümlerinde bu konuya daha ayrıntılı bakacağımızı söyleyerek devam edelim. Düşünebildiği söylenemese de Lovelace, Analitik Makine’nin olağan üstü şeyler yapabileceğinden söz ederek devam eder. Daha karmaşık problemlerle başa çıkma yeteneğini göstermek için Lovelace, yukarıda bahsettiğimiz Bernoulli sayılarını hesaplayan programını sunar.

Böylelikle Lovelace programıyla, belli ve sonlu sayıda adımdan oluşan yöntem kullanılarak Analitik Makine’nin Bernoulli sayı dizisini nasıl hesaplayabileceğini gösterir. Lovelace’ın yöntemi bilgisayarlar tarihinde bir makine üzerinde çalıştırılabilen ilk bilgisayar programı olarak kabul edilir.26

26 Ada Lovelace’ın yazmış olduğu bu algoritmayı günümüzde en popüler programlama dili olarak bilinen Python ile yazılmış bir örneği için bkz. (Çevrimiçi) Anlatım için https://enigmaticcode.wordpress.com/tag/bernoulli-numbers/ programın kodları için
https://github.com/enigmatic-code/py-analytical_engine, 12 Aralık 2019.

1.3 Modern Bilgisayarlar

İngiliz matematikçi ve filozof George Boole (1815-1864), Leibniz’in hayâl ettiği düşünce dilinin matematiksel gösteriminin oluşabilmesi sürecine en önemli katkıyı sağlayan bilim insanıdır. George Boole’dan önce, mantık ve matematik disiplinleri 2000 yıldan uzun bir süredir ayrı ayrı gelişmiştir. O zamana kadar mantık doğal dille yapılmıştır. Oysaki matematik o zamanlarda da doğal dil gibi çifte anlamlılık, belirsizlik vs. gibi sorunları olmayan sıkı kurallara bağlı sembolik bir dil ile yapılmaktaydı. George Boole, şimdi Boole cebiri denilen kavramla, mantık ve matematiğin nasıl birlikte kullanılabildiğini göstermiştir.27

27 Ivor Grattan - Gerard Bornet, George Boole: Selected Manuscripts on Logic and its Philosophy, Springer Basel AG, 1997, s. 30.

Boole cebiri, önermeler ya da nesneler arasındaki bağlantıları tarif edebilen matematiksel bir mantık sistemi olarak tanımlanabilir. Bu mantık sistemi aynı zamanda, günümüzde kullanılan sayısal bilgisayar devreleri tasarımının matematiksel temelini oluşturur, bu nedenle de Boole bilgisayar bilimleri alanınınn kurucusu olarak görülmektedir.

1.3.1 Boole Cebiri

George Boole, Boole cebiri ile mantığın klasik sonuçlarını yeniden üretebilecekbir dizi matematiksel aksiyom bulmak amacındaydı. Böylece başlangıç noktası, x ve y gibi değişkenlerle sıradan cebir, toplama ve çarpma gibi işlemler yapmaktı. Boole’dan önce cebirsel denklemlerdeki harfler sadece sayıları ve geometrik kavramları ifade ediyordu. Boole’un sistematiğiyle ilk defa, küme şeklinde ifade edilebilecek her kavram, sayı kavramında olduğu gibi, harflerle temsil edilmeye vebunlar üzerinde cebirsel işlemler yapılmaya başlandı.

Boole’un böyle bir sistematiği nasıl bir akılyürütme üzerinden kurduğunu daha iyi anlayabilmek için bir örnek üzerinden ilerleyebiliriz.

Örneğin “sarı civciv” öbeğini ele aldığımızda bu kelime öbeğinin anlamını, onu oluşturan iki kelimenin anlamlarını bir araya getirerek yani bu iki kelimeye bir tür işlem uygulayarak oluşturuyoruz/algılıyoruz. Boole burada görülen “sarı”kelimesinin sarı olan her şeyi kapsadığını ve sarı olmayan hiçbir şeyi kapsamadığını, “civciv” kelimesinin ise bütün civcivler topluluğuna karşılık geldiğini düşünmüştü. Buiki kelimeyi cebirsel olarak baş harfleriyle ifade edip cebirsel bir işleme aldığımızda-örneğin çarpma işlemi- sembolik olarak şu şekilde gösterebiliriz: “s.c”. Bu işlem ile “bütün sarı civcivler topluluğu” anlamını elde edebiliriz, sonuç olarak “sarı” ve “civciv” ifadelerinin karşılığı olan iki topluluğun kesişimi sağlanmış olur.

Boole bu işlem ile yapılmış olan şeyi araştırırken önemli bir soru sormuştur: Aynı şeyi kendi kendisiyle bu işleme tabi tutarsak nasıl bir sonuç elde ederiz? “sarı x sarı” veya “civciv x civciv” ne demektir? Bu durumlarda anlamın aynı kaldığını düşünerek Boole şu sonuca varmıştır: Herhangi bir x kavramı için, x.x=x’tir.

Boole bu noktada çok önemli olan bir soru daha sormuştur: Sayılar arasındaki çarpmada x.x=x eşitliğini doğrulayan x değerleri hangi sayılar olabilir?

Cevap 0 ve 1’dir.

Boole böylece yeni bir sonuca daha varmıştır: Öyle ise mantığı cebir dilinde yazarken sadece 0 ve 1 kullanabiliriz.

İki kelime arasında yaptığımız işlemi iki kümenin kesişimi olarak düşünebildiğimize göre; 0, hangi küme olduğundan bağımsız olarak kesiştiğinde içeriği değişmeyen bir küme olmalıdır. Bu şekilde tanımlı olarak bildiğimiz şey ‘boş küme’dir. Aynı şekilde 1 sayısını düşündüğümüzde her şeyi içeren bir küme olmalı düşüncesinden evrensel küme olarak bildiğimiz kümeye ulaşabiliriz.

Böylelikle Boole bir önermenin doğru olduğu anlar kümesi boşsa “yanlış” değilse de “doğru” olarak nitelendirilebileceğinden yola çıkarak “doğru” ve “yanlış” kavramlarını 0 ve 1 ile gösterebileceğimizi ortaya koymuştur.28

Bertrand Russel’ın dediği gibi: “Boole bu çalışmasıyla kuramsal matematiğin yaratıcısı oldu.”29

Boole’un çalışmalarının hayata geçmesi, Claude Elwood Shannon (1916-2001) adında bir öğrencinin lisansüstü tezinde Boole cebirinin, röle anahtarları ve elektrik devrelerinde nasıl işlevsel olabileceğini anlatmasıyla ilerlemiştir.30 Sonrasında düşünme dilinin matematiksel gösterimi fikrinin gelişimininpratik/uygulamada/teknik sonucu olarak elektronik devreler, insanlar ve makinelerarasındaki dilin oluşturulabilmesi için kullanılmıştır.

28 Cem Say, 50 Soruda Yapay Zekâ, Bilim ve Gelecek Kitaplığı, 2018, s.18-20.

29 Daniel J. Cohen, Equations from God: Pure Mathematics and Victorian Faith (Johns Hopkins Studies in the History of Mathematics), The Johns Hopkins University Press, 2007, s.77.

30 Lisans diplomasını Michigan Üniversitesi’nde matematik ve elektrik mühendisliği konularında çiftana dal yaparak alan Claude Elwood Shannon, Boole cebirini lisans eğitimi sırasında aldığı felsefe dersinde öğrenmiştir. “Röle ve Anahtar Devrelerinin Sembolik bir Analizi” (A Symbolic Analysis of Relay and Switching Circuits ) adlı tezi 1938 yılında basıldığında çok dikkat çekmiştir. Bu tez bir sonraki yıl Amerikan Mühendisleri Enstitüsü Alfred Nobel Ödülü’nü almıştır. Ayrıca bkz. Aydın Bodur,Shannon'a Saygı, Elektrik Mühendisleri Odası, 2010.

1.4 Hilbert ve Matematik Dünyası

Geçtiğimiz yüzyılda neyin doğru olup neyin yanlış olduğu, matematiğin nasıl yapılması gerektiği, matematikte geçerli bir ispatın tanımının nasıl yapılabileceği gibi konular matematik dünyasında uzun süre ciddi tartışmalara sebep olmuştur. Bu tartışmaların başlangıç noktası Georg Cantor’un (1845-1918) sonsuz kümeler kuramı olarak bilinir. Cantor bu kuramla küme ve sonsuzluk kavramlarının önemine ve içerdikleri paradokslara dikkat çeken ilk matematikçidir. Cantor’un bu çalışmalarından önce sonsuzluk bir nicelik olarak matematikte yer almıyordu daha çok teolojiye ait bir kavram olarak biliniyordu. Cantor ise sonsuzluklar arasında karşılaştırmalar yapmış, doğal sayıların sayılamaz çoklukta olmalarına karşın reel sayılardan daha az sayıda olduğunu çok zekice bir argüman kullanarak göstermiştir.

1901 yılına gelindiğinde ise Bertrand Russell (1872-1970), önce Cantor’unsonsuz kümeler kuramında ardından mantığın kendisinde bazı paradokslar keşfetmiştir. Buna göre önermeler doğru gözükürken aynı zamanda çelişki oluşturmaktadırlar. Bu duruma örnek olarak Russell kendi kendisinin elemanı olmayan bütün kümelerin kümesi ile ilgili “Bu küme, kendisinin bir elemanı mıdır yoksa değil midir?” sorusunu sorar. Buna göre eğer bu küme kendisinin bir elemanı ise, kendisinin elemanı olmamalıdır. Ve eğer kendisinin elemanı değil ise kendisinin elemanı olmalıdır. Aslında, Russell paradoksu olarak bilinen bu paradoks, “Bu cümle yanlıştır” diyen Epimenides paradoksunun küme kuramcı bir türevidir.

1915’te ise David Hilbert’in, Einstein ile Göttingen Üniversitesi’nde yaptığı çalışmalar neticesinde Genel Görelilik Teorisi ortaya çıkmıştır.31 Hilbert, bu çalışmalar sürecinde de sadece genel görelilik teorisini değil herhangi bir fizik teorisini ispatlamayı sağlamak için gerekli olan minimum aksiyom grubunu belirlemeye çalışmaktaydı. Çünkü Hilbert, matematiğin her türlü soruya cevap bulabileceğine inanıyordu ve aksiyomatik metotla herhangi bir matematiksel problemi çözmek için gerekli araçları belirlemeyi hedefliyordu.32 Bu hedef doğrultusunda Hilbert, Cantor’un sonsuz kümeler kuramı ve Russell paradokslarının matematikte ortaya çıkardığı sarsılmaya çözüm olarak, biçimciliği önermişti. Yani Hilbert’e göre sembolik mantık ile yapay bir dil oluşturulup, içeriğindeki her şey (temel kavramlar, tanımlar, dilbilgisi-gramer vs.) çok net bir şekilde yerleştirildiğinde bütün çelişkilerden kurtulup matematiğin nasıl yapılacağı konusunda evrensel bir kabul oluşturulabilirdi. Bu aksiyomatik sistem sayesinde de paradoksların ortaya çıkması engellenebilir ve matematikteki her şeyin mutlak kesinliği ispatlanabilirdi.

31 Joseph Kouneiher, Foundations of Mathematics and Physics One Century After Hilbert: New Perspective, Springer, 2018, s. 101.

32 Jagdish Mehra, Einstein, Hilbert, And The Theory Of Gravitation, D.Reidel Publishing Company, 1974, s.16-20.

Hilbert’in düşüncesi özetle şunu söylemektedir; eğer matematik nesnelse ve öznel elemanlar barındırmıyorsa ve matematiksel bir ispat “doğru” ya da “yanlış” olarak nitelendiriliyorsa, bu durumda bu doğru ya da yanlış niteliğini belirlemek için kesin kurallar olmalı ve bütün detaylar biliniyor ise bu nitelik yoruma bağlı olmamalıdır. Mutlak doğru ya da yanlış çıkarımını yapan bu sistem sayesinde matematiksel bir ispat otomatik olarak kontrol edilebilecek ve bu sayede matematiksel gerçeklik evrensel olarak kabul edilebilecekti.

Hilbert’in aradığı keskinlikte matematik yapma fikri, Antik Yunan ve Euclid geometrisine kadar uzanır. Fakat Hilbert onlardan farklı olarak böyle bir sistemde sembolik mantığın da kullanılması gerektiğini söylemiştir. Aynı zamanda Hilbert’in bu belirsizlikten kurtulma arayışı sembolik mantığın kurucularından olan Leibniz’in evrensel dil (characteristica universalis) anlayışı ile de benzerlik taşıyordu. Leibniz evrensel dil sayesinde olabilecek tüm tartışmalarda (din, siyaset, günlük hayat vs.) “calculemus”(haydi hesaplayalım) dendiğinde tartışmaya gerek kalmadan kimin doğru kimin yanlış olduğunu görebileceğimiz bir sistem hayal etmişti ve bu sistemle akıl yürütmenin cebir sayesinde netliğe ulaşmasının mümkün olabileceğini düşünmüştü. Leibniz ve Hilbert’e göre objektif matematiksel gerçekliği elde etmenin evrensel ön koşulu; durumu tümüyle hesaplamaya indirgemekti.

1931’de Kurt Gödel (1906-1978) “On Formally Undecidable Propositions in Principia Mathematica and Related Systems” adlı makalesini yayınlamıştı. Gödel bu çalışmasında Hilbert’in düşüncesindeki gibi bir matematik sisteminin asla kurulamayacağını ispatlamıştı. Daha net bir şekilde ifade edersek, bu aksiyomatik sistem ya tutarsız olacak ya da eksik olacaktır aynı anda tam ve tutarlı olamayacaktır.

Gödel bu ispatı ile “ben ispatlanamam” diyen matematiksel ifadeyi yazmayı başarmıştır, bu ispat karmaşık bir yapıdadır ve çok sayıda teknik detay içerir. Aynı zamanda bu ispat fazlaca tekrarlayan fonksiyonlar barındırır ve bu fonksiyonlar listeler üzerinde çalışmaktadır ki bu listeler ve tekrarlanan fonksiyonlar LISP33 programlama dilindeki kullanımla tamamen aynıdır. Yani 1931’de programlama dilleri henüz ortada yokken, Gödel’in makalesinde açıkça bir programlama dili görülür.34

33 LISP(Locator/Identifier Separation Protocol) ilk fonksiyonel programlama dilidir. 1958 yılında yapay zeka(artificial intellingence) teriminin yaratıcısı olan John McCarthy tarafından yapay zeka uygulamalarında kullanılmakla birlikte birçok probleme etkin çözümler bulabilmek için geliştirilmiştir.

34 Gregory J. Chaitin, Thinking about Godel and Turing: Essays on complexity, 1970-2007,World Scientific Publishing Company, 2007, s.110.

1.4.1 Claude Shannon Röle ve Anahtar Devreleri

Claude Shannon lisansüstü tezi için yaptığı araştırmalar sırasında analog35 bir bilgisayar kullanmıştır. Bu bilgisayarın donanım ayarlarını yaparken bu işlemleri elektrikli anahtarlarla yapmanın daha kolay olabileceğini düşünmüştür. Boole cebirinin de bu elektrik anahtarlarını düzenlemekte işlevsel olabileceğini farketmiştir. Shannon’un bu konudaki çalışmaları lisansüstü tezini oluşturmuştur.36

Shannon, Bell Laboratuvarları’ndaki37 çalışma sürecinde şirketin telefonlayapılan aramalarda arayanları otomatik olarak aradıkları kişiye bağlayan röle veanahtar dizilimli sisteminin bir iletişim ağından daha fazlası olabileceğini düşünmüştü ve bu sistemi, büyük bir bilgisayar ağı olarak görmüştür. Shannon’agöre sistem ve otomatik anahtar mekanizmaları; çok karmaşık bir makinenin güzel bir örneğiydi. Bu, pek çok yönden insanın yapmaya çalıştığı en karmaşık makineydi ve yine pek çok yönden de en güvenilir olanıydı.

35 Analog bilgisayarlar sürekli değişen verileri (continuously varying data) işlemek için kullanılan bilgisayarlardır. Değişken veri akışına analog veri adı verilir. Analog bilgisayar, elektrik akımını ölçmek, kapasitörün frekansını ve direncini ölçmek gibi bilimsel ve endüstriyel uygulamalarda kullanılır. Ayrıcabkz. D. E. Hyndman and N. Hiller, Analog and Hybrid Computing, Pergamon Press, 1970.

36 Craig P. Bauer, Secret History The Story of Cryptology, Chapman and Hall / CRC, 2013, s. 108.

37 AT & T’nin resmi Ar-Ge bölümü olan Bell Telefon Laboratuvarları’nın (Bell Labs) kuruluşunun sebebi, ‘Bell System’ çatısı altında yer alan şirketlere yani ABD’de telefon sektöründe hizmet sağlayıcı şirketlere ve bu şirketler için cihaz üreten firmalara tasarım, bakım ve danışmanlık desteği vermektir. Ayrıca bkz. Jon Gertner, The Idea Factory: Bell Labs and the Great Age of American Innovation, Penguin, 2012.

1948 yılında Claude Shannon “İletişimin Matematiksel Teorisi”38 adlı makalesini yayınlar. Bu makalede Shannon, bilginin anlamsal kısmını dışarıda bırakarak bilgiyi olasılık dağılımı ve belirsizlikle ölçmeyi önerdiği bilgi teorisini açıklar.

Enformasyon teorisi olarak da bilinen bilgi teorisinin amacını ortaya çıktığı dönemle değerlendirdiğimizde, 1940’lı yıllarda telekomünikasyona bağlı problemlerin çözümünde bilginin elde edilmesi, aktarılması, işlenmesi ve saklanması konularını incelemek üzere oluşturulmuş olduğunu görüyoruz. Bilgi kavramının modern bilgi teorisine dönüşmesi aşamasında Shannon’un ilgilendiği şey bilgi miktarı olmuştur ve bilgi miktarını temsil etmek için de bir simgeye ihtiyaç duymuştur. Bu noktada George Boole'un sıfır ve birlerden oluşan bitlerini39 kullanmıştır ve daha olası mesajları daha kısa, daha az olası mesajların da daha uzun serilerle kodlanması çıkarımını yapmıştır.40 Böylelikle bu teori, mesajın uzunluğunu olayın oluşma olasılığının ters logaritmasına oranlayarak, bilgisayarlar için entropi41 kavramını oluşturmuştur. Buna göre yeterli sayıda ‘bit’ kullanılarak her türlü bilgi (sayı, harf, ses, görüntü vs.) temsil edilebilecektir. Bilgi teorisi ile iletişim sırasında bozulmaya uğrayabilen enformasyonun, alındığı noktada düzeltilmesi için, hata düzeltici kodların kullanımı da tanımlanmıştır. Günümüzdeki tüm sayısal iletişim teknolojileri; uydu iletişimleri, cep telefonu şebekeleri, internet, Shannon’unenformasyon teorisine dayanarak geliştirilmişlerdir.42

38 C. E. Shannon, “A Mathematical Theory Of Communication”, The Bell System Technical Journal- Nokia Bell Labs, 1948, s. 379-423.

39 Bit kelimesi Binary Digit kelimelerinin birleşiminden oluşur. Sıfır ve bir ikili rakamlarını ifade eder. Günümüz bilgisayarlarındaki en küçük veri boyutu biriminin adıdır. Ayrıca bkz. Eddie Martin, Computer Jargon Dictionary and Thesaurus, Beecroft Publishing, 2006, s.17.

40 Jimmy Soni- Rob Goodman, A Mind at Play: How Claude Shannon Invented the Information Age, Simon and Schuster,2017, s.157.

41 Bir bilgi sisteminin toplam enformasyon potansiyeline, Shannon, o sistemin ‘entropisi’ adını vermişti. Ayrıca bkz. Francisco Escolano Ruiz, Pablo Suau Pérez, Boyán Ivanov Bonev, Information Theory in Computer Vision and Pattern Recognition, Springer-Verlag London, 2009, s. 163.

42 Paul J. Nahin, The Logician and the Engineer: How George Boole and Claude Shannon Created the Information Age, Princeton University Press, 2013, s.115.

İKİNCİ BÖLÜM

MAKİNELER DÜŞÜNEBİLİR Mİ?

Hesap makinelerinden yola çıkılarak gelinen noktada bilgisayarlar, mantıklı davranışlar sergileyen sistemler üretmeyi hedefleyen, yapay zekâ konusuna da farklı bakış açıları kazandırmıştır. Günümüzde teknolojik gelişmeler, "Acaba insanzekâsından daha ileri düzeyde bir yapay zekâya sahip bir sistem üretilebilir mi?" sorusunu sormamıza sebep olmuştur. Ve bu sorunun olumlu bir yanıtı olabileceği fikri doğmuştur.

2.1 Alan Turing (Hesaplama Makineleri ve Zekâ)

Bu alanda gerçekleşen önemli ilerlemelerden biri Alan M. Turing (1912-1954) eliyle sağlanmıştır. Turing, 1950 yılında Mind isimli felsefe dergisinde yayınlanan Hesaplama Makineleri ve Zekâ (Computing Machinery and Intelligence) başlıklı makalesinde daha sonra kültleşecek olan "Makineler düşünebilir mi?" sorusunu sormuştur.

Alan Turing, kendi sorduğu bu soruya cevap verebilmek için öncelikle makine ve düşünme terimlerinin anlamları üzerinde ortak bir karar alınması gerektiğini söyler. “Düşünmek” kavramının tanımlanmasının zorluğundan bahseden Turing, bu tanımı yapmak yerine Taklit Oyunu (Imitation Game) olarak adlandırdığı bir oyun önerir.

Taklit oyunu bir erkek (A), bir kadın (B) ve cinsiyeti önemsiz bir sorgucu (C)arasında oynanır. Sorgucunun amacı diğerlerinden farklı bir odada durarak diğerodadakilere sorduğu sorularla kimin erkek kimin kadın olduğunu tespit etmektir.

Turing’in örnek verdiği şekliyle, sorgucunun A’ya sorduğu sorulardan biri şöyle olabilir: “Bana saçının ne kadar uzun olduğunu söyleyebilir misin?” A’nın oyundaki amacı sorgucuyu kandırıp yanlış karar vermesini sağlamaktır. Bu yüzden şu şekilde cevap verebilir: “Benim saçlarım çok uzun çünkü ben bir kadınım.” Diğer oyuncunun (B) amacıysa sorgucuya yardım etmektir. Kendisi için en iyi strateji şöyle olabilir:“Yalan söylüyor. Kadın olan benim! Asıl benim saçlarım uzun.”1

Eğer bu oyundaki A bir makine olsaydı ne olurdu? Sorgucu erkek ve kadını yanlış tahmin ettiği kadar, makine ve insanı da karıştırır mıydı? Alan Turing makalesinde bu soruların “Makineler düşünebilir mi?” sorusu yerine kullanılabileceğini söylemiştir. Ona göre insanın ya da makinenin birbirlerine karşı olan üstünlükleri bu şekilde göz ardı edilebilecektir.

Turing’e göre taklit oyununda bir makine kendisinin insan olduğuna sorgucuyu ikna edebilirse o makinenin düşünebildiği öne sürülebilir. Fakat Turing makine düşünmesinin insan düşünmesinden farklı olabileceği ile ilgili şöyle bir sorunun sorulabileceğini de göz önünde bulundurur: “Makineler, düşünmek olarak tanımlanabilecek ama insanın yaptığından çok farklı olan bir işlem yapamazlar mı?” Böyle bir olasılığın bulunduğunu fakat böyle bir makine türünün büyük bir etki yaratma olasılığının olmadığını belirtir ve taklit oyunu için en uygun olanın insanın düşünme şekline benzer yapıda olan bir makineyle sağlanabileceğini söyler.2 Böylece Turing makinelerin gerçekleştirdiği işlemlerin insanın düşünme şekline benzer yapıda olmasını, insanların sordukları sorulara insanlardan beklenen şekilde mantıklı cevaplar verebilmelerine indirgemiş aynı zamanda da düşünmek olarak tanımlanabilecek ama insan düşünmesiyle özdeşleşmeyecek işlemler yapmalarının da olası olduğuna değinmiştir. İnsanda düşünme işlemlerinin nasıl gerçekleştiğine dair tüm ayrıntılar henüz bilinmediği için bilgisayarlar ve insanlar düşünme kavramı üzerinden net bir ayrıştırma yapmak hala mümkün değildir.

1 Alan M. Turing, “Computing Machinery and Intelligence”, Mind, 1950, s. 433-460. (Çevrimiçi)https://www.csee.umbc.edu/courses/471/papers/turing.pdf 12 Aralık 2019.

2 A.e. , s.435.

Bununla birlikte Turing taklit oyununda erkek oyuncunun makine taklidi yaparak karşısındakini kendisinin bir makine olduğuna ikna etmesi ihtimalini de çok düşük görmüştür. Böyle bir durumda erkek oyuncunun çok kötü bir gösteri sunacağını, çünkü hesaplama işlemlerinde çok yavaş oluşu ya da hatalı işlem yapışıyla makine olmadığının kısa sürede anlaşılabileceğini düşünür. Yeterince geliştirildiğinde bir makinenin bir insanı taklit edebileceğinden emin olduğu halde bir insanın bir makineyi taklit edebilecek yeteneklere asla sahip olamayacağını makinelerin kusursuz hesap yapma yeteneğini ön plana çıkararak vurgular.

Bu noktada makinelerin insana özgü olan düşünme ile tamamen aynı işlemi yapıyor olmalarının mümkün olmaması aslında tam tersini savunsa da Turing’in söylemlerinden çıkarılabilir. Taklit oyunu ile ilgili bahsettiği insanın makineyi taklit etmeyi denediğinde hata yapmaya makineden daha elverişli bir mekanizmasının olması, düşünce sistemlerinde de farklılıklar olabileceğinin göstergesi sayılabilir. Yanimakineler için insanın düşünme şeklini örnek almak yerine daha kusursuz ve net bir “düşünme” tanımı yapılıp bu tanım makinelere uygulanabilir.

Turing makalesinin “Taklit Oyunuyla Bağlantılı Makineler” (The MachinesConcerned in the Game) başlıklı bölümünde, sorulan sorunun kesinlik kazanması için oyunda geçen makinelerin bir tanımını yapar. Bunun için o dönemde tam olarak tanımlanmamış bir terim olan bugün kullandığımız “bilgisayar” kelimesine çok yakın olarak daha önce kendi tanımladığı evrensel Turing makinesi3 ile eşdeğer olan “sayısal bilgisayar” terimini kullanır. Taklit özellikleri sayesinde çeşitli hesaplama işlemlerini yaparak ayrı ayrı makinelerin tasarımını gereksiz kılmış olmalarından dolayı bu özelliğe sahip makinelerin varlığının öneminden bahseder. Ve bu bölümde son olarak, her durum için uygun bir şekilde programlanmış bir sayısal bilgisayarın tüm işlemleri yapabileceğini net bir şekilde ifade eder.4

3 Evrensel Turing makinesi: Alan Turing tarafından tasarlanmış hayali bir makinedir. Turing'in bu makineyi tasarlamaktaki amacı 'algoritma' olarak tanımlanabilecek her türlü mantıksal işlem bütününü mekanik süreçlere indirgeyebilmektir. Ayrıca bkz. A. A. Puntambekar, Theory Of Computation, Technical Publications, 2009, s. 42.

4 Alan Turing, “On computable numbers, with an application to the Entscheidungsproblem”, Proceedings of the London Mathematical Society, Seri 2, 42 (1936-7), s.230-265.

Makalesini yazmış olduğu dönemde makinelerin bellek kapasitesi ve işlem gücünün Taklit Oyunu’nu geçebilmek için yeterli olmadığını düşünen Turing, gelecek 50 yıl içinde bu yeterliliğe sahip bir makinenin üretilebileceğini ifade etmiştir:

“50 yıl içinde bilgisayarların depolama kapasitelerinin 109 civarında olacağını düşünüyorum. Bu sayede Taklit Oyunu’nu o kadar iyi oynayacaklar ki, yalnızca 5 dakika inceleme yapmasına izin verilen bir sorgucunun verdiği kararların %30'unun yanlış olacağına inanıyorum.”5

Burada görüldüğü gibi sorusuna net bir şekilde cevap vermez sadece oransal olarak bir tahminde bulunur. Bu soruya verilecek olan “Evet” ya da “Hayır” cevabının henüz net olmayışı aradaki sınırın belirsizliğini ve bu sorunun tartışmaya açık olduğunu da göstermektedir.

Günümüzde birçok bilim insanı, geliştirilmiş ve güncellenmiş bir Turing Testi'nin gerektiğini iddia etmektedir.6 Turing Testi’nde bilgisayarların insan düşünüşünü taklit edip edemediklerini anlamak için bilgisayarlara sorular sorup, onların sorulan bu sorulara insanlar gibi yavaş cevap vermesi, klavye hataları yapması, duygusal tepkiler vermesi ya da bazen rastgele aklına gelmiş gibi konuyla ilgisiz şeyler söylemesi onlar için avantaj sağlamaktadır. Fakat güçlü yapay zekânın insanlar gibi hata yapması beklenmez, dolayısıyla onun insanlar gibi hatalar yapmasının işe yaradığı bir teste girmesi hedeflenen başarı açısından faydalı olmadığı için Turing Testi’nin güncellenmesi ve bu güncelleme ile sorulan “Bilgisayarlar düşünebilir mi?” sorusunun da değiştirilerek “Bilgisayarlar bilinç sahibi midir?” şeklini alması daha uygun olabilir. Çünkü Turing’in verdiği örnekten de anlaşıldığı gibi bu testte bilgisayar için amaç sorgucuyu insan olduğuna ikna etmektir. Fakat günümüzde hedeflenen, bilgisayarların insanlar gibi düşünmesi değil insanın çözemediği problemlere yanıtlar bulabilmesidir. İnsanların çözemediği problemler için doğru çözüm yöntemini bulmanın yolu ise insanlar gibi düşünmemekten geçiyor olabilir.

5 Alan M. Turing, “Computing Machinery and Intelligence”, s.441.

6 J. Copeland, J. Bowen, M. Sprevak, R. Wilson, The Turing Guide, Oxford University Press, 2017, s.272.

Turing düşünmenin ne olduğunun açıklanmasının zorluğunu, bilgisayarların düşünmesini sağlayarak açıklayabileceğimizi ve taklit oyunu gibi varsayımların yararlı araştırma yolları önerdiğini belirtir. Son bölümde ise "Makineler düşünebilir mi?" sorusu olumlu yanıtlandığında farklı görüşlerin ortaya çıkabileceğini göz önünde bulundurur. Bu farklı görüşleri de dinlemek zorunda olduğunu ifade ederek, makinelerin düşünemeyeceği yönündeki iddiaları değerlendirir.

2.1.1 Teolojik İtirazlar

Söz konusu iddialardan biri; teolojik itiraz olarak bilinen, düşünmenin insan türüne özgü bir yetenek olduğunu savunan, diğer hayvan ve makinelerin düşünemeyeceğini söyleyen teistik görüştür. Buna göre yaratıcı, tüm insanlara ölümsüz birer ruh vermiştir ve düşüncenin temel kaynağı da bu ruhtur. Turing bu itirazı kesin bir dille reddederken teolojik terimler kullanır, bu iddianın Tanrı’nın gücü üzerine ciddi bir kısıtlama getirdiğini belirtir. Eğer uygun görürse Tanrı’nın bir file ruh verme özgürlüğüne sahip olduğuna da inanılması gerektiğini vurgular. Böylelikle, eğer her şeyi yaratan bir tanrı varsa, biyolojik yolla doğmuş olan bir çocuğu onun yaratması gibi, bizim doğru şartlarda bir makineyi bir araya getirmemizdeki bütünlüğü de yaratmış olabileceğini ifade eder.7 Son olarak kendisinin teolojik tartışmalardan etkilenmediğini belirtir ve Galileo döneminde Kopernik kuramlarının İncil’den alıntılarla çürütülmüş olduğunu örnek verir, bilimsel anlamda yaşanan ilerlemeler sayesinde, makalenin yazılmış olduğu çağda bu tür bir tartışmanın olamayacağını düşündüğünü de ekler.

7 Alan M. Turing, “Computing Machinery and Intelligence”, s.442.

2.1.2 Kafaları Kuma Gömme İtirazı

Diğer bir itiraz, Turing’in “kafaları kuma gömme itirazı” olarak adlandırdığı itirazdır. Makalede şu şekilde ifade edilmiştir: "Makinelerin düşünmesinin sonucu çok korkunç olabilir. Düşünemeyeceklerini umalım ve buna inanalım."8 Bu ifade Turing’e göre insanların makinelerin gücünü görmezden gelerek kendilerinde olan yönetme idare etme gibi özellikleri makinelere vermek istememelerinden ileri gelen vedüşünmeyi dolayısıyla da insanı yücelten bir itirazdır. Turing bu itirazı aydınların, düşünme eyleminin; sadece kendilerine özgü olmasını istemeleri sebebiyle, kendilerini rahatlatmak için yaptıkları bir itiraz olarak görür ve eleştirir. Bu argümanı çürütmeye değer bulmaz ve bu şekilde düşünen kişilerin teselli edilmesini dahauygun bulduğunu ekler.

8 Alan M. Turing, a.y. , s. 442.

2.1.3 Matematiksel İtirazlar

Matematiksel açıdan yapılan itirazlarda, Gödel’in (1906-1978) Tamamlanamazlık Teoremi9 (Incompleteness Theorem) uyarınca mantık temelli bir makinenin cevaplayabileceği soru sayısının kısıtlı olduğu savunulur. Gödel’in Tamamlanamazlık Teoremi; o dönemin matematikçilerine yeni matematiksel teoremler üretebilen makinelerin inşası yolunda mantıksal engeller olabileceğini düşündürmüştür.

9 1928’de David Hilbert(1862-1943) ve Wilhelm Ackermann(1896-1962), matematikçilere, yeterince geliştirilmiş olan biçimsel dille yazılmış herhangi bir mantıksal önermenin verilen öncüller kullanılarak kanıtlanabilir olup olmadığını saptayabilen bir yöntemin (günümüzde kullandığımız terimle, biralgoritmanın) bulunması için çağrıda bulundular. Böyle bir algoritmanın var olduğunu düşünüyorlardı bu algoritma keşfedildiğinde artık matematikçiler ispat işlerini bu algoritmaya göre çalışan makinelere bırakabilir, ilgilendikleri herhangi bir önermenin doğru mu yanlış mı olduğunu otomatikolarak öğrenebilirlerdi.

Fakat Gödel bunun olanaksızlığını gösterdi. Bunu kısaca şu şekilde yaptı: ‘Bu önerme ispatlanamaz’ifadesini (G) aritmetik sisteminde formüle etti. Aynı şekilde G ifadesinin değili ola ‘bu önerme ispatlanabilir’ ifadesini de formüle etti. Daha sonra, G ifadesinin aritmetik olarak doğruluğu hesaplanabilirse, G ifadesinin değilinin de doğruluğunun hesaplanabileceğini gösterdi.

Ve Gödel buradan şu iki sonuca vardı:

1.Temel aritmetik içeren aksiyomatik bir sistem tutarlı ise eksiksiz değildir.

2.Temel aritmetik içeren aksiyomatik bir sistemin tutarlılığını sistemin kendi içinden (sistemin kendi formüllerini ve işlemlerini kullanarak) ispatlamak mümkün değildir.

G ifadesi sistemin içine bir aksiyom olarak yerleştirilse bile, yeni bir Gödel cümlesi çıkartılabilir. Yani ne kadar aksiyom eklersek ekleyelim, böyle bir sistemde doğruluğu ya da yanlışlığı ispatlanamayacak bir Gödel cümlesi bulunacaktır.

Ayrıca bkz. Joan Roselló, Hilbert, Göttingen and the Development of Modern Mathematics,Cambridge Scholars Publishing, 2019, s. 193.

Aslında burada merak edilen şey: Tamamlanamazlık Teoremi sayesinde anladığımız üzere, tamamlayamadığımız formel bir bilgi ile nasıl tamamlanmış bir zeka inşa edileceğidir. Veya matematiksel önermeler formel olduğu halde bunlar hakkında bile bir karar verici inşa edemezken, insan zekasını nasıl formelleştirip makineye sığdırılacağı sorunsalıdır.

Turing de 28 Mayıs 1936'da sunduğu “Hesaplanabilir Sayılar: Karar Verme Probleminin bir Uygulaması”10 başlıklı makalesinde, Gödel'in 1931'de aritmetik-tabanlı biçimsel dille hazırladığı hesaplama ve kanıtın sınırlarını makineler üzerinde yeniden belirlemiştir. Matematikte önermelerin ispatlanabilir olup olmadığına kararverme problemini, Turing matematikçilerin problemi olmaktan çıkarmış ve bilgisayarların bir problemi olan durma problemine (halting problem)11 indirgemiştir. Bu çalışmasında günümüzde Turing makineleri olarak bildiğimiz ispatı ortaya atmıştır. Bu ispatla eğer bir algoritma ile temsil edilmesi mümkün ise her türlü matematiksel problemin böyle bir çeşit makine kullanılarak çözülebileceğini göstermiştir. Turing bu makalede, bugün "hesaplama" (computation) olarak bildiğimiz olgunun tanımını yapmakla kalmamış, aynı zamanda hesaplamanın başarabileceklerinin sınırlarını da ortaya koymuştur.

Turing’in ispatını daha iyi anlayabilmek için öncelikle yaşadığı dönemde bilgi işlem makinelerini ve işlevlerini inceleyebiliriz. O dönemde "bilgisayar" (computer) sözcüğü, bugün olduğu gibi bir makineye işaret etmek için kullanılan bir kelime değildi. Bilgisayar kelimesi "bilgiyi sayan insan" anlamına gelmekteydi. Çoğunlukla matematiği iyi olan kadınlar arasından seçilen bu bilgiyi sayan insanlar, devletten ya da diğer büyük kurumlardan gelen verileri defterlere ve kâğıtlara kaydeder, gerekli olan hesaplamaları yapar, tüm sonuçları doğru şekilde işlediklerinden emin olurlardı. Sistemler bu şekilde işlemekteydi, önemli ve uzun bir hesaplama işi gerektiğinde, hesaplanması gereken sayılar bu kişilere verilir ve bu "bilgiyi sayan insanlar", uzun süreler çalışarak, yaptıkları hesaplamaların doğru olduğunu testederek sonucu, hesabı isteyen kişilere (devlet yetkililerine, bilim insanlarına, vs.)iletirlerdi.12 Bir önceki bölümde bahsettiğimiz gibi Charles Babbage’ın fark makinesi tasarımı da insanların çok fazla zaman harcayarak bazen hatalı sonuçlara ulaştığı bu işlemleri otomatik olarak yapacak bir makine arayışından doğmuştu. Bu durum Turing’in de dikkatini çekmiştir insanların yapmak zorunda olduğu bu çok basit ama önemli işin, mekanik ya da elektronik adımlarla kolayca makinelere yaptırılabileceğini öngörmüştür. Bu öngörüsü nedeniyle de “Hesaplanabilir Sayılar” isimli makalesi, günümüz bilgisayarlarının temellerini oluşturan bir çalışma olarak bilinmektedir. Bu makaleyi daha detaylı olarak inceleyelim.

10 Alan M. Turing, On Computable Numbers, With An Application To The Entscheidungsproblem, 1936. (Çevrimiçi) http://www.cs.virginia.edu/~robins/Turing_Paper_1936.pdf 12 Aralık 2019.

11 Alan Turing, 1936’da hesaplanabilirlikle ilgili temel bir sorun olan “durma problemi” ortaya koydu. Bu problem, herhangi bir girdiyi işleyen herhangi bir bilgisayar programının önünde sonunda durupdurmayacağını söyleyecek genel bir algoritma olup olmadığını sorar. Alan Turing bir Turingmakinesine herhangi bir girdi verildiğinde makinenin önünde sonunda durup durmayacağını söyleyebilecek genel bir algoritma olmadığını ispatladı. Ayrıca bkz. Chris Bernhardt, Turing's Vision: The Birth of Computer Science, MIT Press, 2016, s. 24.

12 David Alan Grier, When Computers Were Human, Princeton University Press, 2013, s. 138.

2.1.3.1 Makale: Hesaplanabilir Sayılar - Karar Verme Probleminin birUygulaması

Turing makalesine, matematiksel işlemler yapan, yorulma, uyuma, acıkma, yaşlanma, dikkat dağınıklığı, kâğıt/kalem eksikliği gibi problemleri olmayan, birinsanın yerine geçebilecek bir “makine” türünü net bir şekilde tanımlayarak başlar. Buna göre bir Turing makinesi, önceden tanımlanan kuralları uygulayarak tüm matematiksel fonksiyonları hesaplayabilir. Bu hesaplamayı oldukça basit ve mekanik bir yolla yapar. Turing’in açıkladığı bir başka özellik ise evrensel Turing makinesiolarak bilinir, yani öyle bir Turing makinesi vardır ki bu, diğer tüm Turing makinelerinin davranışını taklit edebilir. Böylelikle Turing, Turing makinelerinin her sistemin benzetimini (simülasyon) yapabilme niteliğini, tek bir makineye sonsuz sayıda farklı iş yaptırabilmek için kullanabileceğimizi de keşfetmiştir, günümüz bilgisayar biliminin temel mimari modeli olan yapı da budur.

Aslında Turing makinesi bir bilgisayar modeli olma amacıyla değil, daha önce Gödel’in de üzerinde çalışmış olduğu, Hilbert'in ortaya attığı; "Acaba bütün matematik problemleri için algoritmik bir çözüm var mıdır?" sorusunu cevaplamak amacıyla tasarlanmıştır ve bu makinenin somut bir mekanizması da yoktur.

Şekil 5 Turing Makinesi Mekanizması

Makinenin bileşenlerinden anlaşılan, Turing bu makineyi çözmek istediği matematiksel problemin güçlüğü nedeniyle, sonsuz olanak taşıyacak biçimde düzenlemiştir. Örneğin makinenin bir bellek olarak kullandığı, verileri üzerine işleyebileceği sonsuz uzunlukta bir şerit tasarlamıştır. Bunun yanında verileri okuyan ve yazan bir okuma-yazma kafası ve algoritmayı işleten bir karar verme ünitesi bulunur. Okuma-yazma kafası, şerit üzerinde sağa sola hareket edebilir, çıktıları daaynı şerit üzerine işleyebilir. Mekanizmanın en önemli parçası olan karar verme ünitesinin güncel karşılığı ise bir işlemcidir. Bu ünite, bant üzerinde o anda üzerinde bulunduğu karedeki duruma göre bir takım kararlar verir, bu kararlar, kafayı sağaveya sola hareket ettirmek, kareyi değiştirmek veya durmak olabilir. Bu noktada durma kararı, Turing makinesinin doğmasına yol açan problemle ilişkilidir. Bir problemin algoritmik olarak ifade edilip edilemeyeceği Turing makinesinin belirliişlemler sonucunda durması şekline indirgenmiştir. Buradaki durma, başarılı olma anlamına gelmektedir. Makine durduğunda sorulan probleme bir çözüm üretmiş demektir. Fakat bazı problemler için, makinenin ne zaman duracağını bilmek mümkün değildir. Bu noktada ‘durma problemi’ (halting problem) yani Turing makinesinin bir problemin işlemsel olarak bir çözümünün olup olmadığına karar verememesi aynı işlemi sürekli tekrar etmesi ama bir sonuca ulaşamaması problemi ortaya çıkar. Durma probleminin ortaya çıkmasıyla bazı problemlerin algoritmik bir çözümü olmadığı bir kez daha ispatlanmıştır.

Turing bu şekilde kendisinin de katkı sağlamış olduğu matematiksel itirazlara cevap olarak yine de makinelere mantık sistemlerini ve mantık sistemlerine makineleri tanımlamanın yollarını bulmak zorunda olduğumuzu vurgular.

Turing, Gödel’in Tamamlanamazlık Teoremi üzerinden yapılan bu itirazın kolayca göz ardı edilemeyeceğini ifade eder fakat makinelerin gücünün sınırları olduğu saptandığı halde “insan zekâsının benzer kısıtlamaları olmadığının hiçbir kanıt gösterilmeden ileri sürülmesini doğru bulmadığını”13 belirtir. Bununla birlikte son olarak matematiksel argümanın taraftarlarının; taklitçilik oyununu, makinelerin düşünebilmesi tartışmalarının temeli olarak kabul edebileceklerini fakat bundan önceki iki itirazı ileri sürenlerin ise herhalde hiçbir ölçüte ilgi göstermeyeceklerini ekler. Bu ifadelerinden, Turing’in bu konuyu tartışmayı gerekli ve faydalı bulduğunu çıkarabiliriz.

13 Douglas R. Hofstadter- Daniel C. Dennett, Aklın G'özü: Benlik ve Ruh Üzerine Hayaller ve Düşünceler (Çev: Füsun Doruker), Boğaziçi Üniversitesi Yayınevi, 2005, s. 64.

2.1.4 Bilinç Argümanı

Turing makinelerin düşünemeyeceğine ilişkin bir başka karşı çıkış olarak İngiliz Nörolog, Profesör Jefferson’ın (1886-1961) argümanını konu eder. Bu argüman 1949yılında Profesör Geoffrey Jefferson tarafından ortaya atılmıştır, Jefferson bugörüşünü Lister Söylevi'nde ifade etmiştir.14 Turing de, Jefferson’un ifadelerini alıntılayarak makalesinde yer vermiştir:

“Bir makine, yalnızca simgelerin şans eseri dizilmesinin dışında, duygular ve düşünceler nedeniyle bir şiir yazıp ya da bir konçerto bestelemedikçe, bir beyne eşit olduğunu kabul edemeyiz; ayrıca bunu yazdığı gibi yazdığını da bilmesi gerekir. Hiçbir mekanizma (kolay birhile olan yapay bir sinyal dışında) başarısından dolayı keyif duyamaz, şalterleri atınca üzülemez, iltifatlara sevinemez, hatalarından dolayı kederlenemez, cinsellikle baştan çıkarılamaz, istediğini elde edemeyince öfkelenemez.”15

14 Sara Turing, Alan M. Turing: Centenary Edition, Cambridge University Press, 2012, s. 101.

15 Douglas R. Hofstadter- Daniel C. Dennett, a.g.e, s. 65. Ayrıca bkz. G. Jefferson, The Mind of Mechanical Man, Lister Oration for 1949, British Medical Journal, 1949, s.1105-1121.

Burada vurgulanan farkında olma durumu Jefferson tarafından insanlara özgü bir özellik olarak görülür. İnsanlar bunu yapabildiği için türümüzü homo sapiens sapiens16 olarak adlandırıyoruz; yani farkında olduğunun farkında olan insan. Bu da bilincin temel şartının farkındalık olduğunu düşündürüyor. Makine zekâsını insan zekâsı üzerinden tanımlayan Turing’in de insan bilincini makinelerin düşünebilmesinden farklı gördüğünü söyleyebiliriz. Ona göre taklitçilik oyunu için bilincin tanımlanmasına gerek yoktur. Turing bu düşüncelerini şu şekilde ifade etmiştir:

“Bilinçlilik konusunda hiçbir gizem olmadığı izlenimini vermeye çabalamıyorum. Örneğin bilinçliliği saptama girişimlerinde bir çeşit paradoks hep vardır. Yine de bizim makalemizdeki sözü edilen soruyu yanıtlamadan önce bu gizemlerin çözülmesi gerektiğini de düşünmüyorum.”17

16 Homo sapiens sapiens, "düşündüğünün üstüne düşünebilen insan" demektir. Bu tanımı ortaya ilkRene Descartes atmıştır. Günümüz modern insanının bu alt türe mensup olduğu düşünülür. Ancakçoğunlukla sadece Homo sapiens olarak anılır. Ayrıca bkz. Stephen Tomkins, The Origins of Humankind, Cambridge University Press, 1998, s. 107. D. Gambier, Fossil hominids from the early upper Paleolithic (Aurignacian) of France, Mellars & C. Stringer (Eds.), The human revolution, Princeton, NJ: Princeton University Press, 1989,s. 194–211.

17 Alan M. Turing, “Computing Machinery and Intelligence”, s. 443.

Her ne kadar Turing, bilinç sorununa girmeden makineler düşünebilir mi sorusu üzerinden bir tartışma yürütse de Douglas R. Hofstadter’in Turing testi üzerinden işaret ettiği bir bilinç tartışmasından söz edilebilir. Douglas R. Hofstadter bilincin belirgin bir organizasyon modelinden kaynaklandığını ve zamanla bu modelin anlaşılabileceğinden söz eder. Buna göre bilinçlilik, dış evreni belirli bir yolla zihinsel olarak içe yansıtmayı ve zihinsel olarak oluşmuş olan bu iç modeli esas alarak dışsal gerçekliğe yanıt verme yeteneğini gerektirir.18 Burada kullanılan “dış evreni belirli bir yolla zihinsel olarak içe yansıtmak” deyimi bilgisayarların yaptığı gibi etrafımızda gördüğümüz varlıkların davranışlarını düşüncemizle simule etme ve gelecekte ne olacakları ile ilgili akıl yürütme özelliğimizdir. Bu özellik yapay zekâya sahip bilgisayarların yapmasını beklediğimiz işlemlerin temelini oluşturan yapıdır. Ayrıca bu tanıma göre bilinçli bir makine için en önemli özellik ileri düzeyde geliştirilmiş ve her yapıya uyarlanabilecek şekilde esnek bir öz-modeli olmasıdır. Buna göre esnek öz-model bir bilgisayarın kendi kendini programlayabilmesinin de ön koşulu olarak kabul edilebilir.

Jefferson’ın iddiasına göre ise; bir makinenin sadece içindeki sembolleri kullanması önemli değildir. Makine kendi hissettiği duygu ve düşünceleriyle bir söz yazıp ya da bir beste yapana kadar hatta yazdığı söz ve bestesinin farkında oluponunla gurur duyana kadar bilinç sahibidir, diyemeyiz. Ona göre bir makinenin bilinçli olması sadece bir eser üretmesi de değil aynı zamanda başarısızlığına üzülmesi, bir iltifat karşısında sevinmesi, bir şeyi elde edemediğinde sinirlenmesigibi hisler (duygular) barındırıyor olması demektir.

Jefferson, sadece belirli sembollerin bir araya gelmesinin zihni anlatmaya yetmeyeceğini, geçmiş düşünceler ve duygular kullanılarak bestelenen bir müzik ya da yazılmış bir şiir ortaya koymadan bir makinenin insana eş değer görülemeyeceğine işaret eder. Bununla birlikte bir insanın yaşadığı kederi, mutluluğu, cinsel çekimi, öfkeyi ya da depresyonu bir makinenin yaşayamayacağını da ileri sürer.

Turing, Jefferson’ın iddiasını şu biçimde yeniden düzenler: “...bir makinenin düşündüğünden emin olmak için, makinenin kendisi olmamız ve düşündüğümüzü hissetmemiz gerekiyor. (...) yine bir insanın düşündüğünü anlamanın tek yolu da o insan olmaktır”19 Turing, bu görüşü tekbenci bakış açısı olarak değerlendirir. Sonrasında zihin felsefesi tartışmaları açısından öteki zihinler sorunu olarak belirginleşecek bu nokta, herkesin kendi zihnine dolaysız, başkasının zihnine dolaylı erişiminden kaynaklanan gerilimi konu eder. Turing, zihinle ilgili bu gerilimin hem makineler hem de insanlar için aynı düzeyde durduğunu belirterek, Jefferson’ın iddiasından vazgeçmeye ikna edilebileceğini varsayar.

18 Douglas R. Hofstadter- Daniel C. Dennett, a.g.e., s. 85-87.

19 Alan M. Turing, “Computing Machinery and Intelligence”, s. 455.

Tekrar Jefferson’ın söylemine dönersek burada parantez içinde “kolay bir hile”olarak nitelenen ve tüm insani durumların dışında tutulan “yapay sinyal”, makinenin yaptığı şeyin doğru olduğu bilgisini edindiği, kendi sistemi içinde olan onaylanma sinyalidir (makine için ödül mekanizmasıdır). 21.yüzyıl moleküler hücre biyolojisi alanındaki önemli gelişmelere baktığımızda, bilim insanlarının canlılarda bulunan vebeyindeki kimyasal iletime katkısı olan farklı iletim maddelerini (nörotransmitterleri) ve bu maddelerin hangi işlevlerde rol aldığını gözlemlemiş olduklarını görürüz.20 Bu gözlemler sayesinde artık birçok kimyasalın duygusal değişimlerimiz üzerinde etkili olduğu bilinmektedir. Hormonların etkisini çok temel düzeyde inceleyecek olursak, bize iyi hissettiren bir durumun, yani beynimizdeki ödül mekanizmasını tetikleyen davranışlarımızın, ilkel insanların hayatta kalma şansını arttıran unsurlar olduğunu görebiliriz (örneğin hayatta kalmak ve türümüzü devam ettirmek için öncüller; beslenme21, güvenlik, üremek, vb. ). Mutlu olmamızı sağlayan kimyasallar, hem toplumsal iletişim, hem de bireylerin genel sağlığı için olumlu tutum sergilendiğinde ortaya çıkarlar.22 Böylece insanlar olarak bu kimyasalların salgılanmasını arttıracak davranışlara eğilimimiz vardır ve bizde var olan bu ödül mekanizmasının, insan beynini örnek alarak geliştirilen, makineler için de oluşturulması sağlanabilir. Özellikle düşünen ya da otonom bir makine yapmak istiyorsak ona yaptırmak istediğimiz işler üzerinde motive olmasını sağlayacak bir kod parçacığımız (yapay sinyal) olmalıdır.

20 D.G. Hardie, Biochemical Messengers: Hormones, Neurotransmitters and Growth Factors, Springer Science & Business Media, 1991, s. 21.

21 Beynin yemek yemeğe nasıl karar verdiğiyle ilgili bir makale için bkz. (Çevrimiçi) “How Does the Brain Implement Adaptive Decision Making to Eat”, The Journal of Neuroscience, 2015, s.13868- 13878. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4604225/pdf/zns13868.pdf, 12 Aralık 2019.22 22 Joe Herbert, The Minder Brain: How Your Brain Keeps You Alive, Protects You from Danger, and Ensures that You Reproduce, World Scientific, 2007, s. 55-64.

İnsanlığın gelişim süreciyle ilgili Ayrıca bkz. Aynı eser: “Doğal seçilimle genele fayda sağlayan, türe yararlı, hatta vazgeçilmez olan dürtü değiştirilmeksizin bırakılırken, zararlı olabilecek dürtülerin özel durumlarını önlemek için bir sosyal engel mekanizması ortaya çıkar.”

Turing bu noktada Jefferson’un aşırı ve tekbenci bakış açısını kabul etmek istemeyeceğini ve bu konuda taklitçilik oyununu bir sınav olarak kabul edebileceğiniifade eder. Bu görüşe karşı savunmasının son bölümünde daha önce örneklenmiş olan taklitçilik oyununun daha karmaşık bir örnek diyaloguna yer verir ve “Böyle gerçekçi bir diyalog içinde olduğunuzda hâlâ karşınızda bir makine olduğundan şüphe edebilir misiniz?”23 diye de sorar. Burada Turing’in makinelerle ilgili görüşlerinin nelerin mümkün olmadığı üzerine odaklanmak yerine, “nasıl mümkün olabilir” düşüncesine odaklandığını görmekteyiz.

23 Alan M. Turing, “Computing Machinery and Intelligence”, s. 456.

2.1.5 Çeşitli Engeller Argümanı

Beşinci itiraz, çeşitli engeller argümanıdır ve neredeyse bilinçlilik argümanı ile aynı içeriğe sahiptir. Bu argümanda âşık olmak, tat almak, hatalar yapmak gibi farklı yönlerden bilinçli olmanın getirdiği özelliklerden bahsedilir ve makinelerin bueylemleri insanlar gibi gerçekleştiremeyeceği iddia edilir. Turing bu tür argümanlarıyine bilişsel olarak görür. Yani Turing’e göre bu tür insani faaliyetler de temelde biyolojik yapıyla birleşik bilişsel süreçlerdir, bu isteklerle veya korkularla ilgili psikolojik davranışsal süreçler biçimsel olarak uygulanırsa/programlanırsa, makineler de tasarlandığı ölçüde isteyen, korkan, tat alan ve hatalar yapan zihinler olacaktır.

Turing bu argümanı, insanlardaki bilimsel tümevarım üzerine kurulmuş sınırlandırmalar olarak görür. Ona göre insanın yaptıkları ve alışkanlıkları bilimsel tümevarımın uygulanmasına uygun değildir. Bu konuda tümevarım ile güvenilir sonuçlara ulaşmak için uzay ve zamanın önemli derecede büyük bir bölümünün araştırılması ve açıklanabilmesi gerekmektedir. Turing bu eleştirinin ilginç ve sempatik olmadığını söylese de anlamaya çalışan bir yaklaşım sergileyerek aslındane demek istendiğini incelemeye çalışır. Bu iddiayla ilgili tespit ettiği şey; iki çeşit hatanın birbirine karıştırılmasıdır. Bu hatalar işlev hatası ve sonuç hatasıdır. İşlev hataları, mekanik ya da elektriksel bir sorun sebebiyle makinenin tasarlanmış olanın dışında çıktı üretmesidir. Felsefe tartışmalarında bu türden hatalar göz ardı edilmek istendiğinden, tartışma 'soyut makineler' üzerinden devam ettirilir. Burada bahsedilen soyut makineler fiziksel nesneler değil matematiksel kurgulardır ve işlev hatası yapmaları mümkün değildir. Sonuç hataları ise makinenin çıktılarında oluşan beklenmeyen hatalardır. Bu hatalar makinenin sinyallerine bazı anlamlar katıldığı zaman ortaya çıkar. Böyle bir makine bilimsel tümevarımla sonuca ulaşma yöntemine sahip olabilir. Matematik ve mantık da tümdengelim yöntemi ile kesin doğru olarak kabul edilen bilgilerden çıkarımlar yapılarak yeni bilgi üretme yöntemleridir. Turing’e göre böyle bir yöntem doğal olarak bazı durumlarda hatalı sonuçlara ulaşabilir.

Buna göre, makineler çirkindir, sınırlı amaçlar için tasarlanmıştır, biraz farklı bir amaç söz konusu olunca, işe yaramazlar, davranış farklılıklarındaki çeşitlilik çok azdırvs. iddialarını “Bir makinenin davranış çeşitliliğine sahip olmaması onun depolama alanının sınırlarıyla ilgilidir.”24 Diye cevaplayarak çözüme kavuşturur. Çünkü Turing depolama alanı problemlerinin yakın bir gelecekte aşılabileceğini iddia etmiştir. Turing’e göre bu problem aşıldığında makinenin davranış çeşitliliği sınırlarıyla ilgili sıkıntının kaynağı da ortadan kalkmış olacaktır.

24 Alan M. Turing, “Computing Machinery and Intelligence”, s. 447.

2.1.6 Lady Lovelace'ın İtirazı

Lady Lovelace, Charles Babbage’ın tasarımı olan Analitik Makine hakkında yazdığı notlarda makinelerin geleceğiyle ilgili bazı tahminlerde bulunmuştur. Bunlardan biri makinelerin bir şeyi kendiliğinden yapmasının mümkün olmadığı ve komut verdiğimizde bunun kendisinde karşılığı bulunan komutları algılayabildiği yönündedir. Turing bu fikre, Hartree’nin görüşüyle karşı çıkar. Bu görüşe görekendisi ile ilgili düşünebilecek veya yeni şeyler öğrenebilecek bir makine üretmenin mümkün olmadığını şimdiden söyleyerek makinelere sınırlar koymak doğru ve mantıklı değildir. Turing bu görüşe, kendiliğinden bir şey yapma durumunun da programlanabileceğini ekler. Ona göre bir program çok daha fazla parametreyi girdi olarak alırsa, hatta bu girdilere fiziksel rastlantı da eklenirse, bilgisayarlar kendi başlarına bir şeyler yapabileceklerdir.

Turing, Lady Lovelace’ın savına, makalesinin son bölümü olan Öğrenen Makineler (Learning Machines) başlıklı bölümde günümüz makine öğrenmesi kavramına yaklaşan bir tutumla yanıt verir. Çalışmamızda ise bu argüman günümüzteknolojisi ile düşünüldüğünde şöyle yanıtlanabilir:

Bir yazılım, makine öğrenmesi algoritmalarıyla, girilen sonlu sayıdaki veriyiişleyerek o veriler hakkında bir model oluşturur sonrasında bu modeli test eder. Hata durumlarını saptayabilirse kullandığı modele dönüp bu modeli değiştirir böylece ideal modeli geliştirebilir sonrasında da yeni veriler için doğru çıkarımlar yapabilir. Yani makine öğrenmesi gibi modern yazılım teknikleri öngörülenin dışında davranışlar sergileyebilir. Fakat makine öğrenmesi ve buna benzer algoritmalar yine bir programcı tarafından bilgisayara yüklenerek, ona tanıtılarak gerçekleştirilir yani yazılımın kendisi bu metotları uygulamaya karar vermez. Bir makinenin yapabileceklerinin neler olduğunu tüm açıklığıyla ifade etmese de, Lovelace “bir makineye bizim yapmasını istediğimiz her şeyi yaptırabiliriz” derken, aslında bir sınır koymuş değildi. Turing’in de alıntılayarak yer verdiği gibi Lovelace’ın ifadesi şu şekildeydi:

“Analitik Makine herhangi bir şeyi kendiliğinden yapma iddiasında bulunmuyor. Nasıl talimat vereceğimizi bildiğimiz her şeyi yapabiliyor” (italikler Lovelace’a aittir)25

25 Alan M. Turing, a.y.

Bu noktada nasıl talimat vereceğimizi bildiğimiz her şeyi makineye yaptırabileceğimiz söylemi çok kapsamlı bir söylemdir. Hiçbir şekilde programlanmamış bir makine donanım olarak tam olsa da kendi kendine bir işlem yapma kabiliyetine sahip değildir. Makineye verilen talimatlar onu öngöremeyeceğimiz çıktılar üretebilecek şekilde programlamayı da içerebilir. Bu açıdan baktığımızda Lovelace ve Turing’in makinelerin yapabilecekleri ile ilgili düşünceleri birbirlerinden çok da uzak değildir.

Turing’de devamında bu argümanın daha iyi bir çeşitlemesi olarak “bir makinenin bizi asla şaşırtamayacağı” düşüncesini ele almayı önerir. Buna göre bir şeyin şaşırtıcı olması yani sürpriz olarak kabul edilmesi için “yaratıcı zihinsel birhareketin” gerekliliğinden bahseder. Makinelerin sürprizlere yol açamayacağı görüşünün ise özellikle matematikçilerin ve felsefecilerin düştüğü bir yanılgı olduğunu söyler. Bu yanılgının sebebini ise “herhangi bir gerçek, bir akla sunulduğu zaman tüm sonuçların aynı anda akla geleceği varsayımı”26 olarak açıklar. Bu varsayımın çeşitli koşullar altında faydalı fakat doğru olmadığını dile getirir. Burada tüm sonuçların aynı anda akla geleceği varsayımının yanlış olduğunu söyleyerek Turing’in insan zihninin sınırlarını vurguladığını görüyoruz. Günümüzde makine öğrenmesi ve derin öğrenme yöntemleriyle alınan sonuçlar da makinelerin insanları şaşırtabileceğini en basit şekilde oyunlar üzerinde göstermiştir. Çalışmamızın son bölümünde buna ilişkin örnekler yer almaktadır.

26 Alan M. Turing, “Computing Machinery and Intelligence”, s. 448.

2.1.7 Sinir Sisteminin Sürekliliği Argümanı

Bu argümanda; bilgisayarın bir kesikli durum makinesi, sinir sisteminin ise birsürekliliğinin olduğu iddia edilir. Turing de makalesinde düşünmenin kesintisiz olduğunu, bilincin parçalı değil bütüncül, makinelerin ise kesikli yani süreksiz olduğunu kabul eder. Yine de taklit oyununda bunun bir önemi olmadığını ekler. Birdüşüncenin sürekli bir sistemde mi, kesikli bir sistemde mi üretildiğinin nasıl bir önemi olabileceğini sorgular. Burada önemli olan noktanın, düşüncenin üretilmesi olduğunu vurgular.

1950'de kuantum fiziğinde yaşanan gelişmeler sayesinde, uzay ve zamanın da, enerjinin de yapısı kesikli olarak tanımlanmıştı. Turing’in neden nöron aktivitelerine süreklilik özelliğini atfettiği bilinmiyor. Bu konunun aydınlatılması için dönemin nörobilim kabullerini incelememiz gerekebilir. Şimdilik, ortaya atılan çalışmaların doğru olmasına rağmen kabul görmediği bir dönem olabileceğini tahmin ederek devam edeceğiz. Çünkü modern sinir bilimin kurucusu olarak kabul edilen Santiago Ramon y Cajal27 (1852-1934) nöron doktrini üzerine ilk makalesini 1888 yılında “Kuşların Sinir Merkezlerinin Yapısı” ismiyle yayınlamıştır. Bu makalede ilk defa sinir hücrelerinin birbirleri ile sürekli değil kesintili temaslar ile haberleştikleri ileri sürülmüştür. Santiago Ramon y Cajal’ın çalışmaları sinir bilimlerinde önemli bir dönüm noktasıdır. Bu çalışma sayesinde sinir sisteminin de diğer tüm dokulardaki gibi tek tek hücrelerden oluştuğu ve sürekliliği olmadığı gösterilmiştir. Cajal 1906 yılında sinir sisteminin yapısı konusundaki Nöron Doktrini28 araştırmaları üzerine Camillo Golgi ile birlikte Nobel Tıp/Fizyoloji Ödülü’nü almıştır.29

Böylece canlılardaki sinir sisteminin sürekli olmadığı ve bu mevcut süreksiz yapının beynin makinelerde modellenememesi sorununa sebep olamayacağı anlaşılmaktadır.

27 19. yüzyıl İspanyol bilim insanı ve modern nörobilimin kurucusu kabul edilen Santiago Ramon yCajal, beynin yapısı ile ilgilenen ve çözen ilk araştırmacılardandır. Bununla birlikte Cajal, nöronal morfoloji, haberleşme ve gelişimi ile ilgili bulgularıyla da sinirbilim dünyasında yeni bir devrinbaşlamasına öncülük etmiştir. Ayrıca bkz. Gordon M. Shepherd, Foundations of the Neuron Doctrine, Oxford University Press, 2015, s. 127.

28 Nöron Doktrini, nöronların birbirinden ayrı, tekil hücreler olduğunu ileri sürer. Doktrine göre, nöronlar biyokimyasal olarak birbirlerinden bağımsız çalışmaktadır. 1873’de Camillo Golgi gümüş nitrat ve potasyum dikromat’ın bir araya gelerek sinir hücrelerinin zarlarına gümüş kromat partikülleri halinde bağlanabildiğini keşfetmişti. Bu da nöronların sarı zemin üzerinde görünebilir halegelmesini sağlıyordu. Ayrıca bkz. Gordon M. Shepherd, Foundations of the Neuron Doctrine, Oxford University Press, 2015, s. 141.

29 Simge Aykan Zergeroğlu- Erhan Nalçacı, “Santiago Ramon y Cajal ve Nöron Doktrini”, Turk J Neurol, 2015, Sayı:21, s.81-84. (Çevrimiçi) https://www.journalagent.com/tjn/pdfs/TJN_21_3_0.pdf12 Aralık 2019.

2.1.8 Davranışların Teklifsizliği Argümanı

Turing’in makalesinde yer verdiği diğer bir karşı çıkış, davranışların informelliği argümanıdır. Bu argümana göre, insanlar sürpriz yapar ve şaşırtırlar çünkü davranışları informeldir, planlı programlı değildir. Ama makineler sürpriz yapmaz, formeldir, nasıl programlanmışsa öyle davranır. Bu argüman aslında insanın özgür iradesi olduğu varsayımına dayanır. Davranışların nedensel bağlamı olmadığını, bir özden belirlenimsiz olarak ortaya çıktığını savunur. Turing ise, insan davranışlarının tüm karmaşıklığına rağmen formel altyapıları olacağını varsayar. Makinelerde de aynı karmaşıklıkta formel yapılar kurulursa, sonuçları dışarıdan informel olarak algılanabilir, yani makineler de bizi şaşırtabilir der. Turing’e göre, herşey formeldir, ancak formellik çok karmaşık olunca ortaya öngörülemeyen davranışlar çıkabilir.

2.1.9 Duyu Ötesi Algı Argümanı

Bir diğer karşı çıkış, duyu ötesi algı argümanıdır. Bu argüman insanın altıncı hissinin olduğunu ve telepati yapabildiğini, makinelerde ise böyle bir özelliğin bulunmadığını iddia eder. Turing bu argümana cevap olarak önce telepatinin; beynimizin, bizim fizikselliğini bilmediğimiz bir fonksiyonu olabileceğini ve bu fonksiyonun nedensel yapısını çözersek makinelere de telapatiyi öğretebileceğimizi öne sürer.

Turing makalesinde düşünebilen bir bilgisayar olasılığını dile getirir. Mantıksal bir biçime yerleştirilebilen her önermenin bilgisayarlar tarafından taklit edilebileceğinden yola çıkar. İnsan seviyesinde bir akılyürütmenin yapay olarak gerçekleştirilebilmesi için sağduyu akıl yürütmesinin formelleştirilmesi gereklidir.1 Bilgisayar bilimci John McCarthy de “Sağduyu Sahibi Programlar” makalesinde benzer bir olasılıktan bahseder. Ona göre sağduyu bilgisi ve karar alma süreci mantıksal bir biçime yerleştirilebilir.2

1 Vedat Kamer, “Yapay Zeka ve Monoton Olmayan Mantık”, İstanbul Üniversitesi, 2009, s.35. (Çevrimiçi)http://acikerisim.istanbul.edu.tr/bitstream/handle/123456789/27879/45445.pdf?sequence=1&isAll owed=y, 12 Aralık 2019.

2 John McCarthy, "Programs with Common Sense", Teddington Conference on the Mechanization ofThought Processes, 1958. (Çevrimiçi) http://www-formal.stanford.edu/jmc/mcc59.pdf, 12 Aralık2019.

2.2 Çin Odası Deneyi

Turing’den sonra, ortaya koyduğu bir düşünce deneyiyle literatüre önemli bir katkısı olan John Searle (1932-), 1980 yılında Çince Odası deneyini açıkladığı makalesini yayınlamıştır.3 Bu deneyde kapalı bir odanın içinde bulunan ve Çince bilmeyen bir insan posta deliğinden Çince mesajlar almaktadır. Odanın içinde kendisine rehberlik eden Çince sembollerle ne yapacağını söyleyen bir kural kitabı vardır. Bu kitapta kurallar tamamen formel olarak ifade edilmiştir. Örneğin; “bu şekli (Çince sembol) gördüğünde karşılığında şu şekli ver” gibi. Bu formel önermeler o kadar doğru şekilde çalışıyordur ki karşısında bir Çinli de olsa odanın içindeki insanın Çince bildiğinden emin olabilmektedir. Searle’e göre bu insan Çince bilmeden bunu başarmaktadır. Ona göre bir dili anlamak yada zihinsel başka durumlara sahip olmak formel sembollerle yönergeleri yerine getirmekten daha fazlasını içerir. Yani sentaks, sayıların dizimi ya da sembollerin manipülasyonu, semantik (anlamın üretilmesi) için yeterli değildir. Aslında Çin odası deneyi Çince yapılmış bir Turing testidir diyebiliriz, burada testi geçmiş olma durumunun düşünen makineler konusunda hala ikna edici olmadığına dikkat çekilir. Searle’e göre Turing testini geçen bir makine için “düşünüyor” ya da “anlıyor” diyemeyiz.

3 John Searle, Minds, Brains, and Programs, The Behavioral and Brain Sciences, 1980, 3, s.417-457.

Fakat farklı bir bakış açısıyla, Çince odası deneyinde odada kapalı olan insanın bir sinir hücresi olduğunu düşünebiliriz. Bu sinir hücresinin sadece bir “aracı” olarak görev yaptığını yani beyindeki bütünlüğün bir parçası olduğunu ve bu durumda Çinceyi tek başına -kendi bilinciyle- anlaması gerekmediğini söyleyebiliriz.

Zihin işlemlerinin sayısal hesaplamalardan ibaret olduğu kabulü bir yana beynin bir bilgisayar mı olduğu, yoksa farklı unsurları birleştirici bir makine mi olduğu ya da beynin paralel bir bağlantı sistemine mi sahip olduğu konusunda fikir birliği yoktur.4 Bu noktada zihnin niteliği problemi ortaya çıkar, buradan da zihninnasıl tanımlandığı, üretilebilir olup olmadığı sorusunun cevabı şekillenecektir. Ancak zihin denilen şeyin ne olduğu konusunda kesin bir veri mevcut değildir. Bu nedenle konuya çeşitli açılardan yaklaşan farklı tanımlamalar ortaya çıkmıştır. Zihnin nasıl tanımlandığı, onun ne olduğunu ortaya koyacaktır. Dolayısıyla herhangi bir zihin tanımı; onun üretilebilir bir şey olup olmadığını içeren bir açıklama sunacaktır. Günümüzde bilgisayar bilimleri insanın insan olma özelliğinin ve zekâsının kaynağını beyin olarak kabul eder ve beyin sadece biyolojik bir bilgisayar olarak ele alınır. Buradan yola çıkılarak dijital bilgisayarlar ile yapay bir beyin elde edilmesi araştırmaları yapılmaktadır. Örneğin bir görüşe göre nanobotlar5 kullanılarak beyin çalışmakta iken onun bütün beyin hücrelerini (nöronlarını) içeren bir haritasını görüntülemek mümkündür. Bu haritadaki verilerle ve tersten inşa (reverse engineering) yöntemi ile beynin yapısını ve beyinde düşüncenin nasıl oluştuğunu anlayabileceğimiz iddia edilir.

4 John Searle, Zihnin Yeniden Keşfi, Çev. M. Macit, İstanbul: Litera Yayıncılık, 2004, s. 244-46.

5 Nanobot: Nanorobot olarak da bilinen bu küçük robotlar, başka bir cihaza bağlanmadan mikroskobik düzeyde kendi kendine çalışabilen cihazlardır. Bu malzemelerle molekül boyutunda bir şeyler inşa edilebilir ya da moleküllerin yapısı değiştirilebilir. Ayrıca bkz. Chris P. Toumey, Nanotech and the Humanities: An Anthropologist Observes the Science of Atoms and Molecules, Cambridge Scholars Publishing, 2019, s.95.

2.3 Bilinç Tartışması

Kendimizi ve bulunduğumuz ortamı anlamak istediğimizde, çoğunlukla zihinsel ve fiziksel durumlar arasında bir fark olduğunu düşünürüz. Zihinsel durumları düşünme, hayal kurma, hissetme, arzu etme, karar verme vb. ile ilişkilendiririz. Fiziksel durumları ise bedensel, biyolojik ve maddi yapılarla ilişkilendiririz. Bu çerçevede bilinç, zekâyı da kapsayan zihinsel bir durum olarak değerlendirilir. Bilincin varlığı çoğu düşünce sisteminde kabul edilmekle birlikte yeryüzünün önemli bir bölümünü oluşturan madde ile bilincin ortaya çıkışı arasındaki bağıntı henüz tüm yönleriyle saptanamamıştır. Bu yüzden de beyin gibi fiziksel bir varlığın, nasıl bilinç denilen karmaşık duygu ve düşünce kalıplarına neden olabildiği önemli tartışmalara sebep olmaktadır.

Zihin-beden sorunu ilk olarak René Descartes’ın (1596-1650) zihin vebedenin birbirinden tamamen ayrı olduğunu iddia ettiği iki töz kuramı ile ifade edilmiştir:

“...beden ile ruh arasında, bedenin mahiyeti icabı daima bölünmesi, ruhun ise tamamen bölünmemesi yüzünden büyük bir fark görüyorum. Zira gerçekten ruhumu, yani yalnız düşünen bir şey olan kendimi gözden geçirdiğim zaman, onda hiçbir bölüm göremiyor, aksine kendimi tek ve tam bir şey olarak idrak ediyorum. Her ne kadar bütün ruh tamamıyla bedenle birleşmiş gibi görünse de bir ayak, bir kol veya vücudumun başka bir parçası bedenimden ayrıldığı zaman ruhumdan hiçbir şey ayrılmadığı muhakkaktır.”6

Descartes, zihin ya da bilinci, duyu organlarımızla algıladığımız dünyadan bağımsız bir kavram olarak düşünmektedir. Bu yüzden, zihin ve maddeyi iki ayrı töz olarak tanımlar. Descartes’a göre düşünme denildiğinde bilinçli düşünme kastedilir çünkü ona göre düşünme bilinçten bağımsız olarak gerçekleştirilemez. Düşünen varlık kendi düşüncelerine ve bilincinin içeriğine diğerlerinden farklı olarak; ayrıcalıklı ve hatasız bir şekilde erişebilir.7 Bu yüzden de insanın kendi düşüncesini anlayamaması ya da kendi düşüncesini bilmemesi mümkün değildir. Descartes “Düşünüyorum o hâlde varım.” derken de var olmanın kanıtı olarak bu hatasız erişime işaret etmiştir.

6 René Descartes, İlk Felsefe Üzerine Metafizik Düşünceler, (çev. Mehmet Karasan), MEB Yayınları, İstanbul, 1998, s. 256.

7 Descartes, a.g.e., s. 245; Ayrıca bkz. Erdinç Sayan, Bilinç, Felsefe Ansiklopedisi, c. 2, (ed. AhmetCevizci), Etik Yayınları, İstanbul, 2004, s. 574-585.

Turing’in 1950 yılında yazmış olduğu Hesaplama Makineleri ve Zekâmakalesinden bu yana makinelerin düşünebilmesi tartışmalarının sürmesinin önemli bir nedeni de hala bilincin tanımı ve kapsamıyla ilgili genel geçer bir görüş birliğinin olmamasıdır. Bilincin tanımı ve kapsamı hakkında ortak bir görüş olmasa da yapay zekâ alanında yapılan bilinç tartışmalarının anlaşılması ve geliştirilebilmesi için “yapay bilinç” ile ilgili yapılması gereken temel ayrımlardan biri zayıf ve güçlü yapay zekâ arasındaki ayrımdır. Bu yüzden yapay zekâ çalışmalarında bilinç konusu ile ilgili çeşitli görüşlere yer vermeden önce bu ayrımı netleştirmeye çalışacağız.

Bu ayrıma göre güçlü yapay zekâ kuramı; dijital bilgisayarların, anlama, akıl yürütme ve düşünme gibi bilişsel yeteneklere sahip olacak şekilde programlanabileceğini ileri sürmektedir. Buna göre uygun bir şekilde programlanmış bir bilgisayar bir zihinle özdeştir ve bilinç sahibidir denebilir. Zayıf yapay zekâ kuramı ise dijital bir bilgisayarın vermiş olduğu çıktılar ne kadar anlamlı ya da tutarlı görünse de, bu çıktıların bilgisayarın düşünme, akılyürütme ve anlama yetilerine sahip olduğu anlamına gelmediğini ve bir bilince sahip olamayacağını ileri sürmektedir.8 Güçlü yapay zekâ kuramında geçen “uygun bir şekilde programlama” işlemi bir bilgisayara, insandaki gibi bir bilince sahip olduğundan şüphe edilmeyecek şekilde anlama kapasitesi kazandırmaktır. Zayıf yapay zekâ kuramında ise, dijital bilgisayarların sadece insanın çıkarım yapma eylemini, mekanik olarak taklit ettiği ve insanın programlamadığı herhangi bir davranışta bulunamayacağı savunulmaktadır.

Alan Turing güçlü yapay zekâ kuramının öncülerinden kabul edilir fakat o, makalesinde bilinç kavramını “gizemli” olarak nitelendirmiş ve taklit oyunu için böyle bir kavramı tanımlamaya ihtiyaç olmadığını söylemiştir.9 Sonrasında da taklitoyunu ile makinelerin düşünebilmesi olasılığını, oyunu geçme başarılarına göre değerlendirmeyi önermiştir.

J. Searle’e göre ise makineler, ancak bilince sahip olduklarında insanın yerini alabilirler ve dijital bilgisayarlar ile bilinci olan bir makine üretmek mümkün değildir. Güçlü yapay zekânın oluşturulabilmesi için ön koşulun bilinç olduğunu düşünen Searle, bilinç üzerinde çalışmadan beyin ile ilgili çalışmanın, sindirimi açıklamadan mideyi tanımlamaya benzediğini söyleyerek bilincin beyni çözümlemedeki önemini vurgulamıştır.10 Bilincin bilimsel bir tanımının henüz yapılamayacağını kabul ettiği halde bilinç konusunda konuşmak için bir tanım bildirmesi gerektiğini de belirten

8 Kamuran Gödelek, Zihin Felsefesi, Eskişehir: Anadolu Üniversitesi Yayınları, 2011, s.119.

9 Alan M. Turing, “Computing Machinery and Intelligence”, s. 444.

10 John Searle, Zihnin Yeniden Keşfi, s.115.

Searle’ün 2013 yılında katıldığı bir konferansta yapmış olduğu bilinç tanımı ise şu şekildedir:

“...İnsanlar her zaman bilinci tanımlamanın ne kadar zor olduğunu söylerler. Bence eğer bilimsel bir tanımlama için uğraşmıyorsanız, bu tanımı yapmakdaha kolay. Biz bilimsel bir tanımlama için hazır değiliz, ama işte aklıselim birtanım: Bilinç tüm duygu durumlarını, duyarlılığı ya da farkındalığı içerir. Rüyasız bir uykudan uyandığınız an başlar ve uykuya dalana kadar ya da ölene kadar ya da bir şekilde bilinçsiz hale gelene kadar devam eder. Rüyalar da bu tanımda, bilincin bir şeklidir...”11

Searle konuşmanın devamında, bu tanımda geçen; rüyasız bir uykudan uyandığımız anda başlayan ve uyku, koma, ölüm vs. gibi durumlarda yok olan bilinçli olma halinin, varlığı ve yokluğunu da basit bir örnekle açıklar. Ona göre bütün bilinç durumlarımız, beyindeki alt seviye nörobiyolojik süreçler sayesinde oluşur ve bu süreçler ancak suyun akışkanlığını kaybetmesi kadar gizemli ve doğaldır. Bir kavanozun içinde bulunan suyun yeterince soğutulduğunda akışkanlığını yitirmesi, yani moleküler yapısının sıvı halden katı hale geçmesi gibi bilinçli ve bilinçsiz olma durumları arasında da beyinde böyle bir fiziksel geçiş söz konusudur.12

Bilinci fiziksel dünyada yer alan doğal bir fenomen olarak tanımlayan Searle için bilinç, ikicilikteki gibi ayrı bir töz olmayıp beynin sahip olduğu biyolojik bir süreçtir. Bu açıdan Searle, zihni ayrı bir töz olarak kabul eden ikiciliği bilinç tartışmaları için faydalı bulmaz, fizikselciliği ise indirgenemez olan öznel, farkında olma durumlarını kabul etmemesi açısından eksik bulur. Dolayısıyla Searle’e göre, ikicilik bilinç problemini çözülemez yaparken, fizikselcilik bu problemin varlığını reddetmektedir.13 Böylece Searle, hem ikiciliği hem de fizikselciliği farklı açılardan eleştirerek bu iki görüşe alternatif “biyolojik doğalcılık” yaklaşımını ileri sürer. Bu yaklaşımın diğer görüşlerden en belirgin farkı ise bilinç ve beyin arasındaki indirgemenin nedensel bir indirgeme olmasıdır.14 Böylece biyolojik doğalcılık görüşü kapsamında, bilinç biyolojik bir süreç olarak görüldüğünden, yapay bir beynin üretilmesi ve üretilen bu beyinde bilincin oluşmasının önünde ilkesel olarak bir engel yoktur.15 Buna rağmen biyolojik doğalcılığın kastettiği şey, bilincin doğallaştırılması, yani apaçık herkes tarafından eşit anlaşılabilecek şekilde ortaya konulabilmesi değildir. Searle’e göre zihnin doğallaştırılmasından bahsedilirken onun öznel yanı reddedilmektedir, fakat biyolojik doğalcılıkta, bilinç öznel ve niteliksel özellikleriyle birlikte doğal bir fenomen olarak kabul edilir.16 Biyolojik doğalcılıkta bilincin en belirgin özelliği herkesçe anlaşılabilecek şekilde açıklanamıyor olmasıdır.

11 John Searle, Philosopher, Our Shared Condition Consciousness (Paylaştığımız Durumumuz- Bilinç),TEDxCERN, 2013, (Çevrimiçi)https://www.ted.com/talks/john_searle_our_shared_condition_consciousness/transcript?language= tr&hc_location=ufi (04:04) 12 Aralık 2019.

12 Ted Talk devamı (04:55) Ayrıca bkz. J. Searle, Toplumsal Gerçekliğin İnşası, Çev. M. Macit & F. Özpilavcı, İstanbul: Litera Yayıncılık, 2005, s.37.

13 J. Searle, Zihnin Yeniden Keşfi, s.47.

14 Searle, nedensel indirgemeyi şu şekilde açıklar: “Eğer bir A fenomeni nedensel olarak B fenomenine indirgenebiliyorsa, A’nın tüm davranışları B’nin davranışları tarafından açıklanabilir ve A’nın B’den fazla hiçbir nedensel gücü yoktur. Ontolojik indirgeme ise şu anlama gelmektedir: Sadeceve sadece A hiçbir şeyse ve yalnızca B ise, A fenomeni, B fenomenine ontolojik olarak indirgenebilirdir. Fizikselcilerin yaptığı ontolojik indirgemedir bu noktada zihin, bedene ontolojikolarak indirgenir ve zihnin varlığı yok sayılır. Böyle bir ontolojik indirgeme kabul edilemezdir” (SearleZihnin Yeniden Keşfi, s.119.)

15 J. Searle, Zihin, Dil, Toplum, Çev. A. Tural, İstanbul: Litera Yayıncılık, 2006, s.64.

16 J. Searle, Bilincin Gizemi, Çev. İ. K. İçyüz, İstanbul: Küre Yayınları, 2018, s.18.

Searle, güçlü yapay zekânın sınırlarını gösteren düşüncelerini ise Çin odası argümanı ile açıklamıştır. Bir önceki bölümde bahsettiğimiz gibi Searle bu deney ile Çince bilmeyen birinin, bir Çinliyle diyaloğa girdiğinde yeterli materyale (kendi anadilinde bir kurallar kitabı ve Çince tabelalar) sahip ise sorulan sorulara cevapolarak anlamlı Çince çıktılar üretebileceğini, fakat bu anlamlı çıktıların, o kişinin Çinceyi bildiği anlamına gelmediğini vurgulamıştır.

Searle’ün bir bilgisayar programının çalışma şeklini örnek alarak ortaya koyduğu bu düşünce deneyinde odada bulunan kişi Çince bir soruya Çince cevap verebilmesine rağmen verdiği cevabın içerik/anlam olarak ne ifade ettiğini bilmemektedir. Bu açıdan Searle’e göre, bilgisayar programlarında yazılım açısından bir sözdizimi (sentaks) vardır; fakat anlam (semantik) bulunmamaktadır. Bu yüzden de bilgisayarlar algılama, anlama ve düşünme gibi özelliklere sahip değildir yani Searle’e göre bilgisayarlar Çinceyi ve bunun gibi diğer bilişsel formların hiçbirini bu deneyde olduğu gibi gerçek anlamda anlayamayacaklardır.17

Görüldüğü gibi Çin Odası argümanını oluştururken Searle’ün kullandığı üç aksiyom (temel varsayım/ön kabul) vardır. Bunlardan ilki bilgisayar programlarının sözdizimsel oluşudur. Diğeri; insan beyninin, bilgisayar programına benzemeyen birzihinsel içeriğe (semantik/anlam) sahip olmasıdır yani sözdizimsel olmamasıdır. Üçüncü aksiyom ise bu ilk iki aksiyomu birleştirir niteliktedir: “Sözdizim, ne tek başına anlam için yeterlidir ne de anlamın kurucusudur.”18 Searle’e göre buradan şu sonuca ulaşılır: Programlar ne zihin için yeterlidir ne de zihnin kurucusudur. Çin odası deneyindeki bu üç aksiyomun hatalı olup olmadığı hala tartışılmaktadır. Bu aksiyomlardan herhangi birinin hatalı olduğunu ispatlayabilmek için güçlü yapay zekânın oluşturulması gerekiyor gibi görünmektedir. Şimdilik böyle bir ispat yöntemi mümkün olmasa da tam tersi olan yani güçlü yapay zekânın dijital makineler ile oluşturulamayacağı iddiasını da kabul etmek yanlış olacaktır. Searle’ün de biyolojik doğalcılık görüşünü açıklarken ifade ettiği gibi yapay bir beynin üretilmesi ve üretilen bu beyinde bilincin oluşmasının önünde ilkesel olarak bir engel yoktur. Bilincin beyinde var olduğu düşünülen bir fenomen olduğunu göz önünde bulundurduğumuzda beynin tüm katmanlarıyla yapısal olarak taklit edilmesi ve nöronlar arasındaki bağlantıların elektrik akımları ile birlikte modellenebilmesi mümkün olduğunda tüm diğer işlevlerle birlikte bilinç oluşumunda bilimsel olarak açıklanabilmesi mümkün görünmektedir. Ancak bilinç bu şekilde nesnel hale getirilse bile aslında insan beyni modellenerek oluşturulduğu için yine de öznel bir içeriği olacaktır.

Patricia S. Churchland (1943-) ve Paul M. Churchland (1942-) “Bir Makine Düşünebilir mi?”19 adlı makalelerinde Searle’ün “Söz dizim anlam için yeterli değildir” varsayımının hatalı olabileceğini göstermek için yeni bir argüman ortaya atarlar. Churchland çifti argümanlarını sunmadan önce Searle’ün şüpheciliğinin bilim tarihinde daha önce de yaşandığından bahsederler ve benzer durumlarla ilgili örnekler verirler. Bu örneklerde bazı bilim insanlarının bazı durumları olağanüstü olarak değerlendirdiği ve kabul etmekte zorlandığı yine de bilimsel deneylerle gerçeklerin ispatlandığı anlatılır. Benzer olarak Searle’ün çok sınırlı bir yapıda olan düşünce deneyinden, formel sistemlerin anlama gerçekleştiremeyeceği sonucunun da çıkarılmaması gerektiği vurgulanır. Churchland çiftine göre semantik içeriğe sahip güçlü yapay zekâ için beyne benzer yapıda paralel ve ilişkisel mimariye sahip sistemler kullanılmalıdır. Bahsedilen bu sistemler günümüzde mimari gelişimi devam eden insan beynindeki sinir ağlarını örnek alan yapay sinir ağlarıdır.

17 J. Searle, “Is the Brains Mind a Computer Program?”, Scientific American, Ocak 1990, s.26-31.

18 J. Searle, a.e., s. 27.

19 Patricia S. & Paul M. Churchland, “Could a Machine Think?” , Scientific American, Ocak 1990, s.32- 37. (Çevrimiçi) http://sils.shoin.ac.jp/~gunji/AI/CR/sciam90couldamachinethink.pdf, 12 Aralık 2019.

Searle’ün şüpheciliğini ve öznelliğin sözdizimsel bir sistem ile sağlanamayacağı iddiasını destekleyen isimlerden biri de Thomas Nagel (1937-) dir. Nagel “Yarasa Olmak Nasıl Bir Şeydir?” isimli makalesiyle öznelliğin bir makineye aktarılamayacağı görüşünü savunmaktadır. Nagel’e göre, yarasanın nörofizyolojisi herkese açıktır, hatta bu bağlamda bir Marslı, insan beyni hakkında, insandan fazla bilgiye sahip olabilir ya da gökkuşağındaki fiziksel süreci de anlayabilir. Fakat birMarslı, gök kuşağının, insan beyninde nasıl bir anlam uyandırdığını bilemez. Dolayısıyla, içinde bulunduğumuz durumdan çıkarım yapmak bir yarasa olmanın nasıl bir şey olduğunu düşünmeyi içeriyorsa, bir yarasa olmadığımız sürece bu çıkarım tam ve eksiksiz olmayacaktır. Bu yüzden yarasa olmanın nasıl bir şey olduğunu düşünürken bu “olma durumu”na dair şematik bir fikirden fazlasını oluşturmamız mümkün değildir. Dolayısıyla deneyimi yaşayan kişi, diğer kişiden ne kadar farklıysa, o kişi olma deneyimini anlamak da o oranda düşük olacaktır.20

20 Thomas Nagel, Zihin ve Evren (Çev. Ö. Ç. Aksoy), İstanbul: Jaguar Kitap, s.151.

Nagel, deneyimin öznel karakteri ve iç tecrübeyle fiziksel durumlar arasındaki farkı ortaya koymak için ilginç bir örnek verir:

Bir an için siz bir çikolatalı gofret yerken beyninizi yalayarak çikolatayı tatma tecrübenizi gözlemlemeye çalışacak kadar çılgın bir bilim adamı olduğunu varsayalım. Büyük olasılıkla, beyniniz ona hiç de çikolataya benzer bir tat vermeyecektir. Öyle olsaydı bile, bu bilim adamı, yine de, zihninizin içine bakıp çikolatayı tatma tecrübenizi gözlemlemede başarısız olurdu. O, kendi çikolata tadına siz de kendi çikolata tadınıza sahipsinizdir.21

Buradan şöyle bir sonuç çıkarılabilir: Bilinç nesnel bir gözlem konusu olamaz. Fakat bu sonuçla bilim metodolojisi çatışmaktadır çünkü bilim nesneldir; tüm olgular üçüncü kişilerin gözlemine açıktır. Bilinç kavramı bu metodoloji ile ele alınırsa ‘bilinç’ açıklanamaz. Buna göre eğer bir bilgisayarın bir bilince sahip olması mümkün olursa bilince sahip bir bilgisayar olmanın nasıl bir şey olduğunu biz bilince sahip bir insan olarak tam ve eksiksiz bir şekilde algılayamayabiliriz.

Zihnin ve zihinsel fenomenlerin açıklanmasında ikiciliğin ve fizikselciliğin yetersiz olduğunu göstermek için ortaya atılan bir diğer düşünce deneyi de Ned JoelBlock’un (1942-) Çin Ulusu deneyidir.22 Bu deneyde Çin nüfusu, canlı beynindeki nöron bütünlüğü olarak düşünülür aralarında kurulan bağlar nöronlar arasında kurulan bağlantılara benzetilir. Deneyde öncelikle her bir Çinliye aranacaklar listesinden telefon numaraları dağıtılır ve kararlaştırılmış bir zamanda belirli kişiler kendi listelerindekileri arayarak deneyi başlatırlar. Listedeki bir Çinlinin telefonu çaldığında o da kendi listesindeki kişileri arar ve deney bu şekilde devam eder. Bu deneyde telefon aramaları, nöronların birbirleri arasındaki iletim ile aynı işlevsel rolü oynamaktadır. Ve Searle ile benzer olarak bu deneyden de şöyle bir sonuç çıkarılır: eğer fizikselcilik doğru kabul edilirse Çin nüfusunun kolektif olarak bir zihinsel hal içinde olduğunu söylememiz gerekir ve eğer söyleyemezsek fizikselcilik yanlıştır.

21 Thomas Nagel, Her Şey Ne Anlama Geliyor? (Çev. H. Gündoğdu), İstanbul: Paradigma Yayınları,2004: s.21.

22 Ned Block, “Troubles with functionalism”, Minnesota Studies in the Philosophy of Science 9:261- 325, 1978.

Searle deneyini açıklarken güçlü yapay zekâyı hedef aldığı için bilinirliği artmış olsa da Block’un deneyi duruma farklı bir açıdan bakmaya daha elverişlidir. Çünkü eleştirel bir yaklaşımla da olsa, Çin nüfusunun kolektif olarak bir zihinsel haliçinde olduğunu düşünme imkânı verir. Kanımızca Çin nüfusu kolektif olarak bir zihinsel hal içindedir diyemesek de, Çin nüfusunun bir zihinsel haller bütünü sonucunda bir eylemde bulunduğu (arama listelerindeki tüm insanların aranması) söylenebilir. Her bir Çinli temelde kendine ait bir hedefi tamamlamak için harekete geçer ve bu hareket dalga halinde tüm ülkeye yayılır. İşlem tamamlandığında bazı Çinliler arasında bağlantı kurulmuş olur. Ve sonuç olarak Çin ülke olarak ortak bireylemde bulunmuş olur, deney tamamlanır. Arama listeleri tek bir Çinli’nin tüm geri kalan Çinlileri arayabileceği şekilde ayarlanıp zamanlama planlamasıyla hatların meşgullüğü engellenerek deney büyütülebilir. Çünkü bir telefonda, herhangi bir başka telefonla bağlantı kurulması imkânı mevcuttur. Bu geometrideki bir noktadan sonsuz doğru geçer aksiyomu ile de benzerlik göstermektedir. Geometri ile bağlantı kurmamızın sebebi telefonları olan Çinlilerin beyindeki nöronlara benzetilmesi ve beyindeki nöronların bağlantılarının güçlü ve zayıf oluşuna göre algılarımızın hafızamızda yer edinmesi böylece öğrenmenin gerçekleşmesidir. Nöron sayısı ve bağlantıları sürekli olarak değiştiği için beyindeki nöronlar arasında sonsuz farklı kombinasyonla bağlantı kurulabilir. Düşüncelerimizin bir sınırının olmayışı ve beyin hakkında yapılan bilimsel çalışmaların sonucunda neden mide hakkında edindiklerimiz kadar net veriler elde edemediğimizin bir göstergesi de bu bağlantı kombinasyonlarının sayısının sonsuz olması olabilir. Nagel ve Searle’ün öznellik vurgusu da, beyinde yer alan bu bağlantıların bireye özgülüğüne yani genler ve deneyimler gibi etkenlerin beyinde benzersiz kombinasyonlar oluşmasına sebep olmasıyla açıklanabilir.

Günümüzde tıp bilimindeki gelişmeler ve yapay zekâ alanındaki teknolojik ilerlemeler sayesinde insan beyni ve makineleri buluşturan deneyler yapılabilmektedir. Aynı zamanda yapay zekâyı günlük yaşama dâhil etmek için (ör. Otonom araçlar, güvenlik kamera sistemleri vb.) görüntü tanıma yöntemleri ön plana çıkmaktadır. Bilinç kavramının bugün kullandığımız halini almasında önemli katkıları olan düşünürlerden biri olan John Locke’un (1632-1704) insanda görüntü tanıma ile ilgili söyledikleri de bu açıdan dikkate değerdir.

Locke’un görüntü tanıma ile ilgili düşüncelerini daha iyi anlayabilmek için öncelikle bilinç ve algılama hakkındaki görüşlerine yer vereceğiz. Locke, “İnsanın Anlama Yetisi Üzerine Bir Deneme” adlı kitabında bilinç kavramını, zihinsel duyumlarla ve öznellikle ilk kez ilişkilendiren düşünür olarak bilinir. Locke, ‘insanın kendi zihninden geçenleri algılaması’23 olarak tanımladığı bilinç kavramı için algılamanın önemini şu şekilde ifade etmiştir:

“Algılama, idelerimiz alanında kullanılan ilk zihinsel yeti24 olduğundan iç duyumdan edindiğimiz ilk ve en yalın idedir ve bazılarınca genel anlamıyla “düşünme” diye de adlandırılır. İngilizcede “thinking” (düşünme) zihnin kendi ideleri üzerinde etkin olarak yer aldığı bir işlem türüdür; bu sırada herhangi bir şeyi dikkat harcayarak irdeler. 25Algılama zihnin çoğunlukla edilgin olduğu bir alandır ki algıladığı şeyi algılamaktan kaçınamaz.”26

Locke algılamanın öznelliğini ise sadece zihninde olup bitenleri duyan birinin algılamanın ayırtına varabileceğini fakat bu duyumu almayan birine ne kadaranlatılırsa anlatılsın herhangi bir kavrama kavuşamayacağını iddia ederek ifade etmiştir. Yani insanın kendi zihni ile kurduğu ayrıcalıklı ve hatasız erişime, öznelliğe dikkat çeken tüm diğer düşünürler gibi Locke da dikkat çekmiş ve açıklamaya çalışmıştır. Ona göre görme yetimiz de görülen nesnelerin ortak olması sebebiyle nesnel gibi algılanmakta fakat belirli noktalarda öznellik ve illüzyonlar dikkat çekmektedir. Locke önyargı ile görme yetisi üzerine şunları söylemiştir:

“Önyargı görme yetisi ile edinilen idelerimizde olağandır. Tüm duyularımızın en karmaşığı olan görme duyusu zihinlerimize yalnızca bu duyuya özgü olan renk ve ışık ideleri ile ışık ve renklerdeki çeşitlilikler, uzay, şekil ve harekete ilişkin çok farklı idelerilettiğinden alışkanlık sonucu bir görünüşten diğer bir görünüş algılayabiliriz. Çoğu kez sıklıkla duyumsadığımız şeylerde, yerleşik bir alışkanlıkla, önyargı o kadar çabuk ve sürekli devreye girer ki duyumumuzun algısını yargımızla oluşturulmuş bir ide olarak ele alırız. Öyle ki, duyumla algıladığımız yalnızca diğerini ortaya çıkarmaya yarar ve pek dikkate de alınmaz; dikkatle anlayarak okuyan ya da dinleyen bir insan sesler ya da harflere değil de onlarla kendinde ortaya çıkan idelere dikkat eder çoğunlukla.”

23 John Locke, İnsan Anlığı Üzerine Bir Deneme, (çev. Vehbi Hacıkadiroğlu), Kabalcı Yayınevi, İstanbul, 1992, s. 112.

24 Locke bilişsel yaşamı, özbilinçli etmenlerde var olan yetiler varsayımı ile açıklıyor. Bu ve sonraki iki bölüm yetileri ve iç duyumumuzla edindiğimiz ideleri ele alırken yetileri yalın iç duyum idelerine bir tür ek olarak değerlendiriyor.

25 Burada çoğu çağdaşı gibi Locke da düşünce ve düşünmeyi şimdi yaygın olandan daha geniş bir anlamda kullanıyor.

26 John Locke, a.g.e. , s.113.

Şekil 6. Görsel algılama test örnekleri27

Yakın dönemde yapılan çalışmalarda obje tanımak için eğitilmiş derin yapay sinir ağlarının da insanlar gibi görsel illüzyonlara sahip oldukları belirlenmiştir.28 Obje tanımada insana yakın bazı durumlarda insandan üstün performans gösteren derin yapay sinir ağlarının neden görsel illüzyonlar algılıyor oldukları henüz yanıtlanmamıştır. Tahminlerden biri ise obje tanımak için bu görsel illüzyonların gerekli olabileceğidir. Yani insanı örnek alarak geliştirilen yapay sinir ağlarının insana benzer yanılgılara düşüyor olması ortak gerçekliğin sürdürülebilmesi için şartolabilir. Fakat J. Locke’un dikkat çektiği:

“...Çok erken yaşlarda edindiğimiz alışkanlıklar bizde önünde sonunda sıklıkla gözümüzden kaçacak eylemler yaratır... Zihnimizin kendi dış duyum idesini kendi yargı idesine dönüştürmesi ve birini, hiç dikkate almadan, diğerini ortaya çıkarmak için kullanmasında o kadar şaşılacak bir şey yoktur.”29

27 Görsel Kaynak : “Exploring Perceptual Illusions in Deep Neural Networks”, Journal of Vision, 2019.

28 Emily J. Ward, Exploring Perceptual Illusions in Deep Neural Networks, Department of Psychology, University of Wisconsin – Madison https://www.biorxiv.org/content/10.1101/687905v1.full 12 Aralık 2019.

29 John Locke, İnsanın Anlama Yetisi Üzerine Bir Deneme, Çev. Meral Delikara Topçu, Öteki Yayın Evi,2007, s.198. Ayrıca bkz. Patricia M. Churchland & Paul S. Churchland, “Could a Machine Think”, On the Contrary: Critical Essays, 1987-1997, Cambridge: MIT, s.51-60.

Locke’un işaret ettiği insan önyargılarının kullanımı ile ilgili durumların makineler için “gözümüzden kaçacak eylemler” yaratmadan nasıl engelleneceği üzerinde çalışılmalıdır. Çünkü güçlü yapay zekânın öngörülemez bir eylemde bulunmasının tahmin edilemeyecek büyüklükte zararlı etkileri olabilir.

Locke’un bahsettiği insandaki dış duyum idelerinin makine için veri setindenedinilen önyargı olduğunu düşünürsek bunun makinenin kendi yargı idesinden farklı olması ile birini hiç dikkate almadan diğerinin kullanılmasının engellenmesi için bu iki karar merkezinin bağımsız olması gerektiği düşüncesi ile makineler için etik kuralların oluşturulması çalışmaları ortaya çıkmıştır. Fakat bu etik kurallara göre programlanan bir makinenin temel aldığı yazılımın değiştirilemez kuralları güçlü yapay zeka söz konusu olduğunda değiştirilebilir olacaktır çünkü güçlü yapay zeka yani bilinç sahibi bir makinenin kendi donanımına ve yazılımına en yüksek seviyede hâkim olması beklenmektedir. Bu yüzden de güçlü yapay zekânın kendi yazılımı üzerinde değiştirilemez olarak programlanmış bir özelliği değiştirilebilir olarak tekrarprogramlaması mümkündür.

2014 yılında yayınlanan “Consciousness in the universe: A review of the ‘Orch OR’ theory”30 isimli makalelerinde Stuart Hameroff (1947- ) ve Roger Penrose (1931- ) Örgütlü Olarak Düzenlenmiş Nesnel İndirgeme (Orch-OR) teorisini ortaya attı. Buna göre nöronların içinde mikro tüpçük denilen protein sicimleri bulunmakta ve buyapıların içinde kuantum etkileşimleri oluşmaktadır. Örgütlü olarak düzenlenmiş nesnel indirgeme teorisine göre mikro tüpçükler içinde oluşan kuantum etkileşimleri sonucunda süper pozisyon ve dolanıklık hali çökerek çok sayıda olasılık tek bir değere indirgeniyor ve böylece insanların verdiği tekil kararlar ortaya çıkıyor. Buna göre Hameroff ve Penrose bilincin nöronları birbirine bağlayan sinaps, akson ve dendritlerde bulunan mikro tüpçüklerde ortaya çıktığını ve bunlar arasındaki karşılıklı etkileşimle şekillendiğini savunuyor.

30 Stuart Hameroff, Roger Penrose, "Consciousness in the universeA review of the ‘Orch OR’ theory", Physics of Life Rewiews, 2014, p.39-78. (Çeurimiçi) https://www.sciencedirect.com/science/article/pii/S1571064513001188?via%3Dihub, 12 Aralık 2019.

Nöroloji alanında yapılan son araştırmalar, beyindeki sinir ağının bir parçası olan dendritlerin hem kablo görevi görüp veri aktarımı yaptığını, hem de bilgisayarişlemcisi gibi çalışarak veri işliyor olduğunu gösterdi.31 Bu işlemlerin gerçekleştiği dendritlerin içindeki mikro tüpçükler Belirsizlik İlkesi’nin32 geçerli olacağı kadar küçük yapılardır. Bu da beyindeki bilgi işlem süreçlerinin kuantum fiziğinin etkili olduğu ölçeklerde gerçekleşebildiğini göstermektedir.

Makro boyutlarda ve yavaş cisimler üzerinde çalışan klasik fizikte bir parçacığın hızı ve konumu bilindiğinde o parçacığın geçmiş ve gelecekte nasıl hareket ettiği ya da edeceği hesaplanabilir. Atomik boyutlarda (kuantum düzeyi) ve ışık hızına yakın hızlardaki parçacıklar üzerinde çalışan modern fizikte ise belirlilik (determinizm) yoktur olaylar belli bir olasılıkla gerçekleşir.33 Yine de insan beyninde ortaya çıkan bu çok küçük ölçeklerde gözlemlenebilen kuantum etkileri, insan beyninin bir kuantum bilgisayar olduğunu söylemek için yeterli değildir. Roger Penrose insan beyninin standart kuantum bilgisayarlarda olduğu gibi elektromanyetik dolanıklıkla değil de yerçekimi etkisiyle çöken özel bir dolanıklık türüyle çalıştığını söyler.34 Henüz yerçekimi, kuantum fiziğiyle birleştirilerek hem makro hem mikro evrenlerde geçerli olabilecek bir ortak teori (string theory) ortaya çıkmadığı için bu iddianın şimdilik test edilmesi mümkün değildir. Fakat kuantum fiziğindeki ilerlemelerle ortak bir teori ortaya konulur ve bilincin fiziksel bir olgu olduğu gösterilebilirse ancak o zaman bilinç olgusunun da objektif bir zemine oturtulması mümkün olabilir.

31 Smith SL, Smith IT, Branco T, Häusser M., Dendritic spikes enhance stimulus selectivity in corticalneurons in vivo, Nature, 2013, p. 115-120. (Çevrimiçi)https://www.ncbi.nlm.nih.gov/pubmed/24162850, 12 Aralık 2019.

32 Belirsizlik ilkesi Werner Heisenberg tarafından 1927’de ortaya atılmıştır buna göre bir parçacığınhem konumu, hem momentumu ile ilgili eş zamanlı olarak kesin bilgiye sahip olmak mümkün değildir. Ayrıca bkz. David J Griffiths, Introduction to Quantum Mechanics, Pearson Prentice Hall, 2005.

33 Arthur Beiser, Çev. Gülsen Önengüt, Modern Fiziğin Kavramları, Akademi Yayınları, 2008, s. 125.

34 Roger Penrose, The Emperor's New Mind: Concerning Computers, Minds, and the Laws of Physics, Oxford University Press, 2016, s. 519.

2.4 Uzman Sistemler

Uzman Sistemler, yapay zekâ ile ilgilenen araştırmacılar sayesinde 1950’den beri gelişimi devam eden bir çalışma alanıdır. Bu süreçte araştırmacılar insandan daişlevli bir uzmanı, makineler sayesinde üretebileceklerine inanmışlardır. Fakat daha sonra, böyle bir yapılanma için henüz makinelerin donanımsal olarak yeterli olmadığı anlaşılmıştır. Bu inanç kapsamında oluşturulmaya çalışılan genel amaçlıprogramlardan yani insanın tüm özelliklerini gösterebilecek yetenekte olan programlardan, özel amaçlı programlara yani insanın belirli bir konudaki yeteneklerini taklit edebilen programlara geçiş 1960’ların ortalarından itibarengerçekleşmeye başlanmıştır.

1970’li yıllarda ise belirli bir alana yönelik uzman sistemler geliştirilmiştir. Busistemlerde bilginin merkezinin ne kadar önemli olduğunun farkına varan yapayzekâ araştırmacıları, uzman sistemlerin elde etmiş olduğu başarının onu oluşturmak için kullanılan uzmanının sınırlı bilgisinden kaynaklandığı sonucuna varmıştır. Uzman sistemler 1980’li yıllardan itibaren, akademiden ticarete geçmiş ve bu dönemde kullanıldıkları alanlar için özelleştirilmiş önemli programlar uygulamayakonulmuştur.35

35 Frank Puppe, Systematic Introduction to Expert Systems: Knowledge Representations and Problem-Solving Methods, Springer Science & Business Media, 2012, s.7-14

Uzman Sistemlerin ilk kullanım alanları arasında sağlığa ilişkin uygulamaların yer aldığını görürüz. Bu alanda görülen başarı ile güvenlik, askeriye, bankacılık gibi diğer alanlarda da kullanımı için çalışmalar yapılmıştır. Bu uygulamaların çalışma mantığı; bilgilerin veri tabanlarına depolanması ve daha sonrasında benzerproblemlerle karşılaşıldığında bu veri tabanlarının üzerinde yapılan çıkarımlarla sonuçlara ulaşılması şeklindedir. Bu özellikleriyle uzman sistemler uzmanlık gerektiren sorunları çözmek için uzmandan alınan bilgilerin depolandığı bilgisayarlardaki bilgiyi kullanan sistemlerdir.

Şekil 7. Uzman Sistemin Çalışma Algoritması

İlk uzman sistemlerden biri olan MYCIN, 1970 yılında Stanford Üniversitesi’nde Edward Feingbaum ve ekibi tarafınca oluşturulmuştur. Bakteriyolojik ve menenjitik gibi hastalıkların teşhisi ve uygun yöntemleri önererek tedavisinin sağlanması için çalışan bir sistemdir.

Sisteme girilen veriler; laboratuar sonuçları, hastanın geçirdiği hastalıklarınbilgileri, sahip olunan semptomlardır. Girilen bu bilgiler değerlendirilir ve çıktısı; reçete yazımı, teşhis koyma, tedavi süreçlerinin belirlenmesi olarak alınır.

Böylece MYCIN’in teşhisi ve uygun bulduğu tedavi şekli doktora bildirilir. MYCIN sorgulandığında ise verdiği kararlar hakkında açıklamalar yapabilmektedir.

MYCIN'in uzman hekimle karşılaştırıldığında bakteriemi ve menenjit tedavisinde daha başarılı olduğu gözlenmiştir, buna rağmen MYCIN hiçbir zaman kullanıma açılmamıştır. Buna neden olarak etik sorunlar, -örneğin hata yapılırsa bundan kimin sorumlu olacağı gibi nedenler- gösterilmiştir.36

36 Thomas D. McFarland-Reese Parkers, Expert Systems in Education and Training, Educational Technology, 1990, s.26-33.

Ayrıca Bkz. (Çevrimiçi) http://www.aaai.org/Papers/Buchanan/Buchanan03.pdf ,http://www.aaaipress.org/Classic/Buchanan/buchanan.html 12 Aralık 2019.

ÜÇÜNCÜ BÖLÜM

MAKİNE ÖĞRENMESİ

Turing, Hesaplama Makineleri ve Zekâ isimli makalesinin son bölümü olan Öğrenme Makinesi’nde (Learning Machine) taklit oyununu başarıyla oynayabilecek, öğrenen bir makinenin gereklilikleri hakkındaki görüşlerini ifade eder. Turing yetişkin bir insanı taklit etmeye çalışırken, yetişkin zihninin bugünkü durumunda olmasına yol açan süreçleri göz önünde bulundurmanın önemli olduğunu belirtir vebu süreçleri şu şekilde sınıflandırır:

1. Zihnin ilk hali, buna doğum anındaki hali denebilir,

2. Doğumdan sonraki süreçte almış olduğu eğitim,

3. Almış olduğu eğitim dışında kazandığı deneyimler.1

Turing, çocuk zihni için tüm bu süreçler göz önüne alındığında, çocuğun zihnini simule eden bir programın yetişkin zihnini simule eden bir programa göre dahakolay oluşturulabileceğini söyler. Bu durumda iki sorun ortaya çıkar: çocuk zihninin simule edilmesi ve çocuk zihninin eğitim süreci. Turing’e göre ödül ve ceza yöntemini içeren bir öğrenme süreci, zihinde oluşması istenen kalıpları seçecek özellikte olmalıdır. Turing, tüm bu süreci şu bakımlardan evrim sürecine benzetir:

Çocuk makinenin yapısı = Kalıtsal malzeme

Çocuk makinedeki değişiklikler = Mutasyon,

Doğal seçilim = Deneycinin yargısı2

1 Alan M. Turing, Computing Machinery and Intelligence, s.452.

2 Alan M. Turing, a.y.

Ayrıca bu sürecin bilgisayarlar için insan evriminden daha hızlı gerçekleşebileceğini de ekler çünkü O’na göre en uygun olanın hayatta kalması, var olan avantajları ölçmek için yavaş bir yöntemdir.3 Yani Turing’e göre insan beyni mekanik bir şekilde işlemektedir ve doğal seçilim bu mekanik yapının sahip olduğu avantajları ölçmek için çok yavaş bir yöntemdir. Fakat bu yöntemi makineler üzerinde simule edebilir dolayısıyla hızlı bir yapay seçilim oluşturabiliriz. Bunun sağlanması için de öncelikle beyinde gerçekleşen en temel fonksiyon olan ‘öğrenme’yi, makinelere öğretmemiz gerekir. Bu noktada öğrenmeyi, kısaca deneyimlerden çıkarım yapmak olarak tanımlayabiliriz. İnsanlar yeni bir durumla karşılaştığında bunu sıfırdan değerlendirmek yerine geçmiş deneyimlerinden edinilen bilgiler (alınan eğitimden ya da günlük hayattaki deneyimlerden elde edilen bilgiler) ışığında değerlendirirler ve buna göre bir çıkarım yaparlar. İlk defa karşılaşılan bir durum geçmiştekilere benzetilerek yorumlanmaya ve buna göre uygun eylem (tepki) bulunmaya çalışılır. Makinelerin öğrenmesi için de insana özgü olan bu durum örnek alınmıştır. Makine öğrenmesi araştırmalarının amaçları arasında; geçmişteki verileri kullanarak yeni bilgiler ortaya koymak ve bu bilgileri makinelerin davranışlarına yansıtmak ya da gelecek için doğru tahminlerde bulunmak vardır. Buna göre makine öğrenmesi, öğrenebilen ve kendisine aktarılan veriler üzerinden tahminde bulunan algoritmaları oluşturmaya yönelik çalışmalarıkapsar.4 Buna göre makine öğrenimi, bilgisayara detaylı ve doğru komutlar verdiğimiz geleneksel programlamadan farklıdır; temel olarak bir sistem oluşturup bu sistemin tutarlılığını veri ile desteklemek ile ilgilidir.

Makine öğrenmesi algoritmaları bilgisayarların, örnek veri kümeleri üzerinde eğitilmelerini ve belli aralıktaki değerleri belirlemek için istatistiksel analiz yöntemlerini kullanmalarını sağlar.5 Bu yöntemler sayesinde belli aralıktaki değerlerden oluşan bir kalıp (model) oluşturulur. Bu kalıplara karşılık gelen etiketlersayesinde önce öğrenme, daha sonra (benzer durumla karşılaştığında) deneyimlerden yararlanarak çıkarım yapma ve buna bağlı olarak karar alma sağlanır. Geleneksel programlama ve makine öğrenmesi kavramlarını daha iyi açıklayabilmek için algoritma ve optimizasyon gibi kavramların tanımlarına yer vereceğiz.

3 Alan M. Turing, a.g.e. , s.453.

4 Jesus Salcedo, Machine Learning for Data Mining, Packt Publishing, 2019, s. 5.

5 Ethem Alpaydın, Introduction to Machine Learning, London: The MIT Press, 2004, s.14.

3.1 Algoritma ve Hesaplamalar

Makine öğrenmesinin herhangi bir probleme çözüm sunabilmesi için problemin mantıksal ve matematiksel düzlemde ifade edilebilir olması yeterlidir. Çünkü bir problemin makine tarafından çözümlenebilmesi için öncelikli şartmantıksal ve matematiksel olarak ifade edilebilir olmasıdır, böyle bir çözümleme içinuygulanacak olan işlem dizisine de algoritma denir.6 Bilgisayar bilimlerinde tüm programlama dillerinin temelinde algoritma vardır. Bu yüzden bir makineyi programlamanın en önemli kısmı belirli bir problemin çözümü için algoritma hazırlayabilmektir. Algoritmanın oluşabilmesi için gerekli şartlar şu şekildedir:

. Her adımda ne yapılacağı en net haliyle ifade edilmelidir.

. Belirli sayıda işlem yapıldıktan sonra algoritma tamamlanmış olmalıdır.

. Algoritma herhangi bir problemle ilgili ortaya çıkabilecek tüm ihtimalleri ele alabilecek kadar genelleştirilmiş bir yapıda olmalıdır. (tüm girdiler/değişkenler(variable) için ortak çözüm)7

6 Ibrahim (Abe) M. Elfadel, Duane S. Boning, Xin Li, Machine Learning in VLSI Computer-Aided Design, Springer, 2019, s. 234.

7 Alexander Shen, Algorithms and Programming: Problems and Solutions, Springer Science & Business Media, 2011, s.70.

Bilgisayar programında bir algoritmanın çalışabilmesi için gerekli olan tüm girdiler “değişken” (variable) olarak isimlendirilir. Algoritmanın içindeki döngüler ve yapılan işlemler, bu değişkenlerin değerleri üzerinden gerçekleşir.

Şekil 6. Görsel algılama test örnekleri27

Şekil 6’da görülen, otonom bir aracın sensöründan gelen veri girişi ile oluşturulmuş bir algoritma örneğidir. Bu araç 15 cm mesafe boyunca önünde bir engel olup olmadığını kontrol etmekte ve eğer engel yoksa ilerlemekte herhangi bir engelle karşılaşmışsa sağa dönmektedir. Bu işlem sonsuza kadar devam etmektedir.

Şekil 8 . Otonom bir araç için oluşturulmuş hareket algoritması.

3.1.2 Optimizasyon ve Minimax Algoritması

Yukarıda belirttiğimiz gibi makine öğrenmesinde, makinelerin örnek veri kümeleri üzerinde eğitilmeleri ve belli aralıktaki değerleri belirleyebilmeleri içinistatistiksel analiz yöntemi olan optimizasyon kullanılır. Genel olarak, eldekikaynaklar bağlamında en uygunu (optimumu) bulma yöntemi olarak tanımlayabileceğimiz optimizasyon, klasik istatistik tekniklerinin yetersiz kaldığıdurumlarda yapay zekâ ile yeni çözüm yolları bulmuştur.8 Yapay zekâ tabanlıoptimizasyon teknikleri, çeşitli mantıksal ve matematiksel çözüm yaklaşımları çerçevesinde şekillenen algoritmalar olarak bilinmektedir.

8 Suvrit Sra, Sebastian Nowozin, Stephen J. Wright, Optimization for Machine Learning, MIT Press, 2012, s.2.

1950'lerde algoritmaları kullanabilecek gelişmişlikte ilk bilgisayarlar üretildiğinde, en belirgin yapay zekâ problemleri oyunlardı. Çünkü oyunlar, kâr ya dazararın kolay ölçülebilirliği, basit kuralları ve çok sayıda denklem içeren hamle olasılıklarının olması nedeniyle ideal bir örneklem alanı oluşturmaktadır. Şans faktörünün olmadığı, taktik, hesaplama, strateji ve bilgi birikimine dayalı olan oyunlar için geliştirilen bilgisayarlar, yapay zekâya ihtiyaç duyulan oyun dışındaki problemlere de kolayca uyarlanabilirler. Bu nedenle dama, satranç ve GO9 gibi tahta oyunları güncel yapay zekâ araştırmalarının da konusu olmuştur.

Bir oyuncunun kaybının başka bir oyuncunun kazancı olduğu sıfır toplamlı oyunlarda ise karar vermek için genellikle minimax algoritması kullanılır. Bu oyunlarda en doğru hamlenin yapılmasını hedefleyen minimax ağacı; kaybı en aza indirmek (minimize etmeye) ve kazancı en yükseğe çıkarmak (maximize etmeye) için oluşturulur. 10

9 Dünyanın en eski zekâ ve strateji oyunu olma özelliği taşıyan Go oyununu 19×19’luk bir alanda 180 beyaz 181 siyah taşla oynanır ve tüm taşlar eşittir(hiyerarşi yoktur). Oynanabilecek hamle olasılıkları çok yüksektir. Google DeepMind şirketinin geliştirdiği AlphaGo isimli yapay zekâ uygulaması Mart2016’da 18 kez Dünya Go Şampiyonu olmuş Lee Sedol’u 5 maçlık bir seride 4-1 yenmiştir.

10 Stuart J. Russell, Stuart Jonathan Russell, Peter Norvig, Ernest Davis, Artificial Intelligence: A Modern Approach, Prentice Hall, 2010, s. 165.

Tic-tac-toe oyunuyla örneklendireceğimiz gibi minimax ağacı, her düğümde (node) farklı durumlar için olasılık değerlerini hesaplar. Bu hesaplara göre sondüğümden yukarıya doğru en yüksek değerleri seçer ve böylece bütün ağaçtaki en doğru seçenek seçilmiş olur. (Bkz. Şekil 8)

3.1.3 Tic Tac Toe Oyunu ve Karar Ağacı (Minimax Algoritması)

Tic Tac Toe oynanan 3×3 bir tabloya sırasıyla X ve O işaretlerinin konulduğu bir oyunda, Şekil 9’daki gibi bir karar ağacı çıkarılabilir.

Şekil 9. Mevcut durum için Tic-tac-toe oyununda Minimax Karar Ağacı11

Bu karar ağacında ağacın kökünü (root) oluşturan ilk durumdan itibarenoyuncular sırayla hamle yapmaya devam ettiğinde oyunun hangi olasılıkları barındırdığı görülmektedir. İkinci sırada karar verecek taraf olan ve tahtaya X sembolünü yazan oyuncunun oynayabileceği tüm olasılıklar toplamı 3’tür ve buolasılıklar karar ağacında birer alt düğüm olarak yer alır. Bir alt seviyede ise X’in oynanabileceği tüm durumlarda, O işaretinin yazılabileceği olasılıklar toplamı 6 tanedir.

Bir minimax ağacının hesaplanması sırasında kaç adım gidileceği ise ağacınseviyesini gösterir. Buna göre ilk şekildeki minimax ağacı iki seviyeli, X’in son hamlesi için hesaplanacak olan son karar ağacı ise üç seviyeden oluşan bir ağaçtır.

Bir minimax karar ağacının seviyesinin yüksek olması alınan sonucun seviyedeğerine göre yüksek olasılıkla doğru bulunmasını sağlar ve bu da yapay zekânın başarısını arttırır.12 Daha yüksek seviyeli karar ağaçları kurmak için daha yüksek hafızaya (RAM) sahip bilgisayarlar gereklidir. Henüz çok yüksek kapasiteli sistemler mevcut olmadığı için GO gibi hamle olasılıklarının yüksek olduğu oyunlarda, hafızanın yetersiz olabileceği ihtimaline karşı, bu karar ağacı seviyesi belirli bir limitin altında tutulur.

11Şekil kaynak: Bilgisayar Kavramları- Şadi Evren Şeker (Çevrimiçi):http://bilgisayarkavramlari.sadievrenseker.com/2009/04/29/minimax-agaclari-minimaxtree/ 12Aralık 2019.

12 A.e. , s. 670.

Son olarak bilgisayarın karar verebilmesi için her hamleye sayısal bir değer oluşturabilmek ve aşağıdaki gibi her hamle durumunu puanlamamız gerekir.

Şekil 10. “O” nun hamlesi için alınmış değerler

Yukarıdaki karar ağacına göre ilk durum için; 1 puanındaki hamleyi yapması durumunda X her koşul altında oyunu kazanmaktadır.

3.2 Makine Öğrenmesi Yöntemleri

Makine öğrenmesi yöntemleri ise gözetimli (supervised) ve gözetimsiz (unsupervised) öğrenme olarak iki ana başlıkta incelenir. Bunlar arasındaki temel fark öğrenilen bilginin gelişen sisteme nasıl aktarıldığıdır.

3.2.1 Gözetimli ve Gözetimsiz Öğrenme

Gözetimli öğrenme yönteminde, veriler insanlar tarafından, beklenen çıktıları işaret edecek şekilde etiketlenerek sisteme aktarılır. Daha sonra ise karşılaşılan etiketsiz veriler üzerindeki etiket değerlerini tahmin etmek için modeller kullanır. Buna göre çıktıyı öğrenen makine, beklenen ve gerçekleşen arasındaki farka yol açan hatayı göz önüne alarak oluşturmuş olduğu modeli günceller. Gözetimsiz öğrenmede ise bir veriyi etiketleme işlemi uygulanmaz. Belirli bir doğru işaret edilmeden karmaşık bir veri kümesinden bazı şablonlar çıkarılır. Örneğin, gözetimli öğrenme ile bilgisayara hangi verilerin kedi resimleri içerdiği tek tek verileri etiketleyerek öğretilirken, gözetimsiz öğrenmede sistemin kedi resimlerinin ortaközelliklerini belirlemesi sağlanır. 13

Şekil 11. Makine öğrenmesi yöntemleri14

13 Ethem Alpaydın, Introduction to Machine Learning, London: The MIT Press, 2004, s.4.

14 A.e.

Bazı durumlarda çözülmesi gereken problem makine öğrenmesi için çok zor olabilir ve genellikle doğru etiketi üreten mükemmel bir yöntem elde edilemez. Böyle durumlarda, iyi fakat mükemmel olmayan bir tahmin hiç olmamasından daha iyi olabilir. Bazen insanlar olarak böyle durumlar için -makine kullanmadan- daha iyi tahminler üretebiliriz, ancak yine de makine öğrenmesini kullanmayı tercih edebiliriz çünkü makine tahminlerini daha hızlı yapacaktır ve yorulmadan tahminlere devam edecektir. Büyük veriler söz konusu olduğunda, makinelerin insanlardan daha iyi olduğu alanlara örnek olarak: hangi müziğin, hangi videoların veya hangi reklamların hangi kullanıcı için daha fazla ilgi çekici olacağını tahmin eden öneri sistemleri gösterilebilir.

Gözetimli öğrenmede ihtiyaç duyulan doğru bir şekilde etiketlenmiş veri kümelerinin oluşturulması kolay bir işlem değildir. Bazen de araştırmacılar, cevaplarını bilmedikleri ancak elde etmiş oldukları verinin içinden ayrıştırılabilecek sorular sorarlar. Gözetimsiz öğrenmeye ihtiyaç duyulan nokta burasıdır.

Gözetimsiz öğrenmede, bir öğrenme modeline, onunla ne yapacağına dair açık talimatlar olmadan bir veri seti verilir. Eğitim veri seti, istenen bir sonucu veya doğru bir cevabı olmayan bir örnek koleksiyonudur. Eldeki soruna bağlı olarak, gözetimsiz öğrenme modeli, verileri farklı şekillerde düzenleyebilir.15

15 Michael W. Berry, Azlinah Mohamed, Bee Wah Yap, Supervised and Unsupervised Learning for Data Science, Springer Nature, 2019, s.4.

3.3 Derin Öğrenme

Derin öğrenme, matematik, bilgisayar bilimi ve sinir bilimde kökleri olan bir makine öğrenim dalıdır. Diğer makine öğrenmesi tekniklerinden farklı olarak tek birkatmanda değil, çok katmanlı yapılarla hesaplamaları tek bir seferde yapar ve diğer yöntemlerde tanımlanması gereken parametreleri derin öğrenme veri üzerindenkendisi keşfedebilir.16 1950'lerde yapay zekânın nasıl yaratılacağına dair iki rakip görüş vardı bunlardan biri mantık ve klasik bilgisayar programlarına dayanıyordu; diğeri doğrudan veriden öğrenmeye dayanıyordu. Doğrudan veriden öğrenme yöntemi olan derin öğrenmenin olgunlaşması mantık ve klasik programlamanın gelişimi göz önünde bulundurulduğunda çok daha uzun sürdü. Yirminci yüzyılda, bilgisayarların işlemcilerinin yeterince güçlü olmadığı ve veri depolamanın günümüz standartları ile karşılaştırıldığında yetersiz olduğu durumlarda, klasik programlama sorunları çözmek için etkili bir yoldu. Programcılar her problem için farklı bir program yazıyordu ve problem ne kadar büyükse program o kadar büyük oluyordu.Günümüzde ise işlemciler daha güçlü hale gelmiş ve veri miktarı artmış durumda bu yüzden öğrenme algoritmalarını kullanarak derin öğrenme ile sorunları çözmek daha hızlı, daha doğru ve daha verimli bir yöntem.17

16 Terrence J. Sejnowski, The Deep Learning Revolution, The MIT Press Cambridge, 2018, s.3.

17 A.e.

3.3.1 Yapay Sinir Ağları

Yapay sinir ağları beyin hücrelerinde gerçekleşen öğrenme yapısının taklit edilmesi (matematiksel olarak modellenmesi) üzerine kurulu yapay öğrenme tekniğidir. Bilindiği kadarıyla biyolojik sinir sisteminde hiyerarşik bir elektriksel akımsonucu algılama gerçekleşmektedir. Benzer olarak yapay sinir ağı da hesaplamalarlatekrar tekrar değişebilen elektriksel akımlarla şekillenir.18 Bu açıdan incelediğimizde sinir ağının kendisi bir algoritma değil, farklı öğrenme algoritmalarının birlikte çalışması ve karmaşık veri girişlerini işleyebilmesini sağlayan bir çerçevedir. Temeldebir yapay sinir ağında yapılan matematiksel işlemler; giriş değerleri ile ağırlık değerlerinin çarpılması, önyargıların eklenmesi (bias) ve aktivasyon fonksiyonununuygulanması olarak özetlenebilir.

18 Graupe Daniel, Principles Of Artificial Neural Networks: Basic Designs To Deep Learning, World Scientific, 2019, s.1.

Şekil 12 Matematiksel nöron modeli; bir sinir hücresinin birden fazla girdiyi alarak bir çıktı üretmesi prensibine dayanır.19

19 Görsel Kaynak: Stanford University, CS231n: Convolutional Neural Networks for Visual Recognition,http://cs231n.stanford.edu/slides/2019/cs231n_2019_lecture04.pdf, 12 Aralık 2019.

3.3.1.1 İlk Yapay Sinir Ağı Mimarisi

Yapay sinir ağı mimarisi alanında yapılan ilk çalışma 1943 yılında, matematikçi Walter Pitts (1923-1969) ve nörofizyolog Warren McCulloch (1898-1969) tarafından yayınlanan Sinir Etkinliğinde Bulunan Fikirlerin Mantıksal Bir Hesaplaması20 isimli makalede ortaya konulmuştur. McCulloch ve Pitts bu makale ile canlı beyninde yer alan biyolojik nöronların, birlikte nasıl çalıştıklarının indirgenmiş bir modelini göstermişlerdir. Makalelerinde McCulloch ve Pitts, bu yapay nöronlar ile oluşturulan yapay sinir ağlarının, ifade edilebilen herhangi bir mantıksal önermeyi hesaplayabileceğini de göstermişlerdir.21

20 Walter Pitts- Warren McCulloch, A Logical Calculus of Ideas Immanent in Nervous Activity, 1943(Çevrimiçi) https://www.cs.cmu.edu/~./epxing/Class/10715/reading/McCulloch.and.Pitts.pdf, 12Aralık 2019.

22 James A. Anderson- Edward Rosenfeld,Talking Nets: An Oral History of Neural Networks, Bradford Book, 2014, s.3-15.

McCulloch beyni modellemeye çalışırken Russell ve Whitehead'in yazdığı ve bütün matematiğin sadece temel mantık kullanılarak kurgulanabileceğini göstermeye çalıştığı Principia Mathematica kitabından ilham almıştır.22 Principia Mathematica kitabında en temel parça önermedir mümkün olan en basit ifade ise doğru ya da yanlıştır. Önermelerle daha karmaşık ağlar oluşturmak için ise ve, veya ve değil gibi temel mantıksal işlemler kullanılmıştır. Russell ve Whitehead bu basit önermelerden, modern matematiğin tüm karmaşıklığını türetmeyi denemişlerdir. McCulloch bu modeli, bir matematikçi olan Pitts’e anlatmış ve makalelerinde bu yapay sinir ağı modelinin matematiksel bir ifadesini oluşturmuşlardır. Böylece yapay bir sinir hücresi sayesinde her türlü mantıksal ifadenin formülize edilmesinin mümkün olabildiğini göstermişlerdir.

Şekil 13 Mantıksal önermeler ve nöronlar arasındaki bağlantılar

3.3.1.2 Tek Katmanlı Algılayıcı

Nöropsikolog Donald Hebb (1904-1985) 1949 yılında “The Organization of Behavior” isimli makalesinde, “Bir biyolojik nöron başka bir nöronu tetiklediğinde, iki nöron arasındaki bağlantı güçlenmektedir” fikrini ortaya atmıştır.23 Bu fikir daha sonra Hebb Kuralı olarak adlandırılmıştır. Perceptron kavramı ise ilk olarak 1957 yılında Cornell Üniversitesi’nde psikolog olan Frank Rosenblatt (1928-1971)tarafından ortaya konulmuştur. Hebb Kuralı dikkate alınarak eğitimi gerçekleştirilen perceptron tek bir yapay sinir hücresinden oluşmaktadırlar.24

23 Donald Hebb, The Organization of Behavior, Psychology Press, 1949.

24 Frank Rosenblatt, The Perceptron A Perceiving And Recognizing Automaton,1957. (Çevrimiçi)https://blogs.umass.edu/brain-wars/files/2016/03/rosenblatt-1957.pdf, 12 Aralık 2019. Ayrıca bkz. (Çevrimiçi) http://nautil.us/issue/21/information/the-man-who-tried-to-redeem-the-world-with- logic, 12 Aralık 2019.

Perceptron, giriş/çıkış ünitelerinden oluşur ve bir doğrusal eşik biriminesahiptir. Eşik değeri probleme göre belirlenir ve bu eşik değeri kullanılarak veri seti üzerinde bir sınıflandırma yapılır. Perceptron gibi Hebb öğrenme kuralı kullanılanyapay sinir ağı modellerinde temel amaç yapay nöronlar arasındaki bağlantıların ağırlık değerlerinin, değişebilen değerleri olan parametreler ile kayıtlı tutulması ve bu parametrelerin, üzerinde çalışılan veri işlendikçe değişerek en uygun değere ulaşmasıdır.

Perceptron, aynı zamanda Frank Rosenblatt tarafından 1957 yılında geliştirilenbir makinenin ismidir. Görüntü tanıma için geliştirilen bu makine, 400 tane fotoselin,yapay nöronlara rastgele bağlanması ile oluşturulmuştur. Bu 400 fotosel aracılığıyla algılanan ışık sinyalleri ve ağırlık değerleri üzerinden yapılan hesaplamalarsonucunda Perceptron 1 ya da 0 çıktısı üretir. Yani, farklı görseller ile eğitilerek ağırlık değerleri değiştirilen Perceptron, eğitimin sonunda gösterilen görselin iki gruptan hangisine ait olduğunu belirtebilir seviyeye gelmiştir.25

25 Frank Rosenblatt, a.e.

3.3.1.3 Yapay Sinir Ağları Nasıl Öğrenir?

Yapay sinir ağlarını telli bir çalgı aleti olarak düşünürsek, eğitim verileriyle eğitilmiş bir sinir ağını akordu yapılmış bir müzik aletine benzetebiliriz. Akort sürecinde izlenen yöntem; teller arasındaki uyumu yakalamak için notaya tekrar tekrar basmayı, her seferinde hataları azaltmayı ve sonunda makul şekilde ayarlanmış bir çalgı aletine ulaşmayı sağlar. Yapay bir sinir ağında bu şekilde uygunbir ayarlama elde etmek için eğitimi gerçekleştiren her yinelemede, beklenen değere ulaşabilmek için geri yayılım (backpropagation) uygulanır böylece ağ eğitilir ve böylece düşük hata oranlarına sahip çıktılar üretebilir.26

26 Graupe Daniel, Principles Of Artificial Neural Networks: Basic Designs To Deep Learning, World Scientific, 2019, s.22.

Bir sinir ağı, her biri kendi içinde hesaplamalar yapan birçok nörondan oluşur. Tek bir nöron, kendisine bağlı sinaptik ağırlıklar (synaptic weights) olarak adlandırılan bir değerler dizisine sahiptir. Bu ağırlıklar sinir ağı eğitildikçe eğitim verilerindeki değerler doğrultusunda değişmektedir. Yapay sinir ağlarında öğrenmenin nasıl gerçekleştiğini açıklayabilmek için Python programlama dilinde yazılmış aşağıdaki kod örneğini ele alacağız.

Örneğimizin odağı, bir sinir ağı oluşturmak, onu 10000 tekrar ile eğitmek, hertekrarda çıktısını tahmin etmek, beklenen çıktı değeri ile karşılaştırarak hatayı elde etmek, hatayı temel alarak ağırlığı ayarlamak/güncellemek ve son olarak test için eğitim verilerinden farklı bir girdi vererek çıktıyı tahmin etmek olacaktır.

İnceleyeceğimiz örnekte çok basit bir eğitim veri seti kullanacağız, bu sette 3 ikili değer ve bir çıktı değeri var:

Bu veri setinde girdi dizisindeki ilk değer neyse çıktı değerinin de aynı değere eşit olduğu örüntüsünü görebiliyoruz. Sinir ağının eğitimi tamamlandığında bu örüntüyü herhangi bir girdi üzerinde de tanıyabiliyor olması beklenir. Örneğin, [1, 1, 0] girdisi için eğitim verileri ile oluşturulmuş olan modele göre vereceği çıktı 1’e çok yakın bir değerdir.

Örneğimizde Python’da matematiksel işlemler için kullanılan Numpy kütüphanesini kullanıyoruz öncelikle “import” komutuyla bu kütüphaneyi programımıza ekliyoruz sonrasında eğitim veri setimizi “input” ve “output” olarak iki ayrı dizi şeklinde oluşturuyoruz. Matris çarpımı işlemi için “T” (transpose) fonksiyonu ile “training_set_outputs” matrisini yataydan dikey hale getiriyoruz.

Burada gördüğümüz “random()” rastgele sayılar üreten bir fonksiyondur. “seed()” fonksiyonu ise eğitime her başlandığında aynı rastgele ağırlık değerlerini alabilmeyi sağlar. Bu sayede eğitime sıfırdan başlandığında, model aynı rastgele başlangıç ağırlıkları grubuna getirilebilir böylece model tekrarlanabilir bir hale gelir bu da yapılan değişikliklerin ya da ortaya çıkan hataların kolaylıkla gözlemlenebilmesini sağlar. Rastgelelik derin öğrenme için önemli bir konudur bu yüzden koddaki bu fonksiyonu biraz ayrıntılı inceleyebiliriz. Bilgisayarda rastgele sayı üretimi aslında bildiğimiz anlamıyla "rastgele" değildir. Programlama yoluyla üretilen rastgele sayılar deterministliktir ve ürettiği dizi random.seed(x) fonksiyonuna atadığımız tohum değerini (x) referans alarak belirlenebilir. Bunagöre, aynı tohum değerini iki kez verirsek, aynı rastgele sayı dizisini iki kez elde edebiliriz. Dolayısıyla, bilgisayarda rastgele bir sayı üretmek, algoritmalar üzerinde çalışıldığı için aslında rastgele değildir. Algoritmalar her zaman aynı girişi temel aldığında aynı çıktıyı verir. Genelde “daha rastgele” sayı dizileri üretebilmek için “zaman” otomatik olarak seed() fonksiyonuna atanır ancak burada da makinenin dikkate aldığı zamansal değeri tekrar verdiğimizde tekrar aynı değere ulaşabilme imkânı vardır.

Örneğimize geri dönersek başlangıç için rastgele oluşturduğumuz ağırlık değerleri eğitim verilerimizle tutarlı olması için 3x1 matris boyutlarındadır. Eğitim verilerinin 3x1 matris boyutlarında olmasının nedeni ise şekilde görüldüğü gibi 3 girdisi (input) 1 çıktısı (output) olan bir yapay nöron modellemekte olmamızdır. Ayrıca ağırlık değerlerini -1 ile 1 arasındaki rastgele sayılardan üretmemiz gerekir çünkü çıktı değerlerimiz 0 veya 1'dir. a - b aralığı için “random” fonksiyonu kullanılırken, fonksiyon şöyle tanımlanır: (b - a) * random_sample () + a,örneğimizde a = -1 ve b = 1 olur ve denklem burada şu değerleri alır:synaptic_weights = 2 * random.random ((3, 1)) - 1. Ağırlıkların değerleri pozitif, negatif veya sıfır olabilir.

Daha sonra bu rastgele ağırlık değerlerini normalleştirmek (normalization) yani işlemlerimizde işe yarar hale getirmek/makul değerler almasını sağlamak için sigmoid aktivasyon fonksiyonunu kullanacağız. Sigmoid fonksiyonu ile girdilerin ağırlıklı toplamı 0 ile 1 arasında normalleşir. Sigmoid fonksiyonunun türevi bu sigmoid eğrisinin gradyanıdır. “gradyan” veya “sigmoid türevi” bize herhangi bir noktada eğriye çizilen teğetin eğimini verir, bu da hatadan ne kadar uzak olduğumuzu anlamamıza yardımcı olur. Bu nöral ağı telli bir müzik enstrümanı olarak düşündüğümüzde grandyan değeri akort işlemi sırasında bize belirli bir nota ile ne kadar uyumsuz olduğumuzu söyler. Sigmoid fonksiyonunu aşağıdaki gibi tanımlayıp kullanabilirdik fakat biz daha kısa ve anlaşılır olacağını düşündüğümüz için işlemlerin içine gömerek kullanmayı tercih ediyoruz.

Burada eğitim için “for” döngüsü ile 10000 tekrarlama yapacağımızı söylüyoruz. Ağı eğitmek için çok fazla tekrar yapılırsa “overfit” olarak bilinen fazla uyum sorunu ortaya çıkmaktadır bu da bilgisayarın “ezberci” diye tanımlanan bir davranış sergilemesi demektir. Gerekli olan yineleme sayısı genellikle eğitimverilerinin boyutlarına ve probleme göre belirlenir.

Burada döngünün içinde yapılan işlemler; öncelikle çıktıya (output) yapılan atama ile başlamaktadır. Yukarıda verdiğimiz sigmoid fonksiyonunun tanımı içindeki “x” yerine girdi (input) ve sinaptik ağırlıkların (synaptic_weights) matris çarpımının değerini yazıyoruz. Böylece eğitim verilerindeki girdiler (training_set_inputs) ve ağırlık değerlerini (synaptic_weights) matris çarpımı yapan “dot” işlemine alıyoruz ve burada elde edilen çarpım değerlerini sigmoid fonksiyon içinde kullanıyoruz. Sigmoid fonksiyonu çıktıyı tahmin etmek için, sinir ağlarında kullanılan yaygın bir yöntemdir. Matris çarpımı ile elde edilen sonucun 0 ve 1 arasında bir değer almasını yani “normalleştirilmesini” sağlar.

(training_set_outputs - output) işlemi ile eğitim verilerindekiçıktılardan, sigmoid fonksiyonu ile elde edilen tahmini çıktı değerleri çıkarılarak hata (error) değeri bulunur. Gradyan hesabının yapıldığı kısım ise (output * (1 – output )) işleminin yapıldığı yerdir.

Bu son satırda özetle, çıktı değerlerini değiştirmek için hata değeri yani “training_set_outputs – output ” işleminin sonucu sigmoid fonksiyonun gradyanı ile çarpılır ve bunların matris çarpımı için eğitim girdilerinin (train_input) transpoze (.T) değeri alınır. Döngü her çalıştığında son adımda, synaptic_weights değerine, bu işlemlerden elde edilen değeri ekleyerek güncellemektir.

Eğitimi tamamlandıktan sonra test için girdi olarak [1,0,0] dizisini verdiğimizde 1’e çok yakın bir değer olan 0.99993704 değerini elde ettik.

Eğitim verilerini çoğunluğu 0 ile başlayacak şekilde değiştirdiğimizde ve 0 ile başlayan bir test dizisi girdiğimizde çıktı değeri bu kez 0’a çok yakın bir değer olarak 0.00224634 değerini almıştır.

Kodlama alanında bu yaklaşımla, yazılımın desenler için belirli kuralları kodlamak zorunda kalmadan faydalı bir tahmin üretmesi sağlanmaktadır.

Klasik programlamayla bu örneği ele aldığımızda yukarıdaki kodu dayazabilirdik. Burada dizideki ilk rakam “1” ise “1” yaz aksi durumda “0” yazdır demiş oluyoruz. Fakat büyük veri setleri söz konusu olduğunda bu yöntemin hiçbir işlevselliği yoktur.

3.3.2 Çok Katmanlı Yapay Sinir Ağları

XOR problemi27 ile birlikte tek katmanlı olan Perceptron modeli 1969 yılına gelindiğinde üzerindeki ilgiyi kaybetmiştir. Marvin Minsky (1927-2016) ve Seymour Papert (1928-2016) perceptron’un tüm limitlerini ele alan çalışmalarında28; tekkatmanlı perceptron’un basit problemler için geçerli iken, XOR problemi gibi problemlerde çözümden uzaklaştıklarını göstermişlerdir.

27 Doğrusal olarak ayrılamayan fonksiyonlar.

28 Marvin Minsky, Seymour Papert, An Introduction to Computational Geometry, Cambridge, 1969.

Şekil 14 NOT, AND, OR, XOR operatörleri için mantıksal doğruluk tablosu

Perceptron öğrenme algoritmasının en büyük eksikliği sadece doğrusal olarak ayrılabilen veriler üzerinde sınıflandırma yapabiliyor olmasıdır. AND ve ORproblemleri doğrusal özellik gösterir ve bu problemler perceptron ile çözülebilir.Fakat perceptronlar Minsky ve Papert’in işaret ettiği XOR problemi gibi doğrusal olarak sınıflandırılamayan problemlerin çözümünde başarısızdır. XOR fonksiyonu iki önerme arasındaki farklılık durumuna göre çalışır. Buna göre sonuçların aynı olması durumunda yanlış, farklı olması durumunda doğru çıktısını verir. XOR problemine göre tek katman ile bir yapay sinir ağının XOR fonksiyonunu sağlaması beklenemez. Çünkü XOR problemi doğrusal olarak ayrılabilen bir problem değildir yine de XOR problemi doğrusal fonksiyonlar kullanan perceptronlar ile çözülebilir. Yani verinin bulunduğu ortam üç boyutlu hale getirilirse iki sınıfı ayıran doğrusal bir düzlem bulunabilir.

Şekil 15. Veri üzerinde sınıflandırma yaparken boyut artırımının etkileri29

29 Cornell University, Machine Learning for Intelligent Systems, Lecture Noteshttp://www.cs.cornell.edu/courses/cs4780/2018fa/lectures/lecturenote03.html, 12 Aralık 2019.

3.3.3 Geriye Yayılım

Geriye yayılım (Backpropagation), çok katmanlı yapay sinir ağlarının eğitimi için kullanılan denetimli bir öğrenme algoritmasıdır. David Rumelhart (1942-2011), Geoffrey Hinton (1947- ) ve Ronald Williams’ın (1934- ) 1986'da yayınladığı30 bu algoritma çok katmanlı yapay sinir ağları üzerinde çalışmayı kolaylaştırmış ve Minskyile Papert’in dikkat çekmiş olduğu eksikliklerin bazılarının çok katmanlı ağlarda sorun oluşturmadığını göstermiştir. Geri yayılmalı öğrenme kuralı yapay sinir ağı çıkışındaki hata düzeyine göre her bir tabakadaki ağırlıkları yeniden hesaplamak için kullanılmaktadır. Böylece başlangıçta rastgele değerlerin atandığı ağırlık katsayıları, hata ortaya çıktığında geriye doğru en uygun değerle güncellenir ve böylece modeloptimize edilmiş olur. Bu tür yapay sinir ağları denetimli öğrenme kuralını kullanırlar yani bu işlem için hem giriş hem de çıkış verilerinin bilinmesi gerekmektedir.

30 D.E. Rumelhart, G.E. Hinton, R.J. Williams, “Learning Representations by Back-propagating Errors”,Nature Volume, 323, p. 533–536, 1986.

Şekil 16 Derin yapay sinir ağının eğitim aşamaları

Geriye yayılım algoritması, delta kuralı veya gradyan31 iniş olarak adlandırılan bir teknik kullanarak ağırlık alanındaki hata fonksiyonunun minimum değerini arar. Buna göre geriye yayılım algoritmasının 3 temel işlevi vardır. İlki sonucu hesaplamak için ilerleme işlemi, ikincisi hatayı geriye doğru yönlendirmek için gradyan alma işlemi, son olarak da bir optimizasyon algoritmasıyla parametrelerin güncellenmesi işlemidir.32

31 Hata sinyalinin girdilere göre alınmış kısmi türevlerine gradyan denir.

32 Toshinori Munakata, Fundamentals of the New Artificial Intelligence, Springer Science & Business Media, 2008, s.10-11.

Örneğin, görme problemlerini çözmek için eğitilmiş derin modellerde, en alt düzeyde yer alan nöronlar, kendi görme sistemimizde olduğu gibi, kenar, köşe ve renklere özelleşmiş durumdayken, orta düzeydeki nöronlar geometrik desenleri ve nesne parçalarını kodlarlar. Nesne veya sahne gibi soyut kavramların gösterimleri ise en üst katmanlarca yakalanır.

Önemle vurgulanması gereken bir diğer üstünlük ise aynı sinir ağı modeli ile hemen her türlü problemin çözülmesine olanak sağlanmasıdır. Konvansiyonel programlama tekniklerinde her tür problem için ayrı bir bilgisayar programına gereksinim duyulmasına karşılık, yapay sinir ağı modelinde problemin türüne göre ağ, sadece nöron sayısı ve ağırlıkların değişimine ihtiyaç göstermektedir.

Yapay sinir ağlarının mühendislik problemlerindeki en önemli üstünlüğü ise hesaplamaları direkt olarak deney sonuçlarını kullanarak öğrenmesi ve yapmasıdır. Diğer önemli üstünlüğü ise dağınık veya yetersiz veri olan problemlerde vetanımlanmış teorisi olmayan türden problemlerde kullanılması ve bu tür problemlerde doğruya yakın çözüm vermesidir.

3.3.4 Evrişimsel Sinir Ağları

Yapay sinir ağları ile görüntü tanıma, verilen bir görüntüyü önceden tanımlanmış kategorilerden birine sınıflandırma görevidir. Görüntü tanıma işlem aşamasında iki modül içerir bunlar öznitelik bulma ve sınıflandırmadır. Öznitelik bulma, ilgili kategoriler arasındaki farkı yakalayabilen ham piksel değerlerinden daha yüksek düzeyde ayrıntılı bilgi çıkarmayı içerir. Öznitelikler çıkarıldıktan sonra, görüntüler ve ilgili etiketlerle bir sınıflandırma modülü eğitilir. Bu eğitimde beklenen değerlere ulaşmak için istatistik (Lojistik Regresyon, Probit Regresyon, Poisson Regresyon, Genelleştirilmiş Katkı Modeli vb.) ve makine öğrenimi (K-En Yakın Komşu, Karar Ağacı, Destek Vektör Makinesi, Yapay Sinir Ağları vb.) algoritmalarından problem için en uygun olan kullanılır.

Görüntü tanımak için kullanılan geleneksel yapay sinir ağlarında sorun, bir görüntüyü sınıflandırmak ya da tanımak için tüm piksellerin nöral ağa aktarılması gerekmesidir. Bu işlemden kurtulmak için yapay sinir ağları geliştirilerek evrişimsel (convolutional) sinir ağları oluşturulmuştur.33 Evrişimsel ağlarda önce görüntüler üzerinde bazı örüntüler tespit edilmeye çalışılır ve bu örüntüler tekrar ağa aktarılırlar. Bu işlem için katmanlarının çıkışlarında, görüntüye dair öznitelik haritaları elde edilmektedir. Bu haritalarda ilk katmanlarda, kenar gibi daha basit bilgileri içeren öznitelikler tespit edilirken; daha üst seviyeli katmanlarda, ilk katmanlarda elde edilen öznitelikler kullanılarak görüntünün geneline ilişkin daha karmaşık öznitelikler çıkarılmaktadır. Böylece daha sade bir şekilde görüntünün işlenmesi ve başarı oranları yüksek sonuçların elde edilmesi sağlanabilmektedir.

33 Salman Khan, Hossein Rahmani, Syed Afaq Ali Shah, Mohammed Bennamoun, A Guide to Convolutional Neural Networks for Computer Vision, Morgan & Claypool Publishers, 2018, s.43.

Evrişimsel Sinir Ağları (Convolution Neural Network-CNN) çok katmanlı algılayıcıların kullanıldığı bir derin öğrenme mimarisidir. Evrişimsel sinir ağı yapısı ilkolarak Yann LeCun tarafından 1989 yılında yayınlanmıştır.34 1998 yılında yayınlananve ilk başarılı evrişimsel sinir ağı modeli olan LeNet-5 ise Yann LeCun ve ekibi tarafından posta numaraları, banka çekleri üzerindeki sayıların okunması için geliştirilmiştir.35 Rakamları sınıflandırabilen bu model, sistemin karşılaştığı sayının hangi rakamlardan oluşmuş olabileceğinin olasılıklarını kullanıcıya sunabilmekteydi.

Evrişimsel ağlarla sınıflandırma, örüntü tanıma, nesne tanıma alanlarındaki problemler için piksel tabanlı görüntü işleme yaklaşımları geliştirilmiş olsa da işlemcilerin yavaşlığı ve eğitim veri setlerinin boyutlarının yetersiz olması sebebiyle takip eden yıllarda; yeterli işlevselliğe ulaşılamamıştı.

2009 yılına gelindiğinde 3.2 milyon görüntü etiketlenerek elde edilen ImageNet isimli veri setinin oluşturması derin öğrenmenin potansiyelinin ortayaçıkmasına katkı sağlamıştır.36 Canlılardaki görsel algılama sistemi model alınarak geliştirilen bu yapılarda nöronlar tüm görsel üzerinde dağılmış şekilde alt bölgelere ayrılmıştır, basit hücreler, kenar/sınır çizgileri gibi özelliklere, karmaşık hücreler ise daha geniş alıcılarla, daha geniş alanlara yoğunlaşmaktadır. Bir evrişimsel ağ, bir veya daha fazla evrişim katmanı, ortaklama katmanı ve son olarak bir veya daha fazla bağlantı katmanından oluşur.

34 Y. LeCun,"Backpropagation Applied to Handwritten Zip Code Recognition", Journal Neural Computation, 1989, p. 541-551. (Çevrimiçi) http://yann.lecun.com/exdb/publis/pdf/lecun-89e.pdf,12 Aralık 2019.

35 Y. LeCun, “Gradient-Based Learning Applied to Document Recognition”, Proceedings of the IEEE, Volume: 86 , Issue: 11 , Nov 1998, s. 2278 - 2324.

36 Jia Deng, Wei Dong, Richard Socher, Li-Jia Li, Kai Li, Li Fei-Fei, “ImageNet: A Large-ScaleHierarchical Image Database”, Princeton University, USA, 2009. (Çevrimiçi)http://vision.stanford.edu/pdf/ImageNet_CVPR2009.pdf, 12 Aralık 2019.

Şekil 17 Evrişimsel sinir ağının katmanları37

Şekil 17 de görüldüğü gibi görüntü kare şeklinde parçalara ayrılır. Her bir parçaya boyutları genel görüntüden küçük ve aranan değere uygun filtreler (matris/kernel) uygulanır. Filtre işlemi sırasında evrişim (konvolüsyon) denilen matris çarpımları şeklinde sayısal hesaplamalar yapılır. Bu işlemler sonucunda elde edilen yeni piksel değerleri ortaklama (pooling) işlemiyle problemin özelliklerine bağlı olarak matristeki en yüksek değer ya da ortalama değer alınarak son katman oluşturulur.38

Toronto Üniversitesi’nden Geoffrey Hinton (1947-) ve ekibinin 2012 yılında oluşturdukları evrişimsel sinir ağı modeli AlexNet görsel tanımada doğruluk oranını %74,3’ten %83,6 seviyelerine çıkarmıştır.39 AlexNet görüntü tanıma problemi için bir kırılma noktası olarak görülmektedir. AlexNet’ten sonra 2016 yılına kadar geliştirilen farklı evrişimsel sinir ağı modelleri ve başarı oranları aşağıdaki grafikte görüldüğü gibi sürekli bir artış göstermiştir. Bu başarı oranlarının artmasında donanımsal gelişmeler, algoritmaların geliştirilmesi ve veri setlerinin hızla büyümesi gibi ilerlemeler etkili olmuştur.

39 A. Krizhevsky, I. Sutskever, G. E. Hinton, “ImageNet Classification with Deep Convolutional NeuralNetworks”, Advances in Neural Information Processing Systems-25, 2012.

37Stanfort Üniversitesi CS 230 - Deep Learning ders notlarından. (Çevrimiçi)https://stanford.edu/~shervine/teaching/cs-230/cheatsheet-convolutional-neural-networks, 12 Aralık 2019.

38 Stanfort, A.e.

Şekil 18 2016 verileri ile oluşturulmuş evrişimli sinir ağı modellerinin başarı oranları grafiği40

40 Alfredo Canziani, Adam Paszke, Eugenio Culurciello, "An Analysis of Deep Neural Network Models for Practical Applications", ICLR 2017 conference, 2016.

3.3.5 Inception Sinir Ağları

Evrişimsel Sinir ağlarındaki hesaplama karmaşıklığını gidermek için 2013yılında yayınlanan “Network in Network”41 isimli makaleleriyle Min Lin ve ekibievrişimsel sinir ağının içine çok katmanlı algılayıcı yapısı ekleyerek yeni bir modelelde ettiler. Bu model temelde, aynı girdiye uygulanan havuzlama ve birden fazla evrişim işleminin ardı ardına uygulanması yoluyla çalışır. Bu özelliği sayesinde ağ, aynı anda hem genel hem de özel öznitelikleri çıkarabilmektedir.

41 Min Lin, Qiang Chen, Shuicheng Yan, “Network In Network”, Cornell University, ICLR 2013.

3.3.6 Kapsül Ağlar

Şekil 19 Inception Ağ Mimarisi42

Her ne kadar nesne tanımada evrişimli sinir ağları ile umut vadeden sonuçlar elde ediliyor olsa da evrişimli sinir ağları bazı problemleri beraberinde getirmektedir. Eğitilmiş evrişimli sinir ağı, üzerinde eğitilmiş olduğu nesne fiziksel olarak farklı bir açıdan görselleştirilmiş olduğunda aynı başarı ile tanıma işlemini gerçekleştirememektedir. Evrişimli sinir ağını bir nesneyi oluşturan parçaların arasındaki hiyerarşiyi (örneğin bir yüzün göz, ağız, burun vb. organlardan oluşması) çözümleyememektedir. Aynı zamanda evrişimli sinir ağlarındaki ortaklama işlemi ile gerçekleştirilen boyut azaltma da bilgi kaybına neden olmaktadır. Konum, yönelim, duruş ve açısal değerin değişmesi durumunda dahi bir grup yapay nörondan oluşan kapsüller aracılığıyla nesnenin başarıyla tanınabilmesi için nesneyi temsil eden kalınlık, ölçek, kaydırma vb. özelliklerin anlaşmalı yönlendirme ile öğrenilmesi önerilmiştir

Derin öğrenmenin kurucularından olan Geoffrey Hinton evrişimli ağlarda ortaya çıkan sorunların sebebinin ortaklama (pool) işlemi olduğunu ifade etmiş ve bu hatayı gidermek için 2018 yılında Kapsül Ağlarını (Capsule Networks) önermiştir.43 Kapsül ağlardaki derinliği, diğer yapay sinir ağlarında olduğu gibi katmanların art arda bağlılığı değil iç içe kapsüller sağlamaktadır. Kapsül ağ yapısı sayesinde, görüntülerin içerdiği hiyerarşik ilişkiler (öz niteliklerin ayrıntıları, bölgesel görüntülerin konumları vb.) daha verimli şekilde öğrenilmektedir.

42 Min Lin, Qiang Chen, Shuicheng Yan, “Network In Network”, Cornell University, ICLR 2013.

43 Geoffrey Hinton, Sara Sabour, Nicholas Frosst, “Matrix Capsules With EM Routing”, ICLR, 2018.(Çevrimiçi) https://openreview.net/pdf?id=HJWLfGWRb

Evrişimli sinir ağı modellerinde yaşanan bazı problemleri gidermesi beklenen kapsül ağları ile MNIST (Modified National Institute of Standards and Technology) veri seti üzerinde %99,75 başarı elde edilmiştir. Özellikle görüntüde konum, yönelim ve açı bilgisinin diğer derin öğrenme modellerine göre daha verimli44

44 Sabour, S., Frosst, N. ve Hinton, G.E., “Dynamic Routing Between Capsules'', arXiv preprint arXiv:1710.09829, 2017.

Görüntü tanımada ortaya çıkan sorunları giderebiliyor olmasına rağmen kapsül ağların geliştirilmesi gerekmektedir. Çünkü evrişimsel sinir ağı modeline göre işlem yükü daha fazladır ve bu yüzden de eğitilmesi daha uzun sürmektedir.

3.4 Beyni Modellemek

Yapay sinir ağlarının ilerleyişi ve başarılı sonuçlara ulaşılması sonucunda beynin çalışma sistemini makinelere aktarma fikri geliştirilmiştir. Beynin çalışma şeklini anlayabilmek ve ihtiyaç duyulan noktalarda yapay olarak onu oluşturup kullanabilmenin diğer teknolojik gelişmeler gibi birçok kolaylık sağlayacağı ileri sürülmektedir.

İnsan beyninin silikon tabanlı bir ortamda simülasyonunun oluşturulmasının hedeflendiği Mavi Beyin Projesi, IBM ve Brain Mind Enstitü tarafından İsviçre’deki Ecole Polytechnique Fédérale de Lausanne (EPFL) da devam etmektedir. Mavi Beyin Projesi ekibi, insan beynindeki sinir ağlarının karmaşıklığını açıklayabilmek için matematiksel bir dal olan cebirsel topolojiyi kullanmaktadır. Buna göre sinir ağları bağlantılarında ortaya çıkan karmaşıklık çok yüksek seviyelerde olmasına rağmen yine de bu bağlantıların tanımlanabileceği matematiksel bir zemin oluşturabilmek mümkün olabilir.

Projenin Frontiers in Computational Neuroscience dergisinde yayımlanmış sonuçlarına göre; tüm vücut hücrelerinden farklı olarak beyindeki hücreler on bir boyuta kadar etkinlik göstermektedir. Burada boyut kelimesiyle topolojideki simplekslerin karmaşıklığı ifade edilmektedir. Bir dizi sinir hücresi arasındaki bağlantılar bu simplekslerle temsil edilebilmektedir.45

Şekil 20 Sinir ağlarında görüntülenen simpleks örneği46

Proje ile topolojideki simpleksler model alınarak beyindeki nöronların bağlantışekillerini nesnel olarak sınıflandırmak için matematiksel bir algoritma geliştirilmekistanmektedir. Bu algoritma sayesinde araştırmacılar nöronlar ile ilgili edindikleri verileri karşılaştırabilecek ve algoritma ile beyindeki tüm hücrelerin standart bir sınıflandırılmasının yapılmasına olanak sağlanacaktır.47 Söz konusu gelişme sinir bilim çalışmalarında ilerleyebilmek için faydalı olabilir, çünkü daha gelişmiş bir hücre taksonomisi anlayışı ve güvenilir bir karşılaştırmalı yöntem sağlayacaktır. Morfolojik tiplerin nesnel tanımı, beynin temel yapı taşlarının daha iyi anlaşılması için gerekli ilk adımdır. Bu yöntem, tüm beyin bölgelerinin ve glia hücrelerinin nöronları dâhil olmak üzere beyindeki tüm hücre türlerinin tutarlı bir şekilde tanımlanması için kullanılabilir.

45 Henry Markham, Cliques of Neurons Bound into Cavities Provide a Missing Link between Structureand Function, June 12, Frontier, 2017, (Çevrimiçi) https://doi.org/10.3389/fncom.2017.000488, 12Aralık 2019.

46 A.e.

47 Objective Morphological Classification of Neocortical Pyramidal Cells, EPFL, Cerebral Cortex, Volume 29, Issue 4, Nisan 2019, s.1719–1735. (Çevrimiçi)https://academic.oup.com/cercor/article/29/4/1719/5304727, 12 Aralık 2019.

3.5 Hesaplama ve Oyun

Turing’in çalışmalarına, 1928 yılında ortaya koyduğu düşünceleriyle David Hilbert yön vermiştir. Matematiğin biçimselleştirilmesi için çalışmakta olan Hilbert özetle şunu söylemekteydi: eğer matematik nesnelse ve matematiksel bir ispat “doğru” ya da “yanlış” olarak betimlenebiliyorsa, bu ispatın doğru ya da yanlış olduğunu belirleyebilen kesin kurallar olmalıdır. Hilbert bir aksiyomlar kümesine ve biçimsel dile sahip olmayı önerdi. Bu biçimsel sistem, herkesin üzerinde anlaşabileceği ve bütün matematiksel akılyürütmeleri içerecek mükemmel bir sistem olacaktı. 1930’da Gödel böyle bir biçimsel sistemin var olamayacağını ispatlamıştı ardından Turing bu konuyu farklı bir açıdan ele alarak Turing Makinesi olarak anılan matematiksel modelini geliştirmiştir. Turing'in bu modeli, bazı matematiksel önermelerin yapısal olarak hesaplanamaz olduğunu, yani bu önermelerin doğru veya yanlış olduklarının matematiksel olarak gösteriminin olanaksız olduğunu ortaya koymuştur. 1940'larda ise bu matematiksel modelin sadece matematik problemlerini çözmek için geliştirilmiş bir model olmadığını; problem çözme olarak ifade edilen işlemi tanımlayan bir model olduğunu fark etmiştir. Buna göre bilimsel anlamda problem çözme işlemine hesaplama denmektedir ve insan beyninin geliştirdiği hesaplama işlemleri ile bilgisayarların geliştirdikleri hesaplama yöntemleri farklılıklar göstermektedir.

Bilgisayarların sahip olduğu hesaplama gücü teknolojik ilerlemeler sayesinde arttıkça Bu farklılıklar da daha gözlemlenebilir bir hal almıştır. Makinelerin satranç, Go, poker, StarCraft, DOTA gibi herhangi bir oyunda ya da herhangi bir görevde insanlardan daha başarılı olduğu birçok kez ispatlanmıştır. Bu oyunlarda insanlardan başarılı olmak için insanlardan daha az hata yapmak yeterlidir.

Daha yakından inceleyecek olursak dünya satranç şampiyonu Garry Kasparov’u satrançta yenen IBM’in bilgisayarı DeepBlue, bu maçta oynanabilecek tüm olasılıkların ve hamlelerin bir “ağacını” çıkarmış, bu karar ağacında bir tarama yapmış ve milyonlarca hamle arasından en uygun yani en büyük kazancı sağlayabileceği hamleyi seçmiştir. Buna göre, satrançta her durum için yapılabilecek yüzlerce hamleden ve her hamleye rakibin verebileceği yüzlerce cevaptan oluşan durum uzayı ele alındığında herhangi bir insanın böyle büyük bir hesaplama işini yapması mümkün değildir.

Deep Blue’nun Garry Kasparov’u yendiği 1997 yılı ile günümüz yapay zeka programlarının -donanımsal gelişmelerin dışında- en büyük farkı ise büyük eğitim verilerine sahip olunması ve makine öğrenmesi yöntemlerinde ortaya çıkan yeniliklerdir. Son yıllarda yapay zekâ alanında yaşanan önemli gelişmelerin arkasında bilgisayar biliminin ilk günlerinde ortaya atılan, yapay sinir ağları vardır. Yapay sinir ağları fikir olarak ortaya çıktığı ilk dönemlerde kullanışlı bulunmamıştı, çünkü karmaşıklıklarından dolayı eğitilmeleri uzun sürüyordu ve eğitim için gerekli olan veri çok sınırlıydı. Günümüzde bu dezavantajlar büyük ölçüde giderilmiş durumdadır. Yapay sinir ağları yoluyla gerçekleştirilen öğrenme yöntemleri, Deep Blue’nun ağaç taraması baz alındığında insanın öğrenme şekline daha fazla benzerlik gösterdiği düşünülmektedir. İnsanın akılyürütme bakımından en önemli özelliklerinden biri olan eksik bilgiye dayalı akılyürütme yapabilmesi ve gerektiğinde kararlarını hızlı bir şekilde güncelleyebilmesidir.48 Derin öğrenme yöntemlerini diğer makine öğrenmesi tekniklerinden ayıran en önemli yönü bu monoton olmayan akıl yürütme yöntemini daha büyük oranda yani her bir katmanda kullanabiliyor olmasıdır.

48 Vedat Kamer, "Feshedilebilir Akılyürütme", VI. Mantık Çalıştayı Kitabı, Kamer V., Ural Ş., Ed., Mantık Derneği Yayınları, İstanbul, ss.245-254, 2016 (Çevrimiçi)https://calistay.mantik.org.tr/wp-content/uploads/2017/01/VI-Mantik-Calistayi- Kitabi_DusukCozunurluk.pdf ,12 Aralık 2019.

2016’da dünya Go şampiyonu Lee Sedol’u yenen Google/DeepMind şirketinin AlphaGo isimli yazılımı da yapay sinir ağlarını kullanarak öğrenen bir sistemdir. Lee Sedol ile yapılacak maç öncesinde AlphaGo 30 milyon hamlelik bir veri setiyle eğitilmiştir. AlphaGo’nun eğitimi için kullanılan bu eğitim seti insan Go oyuncularının oyunlarından elde edilmişti. Maçtan sonra, DeepMind ekibi Go oyununda insan verisi kullanmadan kendi kendini geliştirebilen bir program yazma fikrini geliştirmişti. Bu yeni programda aynı öğrenme yöntemi kullanıldı fakat programa oyunun kuralları dışında herhangi bir bilgi verilmedi. AlphaGo Zero adı verilen bu program kendi kendine karşı milyonlarca maç yaptı ve böylece eğitim verisini kendisi oluşturmuş oldu. Kendi oluşturmuş olduğu veri seti ile eğitimini tamamlamasının ardından AlphaGo ve AlphaGo Zero karşı karşıya getirildi ve 100 oyunun 100’ünü de AlphaGo Zero kazandı.49 Böylece makinelerin geliştirdikleri problem çözme yöntemlerinin insanlardan çok farklı olabildiği ve insanlardan edinilmiş olan, insanın düşünme şeklini yansıtan, eğitim verisinin aslında bilgisayarları kısıtladığı anlaşılmış oldu.

49 Tara Mahfoud, Sam McLean, Nikolas Rose, Vital Models: The MAking and Use of Models in the Brain, Academic Press, 2017, s. 104.

Klasik makine öğrenmesi tekniklerinden farklı olarak derin öğrenme yöntemiyle öğrenen makineler sadece “hesaplama yapmak” olarak nitelediğimiz davranış biçimlerinin dışına çıkabilmekte ve bu tür oyunlar için bir bakıma nasıl daha başarılı olunabileceğine dair yol göstermektedir. Bununla birlikte günümüzde kullanılan teknolojiler ve algoritmalar sürekli gelişse de değişmeyen şey makinelerin veri kümeleri yoluyla eğitilmesi öğrenmesi olacak gibi görünmektedir.

SONUÇ

İnsan beyni aritmetik işlemleri kolaylıkla yapabiliyor olsaydı, zamanı hatasız bir şekilde ölçebilseydi, çok basamaklı sayılarla hızlı ve hatasız işlemler yapabilseydi hesap makinelerinin, saatlerin, takvimlerin ortaya çıkmasına ihtiyaç kalmazdı. İnsan beyni bu tür ölçümler ve hesaplamaları yapabilecek kadar gelişmiş olmamasına rağmen “anlama yeteneği” makinelerle değil insanlarla bağdaştırılır. Bu sebeple makinelerde anlama yeteneğinin geliştirilmesi için kullanılan doğal dil işleme tekniklerini de içeren makine öğrenmesi ilk olarak insan öğrenmesi model alınarak geliştirilmiştir.

İnsan beyninde oluşan anlam ve anlama yeteneğini tanımlayabilmek, bunların ortaya çıkması için beyinde gerçekleşen elektriksel etkinliği saptayabilmek ve analiz edebilmek için beynin biyolojik yapısı incelenmiştir. Beynin anatomisi üzerine yapılan bu tür araştırmalarda özellikle görsel sisteme ilişkin önemli bilgiler eldeedilmiştir. Gözle bağlantılı veri işleme sistemi görsel verileri analiz edip anlamlı halegetirirken neredeyse kusursuz bir performans göstermektedir. Bu veri analiz sürecinin incelenmesiyle, görsel sistemin, ışık ve renk birlikteliğinin ortaya çıkardığı görüntüleri analiz ederken, kendileri de kenar çizgileri tarafından sınırlanan iki boyutlu yüzeylerin sınırladığı nesneleri üç boyutlu uzayda algılamamızı sağlayan karmaşık bir yapısı olduğu ortaya çıkmıştır.

Görsel sistemin nesneler üzerindeki çizgisel ve dairesel sınırları temel alan yapısının, yapay sinir ağları kullanılarak taklit edilmesiyle de derin öğrenme gerçekleşir ve bir bilgisayar, milyonlarca fotoğraf ile eğitilerek belli bir nesneyiinsandan daha iyi tespit edebilecek seviyeye gelebilir.

Eski bir makine öğrenmesi yöntemi olan yapay sinir ağları, çok uzun bir süre pratik bir yöntem olarak görülmemiştir. Çünkü fazla karmaşık oldukları için eğitilmeleri çok uzun sürmekte ve buldukları bağlantılar mevcut eğitim verisi ilesınırlı kalmaktadır. Günümüzde bilgisayar işlemcilerinin gelişimi ve bilgisayarların eğitimi için ihtiyaç duyulan veri setlerinin büyüklüğü yapay sinir ağlarının dezavantajlarını büyük ölçüde gidermiş durumdadır. İşlemcilerin gelişmesi ve büyük veri setlerine erişilmesi çeşitli algoritmalarla bilginin işlenmesini ve analiz edilmesini daha da önemli hale getirmiştir.

Çalışmamızda da hesap makinelerinden yola çıkarak incelediğimiz bilgisayarların bu teknolojik gelişim sürecinde en önemli noktalardan biri bilgisayarların bilgiyi işleyişidir. Hızlı ve hatasız işlem yapmak gibi basit bir ihtiyaçtan dolayı ortaya çıkan bir araç olan hesap makinelerinin başka neler yapabileceği sorusu makineleri sürekli gelişmekte olan cihazlar haline getirmiştir. Bu gelişimin bir noktasında makinelerin bilgiyi depolayan ve kullanabilen araçlar haline gelmesi ile uzman sistemler ortaya çıkmıştır. Gelişmedeki bir sonraki aşama olan makine öğrenmesinde ise bilgi, veri setleri halinde bilgisayarlara aktarılmış ve bu veri setlerinden belirli problemler için belirli çözümler üretmesi yani çıkarım yapması sağlanmıştır. Derin öğrenme makineler için bilgiyi işleme çabasının geldiği son noktasayılmaktadır. Derin öğrenme sistemlerinin karar verebilmesi için büyük veri setlerini işleyip doğru şekilde yorumlaması gerekmektedir. Karar aşamasında insan zihninde gözlemlenen şey girdi ve çıktılar arasındaki nedensel ilişkidir. Buna göre zihin duyular yoluyla edindiği bilgiyi girdi olarak almakta ve bu duyusal bilgi pek çok farklı aşama ve düzeyde işlenmekte; sonrasında ise çıktı olarak bir davranış üretilmektedir. Bir bilgisayar programı da benzer şekilde girilen veriyi işleyerek bir çıktı üretmektedir. Yapay zihnin inşasına ilkece zemin hazırlayan bu yaklaşım işlevselci yaklaşım olarak bilinmektedir.

Bir bilgisayar programı ile zihin durumları arasında benzerlik olduğunu iddia eden işlevselciliğin göz ardı ettiği şey ise bilinç kavramı ve ona bağlı olarak kayıp deneyimsel nitelikler (absent qualia) argümanıdır. Bu argümana göre işlevsel olarak duyusal varlıkların kopyalarının üretilmesi mümkündür ancak bu kopyalar insanlar gibi deneyimsel niteliklere sahip olamazlar. Deneyimsel niteliklerin bilince işaretetmesi sebebiyle, bilincin gizemli bir fenomen olmaktan çıkması ancak deneyimleyen öznenin doğası hakkında açıklama sunan bir bilinç yaklaşımıyla son bulabilir.

İnsan beynindeki sinir hücreleri modellenerek geliştirilen derin öğrenme teknikleri sayesinde makineler işitme, konuşma, görme gibi insan duyusal deneyimlerini taklit etmede son derece başarılı olmuşlardır. İstatiksel çıkarım ve koşullandırma ile optimizasyon gibi yöntemleri kullanan derin öğrenme ağ modelleri özelleştirilmiş problemler üzerinde başarılı olsa da tüm problemler için genelleştirilmiş bir model oluşturulamamıştır. İnsan bilinci söz konusu olduğunda iseinsan beyninin bir bütün olarak tüm işlevselliği ve bu işlevselliğin farkında olma durumu göz önünde bulundurulmalıdır.

Bir makineye kazandırılmak istenen en belirgin özellik herhangi bir şeyi taklitetme yeteneğidir. Bu özellik sayesinde evrendeki en karmaşık yapı olduğu düşünülen insan beyninin de taklit edilebilmesi araştırılmaktadır. Beynin görme, öğrenme, bilgi işleme, hesap yapma vb. fonksiyonları taklit edilebilir olsa da, beyinde ortaya çıktığı düşünülen bilincin taklit edilmesinin önünde deneyimsel nitelikler engeli vardır. Öznel olan deneyimsel nitelikleri kapsayan bilinç, taklitedilebilir bir yapı olarak görülmemektedir.

Çalışmamızda makine öğrenmesi aşamasına kadar insan dışı bir ortamda bilgi işlemenin tarihsel gelişimini ortaya koyduk. Bu bilgi işleme sürecinin henüz bir bilinç olarak adlandırılmaktan uzak olduğunu gördük. Bu uzaklığın en önemli nedeni her insan bilincinde yer alan niteliksel yönün modellenmesiyle ilgili sorunlar görünmektedir. Yapay sinir ağları beyindeki biyolojik sinir ağlarının şimdilik bilimsel olarak bilinen bazı özelliklerini taklit etmeye çalışmaktadır. Bu nedenle insan beyninin büyük paralel işleme kapasitesiyle karşılaştırıldığında, yapay ağlar ancak basitleştirilmiş modeller sunmaktadır. Bu modellerin geliştirilebilmesi için yapayzekâ çalışmaları açısından araştırılması gereken en önemli soru, yapay sinir hücrelerinin, insan zekâsından da bağımsız olarak, zekâyı temsil edebilmek üzere ne tür özelliklere sahip olması gerektiğidir.

KAYNAKÇA

Alpaydın, Ethem: Introduction to Machine Learning, London: The MIT Press, 2004.

Anderson, James A.: Talking Nets: An Oral History of Neural Networks, Bradford Book, 2014.

Aydın, Süleyman: İnsan Anatomisi Ve Fizyolojisi, Anadolu Üniversitesi,2000.

Atherton, W. A.: From Compass to Computer: History of Electrical and Electronics Engineering, Macmillan International Higher Education, 1984.

Bauer, Craig: Secret History The Story of Cryptology, Chapman and Hall / CRC, 2013.

Berry, Michael: Azlinah Mohamed, Bee Wah Yap, Supervised and Unsupervised Learning for Data Science, Springer Nature, 2019.

Bennett, Deborah: Logic Made Easy, W.W. Norton & Co, 2004.

Bernhardt, Chris: Turing's Vision: The Birth of Computer Science, MIT Press, 2016.

Block, Ned: Troubles with functionalism, Minnesota Studies in the Philosophy of Science 9:261- 325,1978.

Bodur, Aydın: Shannon'a Saygı, Elektrik Mühendisleri Odası,2010.

Bornet, I. G. Gerard: George Boole: Selected Manuscripts on Logic and its Philosophy, Springer Basel AG, 1997, s. 30.

Chaitin, Gregory: Thinking about Godel and Turing: Essays on complexity, 1970-2007,World Scientific Publishing Company, 2007.

Churchland, Patricia&P: Could a Machine Think? , Scientific American Ocak,1990. (Çevrimiçi)http://sils.shoin.ac.jp/~gunji/AI/CR/sciam90couldamac hinethink.pdf, 12 Aralık 2019.

Cohen, Daniel: Equations from God: Pure Mathematics and Victorian Faith (Johns Hopkins Studies in the History of Mathematics), The Johns Hopkins University Press, 2007.

Daniel, Grape: Principles Of Artificial Neural Networks: Basic Designs To Deep Learning, World Scientific, 2019.

Descartes, Rene: İlk Felsefe Üzerine Metafizik Düşünceler, (Çev. Mehmet Karasan), MEB Yayınları, İstanbul,1998.

Elfadel, Ibrahim: Duane S. Boning, Xin Li, Machine Learning in VLSI Computer-Aided Design, Springer, 2019.

Gertner, Jon: The Idea Factory: Bell Labs and the Great Age of American Innovation, Penguin, 2012.

Gödelek, Kamuran: Zihin Felsefesi, Eskişehir: Anadolu Üniversitesi Yayınları, 2011.

Grier, David Alan: When Computers Were Human, Princeton University Press, 2013.

Gür, Bekir: Leibniz’in Matematik(sel) Düşüncesi, MatematikDünyası, 2005 Güz.

Hardie, D.G.: Biochemical Messengers: Hormones, Neurotransmitters and Growth Factors, Springer Science & Business Media, 1991.

Hays, Sean: Jason Scott Robert, Clark A. Miller, Ira Bennett,Nanotechnology, the Brain, and the Future, Springer Science & Business Media, 2012.

Hebb, Donald: The Organization of Behavior, Psychology Press, 1949.

Herbert, Joe: The Minder Brain: How Your Brain Keeps You Alive, Protects You from Danger, and Ensures that You Reproduce, World Scientific, 2007.

Hinton, Geoffrey: “Matrix Capsules With EM Routing”, ICLR, 2018.(Çevrimiçi)https://openreview.net/pdf?id=HJWLfGWRb, 12 Aralık2019.

Hofstadter,DouglasR: Aklın G'özü: Benlik ve Ruh Üzerine Hayaller ve Düşünceler (Çev: Füsun Doruker), Boğaziçi Üniversitesi Yayınevi, 2005.

Hiller,D.E.Hyndman: AnalogandHybridComputing,PergamonPress,1970.

Ifrah, Georges: Rakamların Evrensel Tarihi: Akdeniz Kıyılarında Hesap, Tubitak Yayınları, 1995.

Jefferson, G.: The Mind of Mechanical Man, Lister Oration for 1949, British Medical Journal, 1949.

John,Locke: İnsan Anlığı Üzerine Bir Deneme, (çev. Vehbi Hacıkadiroğlu), Kabalcı Yayınevi, İstanbul, 1992.

Kamer, Vedat: Feshedilebilir Akılyürütme, VI. Mantık Çalıştayı Kitabı, Mantık Derneği Yayınları, İstanbul, 2016(Çevrimiçi) https://calistay.mantik.org.tr/wp- content/uploads/2017/01/VI-Mantik-Calistayi- Kitabi_DusukCozunurluk.pdf, 12 Aralık 2019. “Yapay Zekâ ve Monoton-olmayan Mantık”,İstanbul Üniversitesi, 2009. (Çevrimiçi) http://acikerisim.istanbul.edu.tr/bitstream/han dle/123456789/27879/45445.pdf?sequence=1 &isAllowed=y, 12 Aralık 2019.

Khan, Salman: Rahmani, Syed Afaq Ali Shah, Mohammed Bennamoun, A Guide to Convolutional Neural Networks for Computer Vision, Morgan & Claypool Publishers, 2018.

Kouneiher, Joseph: Foundations of Mathematics and Physics One Century After Hilbert: New Perspective, Springer, 2018.

Leibniz, G. Wilhelm: G. W. Philosophical Essays (Çev: R. Ariew & D.Garber), Hackett Publishing Company, 1989. New Essays On Human Understanding, (Der. P. Remmant J. Bennet), New York: Cambridge University Press, 1997.

Lin, Min : “Network In Network”, Cornell University, ICLR 2013.

Mahfoud, Tara: Sam McLean, Nikolas Rose, Vital Models: The Making and Use of Models in the Brain, Academic Press, 2017.

Martin, Eddie: Computer Jargon Dictionary and Thesaurus, Beecroft Publishing, 2006.

McCarthy, John: "Programs with Common Sense", Teddington Conference on the Mechanization of ThoughtProcesses, 1958. (Çevrimiçi) http://www-formal.stanford.edu/jmc/mcc59.pdf, 12 Aralık 2019.

McFarland, T. D.: Expert Systems in Education and Training, Technology, Educational 1990.

Mehra,Jagadish: Einstein, Hilbert, and the theory of gravitation, D.Reidel Publishing Company, 1974.

Menabrea, L. F.: Sketch of The Analytical Engine Invented by Charles Babbage, Çev. Ada Lovelace, 1842. (Çevrimiçi)http://www.fourmilab.ch/babbage/sketch.html#Note G, 12 Aralık 2019.

Munakata, T.: Fundamentals of the New Artificial Intelligence, Springer Science & Business Media, 2008.

Nahin, Paul J: The Logician and the Engineer, How George Boole and Claude Shannon Created the Information Age,Princeton University Press, 2013.

Nagel, Thomas: What Is It Like to Be a Bat? Philosophical Review, 83 (4), 1974. Her Şey Ne Anlama Geliyor? (Çev. H. Gündoğdu). İstanbul: Paradigma Yayınları, 2004. Zihin ve Evren (Çev. Ö. Ç. Aksoy), İstanbul: Jaguar Kitap, 2015.Bernoulli Sayıları Üzerine, Matematik Dünyası,2009.

A Brief History of Computing, Springer Science & Business Media, 2012.

The Emperor's New Mind: Concerning Computers, Minds, and the Laws of Physics, Oxford University Press, 2016.

A Logical Calculus of Ideas Immanent in Nervous Activity,

1943. (Çevrimiçi)

https://www.cs.cmu.edu/~./epxing/Class/10715/reading/McC ulloch.and.Pitts.pdf, 12 Aralık 2019.

Theory Of Computation, Technical Publications, 2009.

Systematic Introduction to Expert Systems: Knowledge Representations and Problem-Solving Methods, Springer Science & Business Media, 2012.

Milestones in Computer Science and Information Technology, Greenwood Publishing Group, 2003.

Nesin, Ali:

O'Regan, Gerard:

Penrose, Roger:

Pitts, Walter:

Puntambekar, A.A.: Puppe, Frank:

Reilly, Edwin :

Roselló, Joan: Göttingen and the Development of ModernMathematics, Cambridge Scholars Publishing, 2019.

Rosenblatt,Frank: The Perceptron A Perceiving And Recognizing Automaton, 1957.

Ruiz, Francisco: Pablo Suau Pérez, Boyán Ivanov Bonev, Information Theory in Computer Vision and Pattern Recognition, Springer-Verlag London, 2009.

Russell, Stuart: Peter Norvig, Ernest Davis, Artificial Intelligence: A Modern Approach, Prentice Hall, 2010.

Salcedo, Jesus: Machine Learning for Data Mining, Packt Publishing, 2019.

Samuel, Arthur L.: Some studies in machine learning using the game of Checkers, IBM Journal of Research and Development, 1959.(Çevrimiçi)http://www.cs.virginia.edu/~evans/greatworks/samuel1959.p df

Say, Cem: 50 Soruda Yapay Zekâ, Bilim ve Gelecek Kitaplığı,2018.

Sayan, Erdinç: Bilinç, Felsefe Ansiklopedisi, c. 2, (ed. Ahmet Cevizci),Etik Yayınları, İstanbul, 2004.

Searle,John: Minds, Brains, and Programs, The Behavioral and Brain Sciences, 1980.

Sejnowski, Terrence: The Deep Learning Revolution, The MIT Press Cambridge, 2018.

Sertöz, Ali Sinan: Önce Matematik Vardı: George Boole, Bilim veTeknik, Aralık 2015.

Shannon, C. E.: A mathematical theory of communication, The Bell System Technical Journal- Nokia Bell Labs, 1948.

Shen, Alexander: Algorithms and Programming: Problems and Solutions, Springer Science & Business Media, 2011.

Shepherd, Gordon M.: Foundations of the Neuron Doctrine, Oxford University Press, 2015.

Soni, J & Goodman, R: A Mind at Play: How Claude Shannon Invented the Information Age, Simon and Schuster,2017. Zihnin Yeniden Keşfi, Çev. M. Macit, İstanbul: Litera Yayıncılık, 2004. Bilincin Gizemi, Çev. İ. K. İçyüz, İstanbul: Küre Yayınları,2018. Is the Brains Mind a Computer Program? , Scientific American, 1990.

Sra, Suvrit: Sebastian Nowozin, Stephen J. Wright, Optimization for Machine Learning, MIT Press, 2012.

Tomkins, Stephen: The Origins of Humankind, Cambridge University Press, 1998.

Toumey, Chris: Nanotech and the Humanities: An Anthropologist Observes the Science of Atoms and Molecules,Cambridge Scholars Publishing, 2019.

Turing, Alan M:Computing Machinery and Intelligence, Mind 49, 1950, s. 433-460. (Çevrimiçi)https://www.csee.umbc.edu/courses/471/papers/turi ng.pdf, 12 Aralık 2019. On Computable Numbers, With An Application To The Entscheidungsproblem, 1936. (Çevrimiçi)http://www.cs.virginia.edu/~robins/Turing_Paper_193 6.pdf, 12 Aralık 2019.

Alan M. Turing: Centenary Edition, Cambridge University Press, 2012.

Exploring Perceptual Illusions in Deep Neural Networks,Department of Psychology, University of Wisconsin – Madison,https://www.biorxiv.org/content/10.1101/687905v1.full, 12Aralık 2019.

“Santiago Ramon y Cajal ve Nöron Doktrini”, Turk JNeurol, 2015, Sayı:21, s.81-84. (Çevrimiçi)https://www.journalagent.com/tjn/pdfs/TJN_21_3_0. pdf, 12 Aralık 2019.

Derin Öğrenme

T.C.İSTANBUL ÜNİVERSİTESİ SOSYAL BİLİMLER ENSTİTÜSÜ FELSEFE ANABİLİM DALIYÜKSEK LİSANS TEZİ