|
Bilgisayarla Görme
Ahmet IŞIK [email protected] |
Sesli Dinle
|
![]() Muhteşem göz mekanizması ve görme ![]() Göz optiği, fotoğraf makinesi üzerinden daha kolay anlatılabilir. Fotoğraf makinesindeki gibi bir mercekler sistemi, ışığın göze girmesine izin verilen bir açıklık (pupilla), bir de fotoğraf filmine karşılık gelen retina ihtiva eder. Gözler, nesnelerin mesafelerine göre beyin tarafından anbean kontrol edilen bir 'uzak ve yakına uyum mekanizması'na sahip kılınmıştır. İnsanlar bunun hiç farkında değillerdir. Gözler birkaç santimetre yakınındaki bir cisme bakarken, başın bir hareketiyle ânında çok uzaklardaki dağlara da odaklanabilir. Bu esnada görüntüde bir bozulma olmaz. Buna gözün uzağa-yakına uyumu (akkomodasyon) denir. Retinada, renkli görmede görevli koni şeklinde üç tip reseptör hücresi mevcuttur. Bunlar; sarı, yeşil ve kırmızı renkleri algılayacak ve bunlardan çeşitli yoğunluklarda karışımlar yaparak bütün renkleri idrâk edebilecek hususiyette yaratılmıştır. 400–700 nm arasındaki dalga boylarına denk gelen ışığın görülmesi ve algılanması mükemmeldir. Her bir dalga boyundaki ışık, bu üç renk konisini farklı nispetlerde uyarmaktadır. Her koninin uyarılma oranlarına karşılık gelen renkler, beyne yaratılıştan kodlanmıştır. Beynin görme merkezinde renk, her bir dalga boyundaki ışık huzmesinin hangi oranlara karşılık geldiği karşılaştırılarak algılanır. Meselâ 580 nm dalga boyundaki turuncu ışık; kırmızı konileri % 99, yeşil konileri % 42, mavi konileri % 0 nispetinde uyarır. Bu uyarılma nispetleri 99:42:0 şeklinde kodlanırsa, beyin açısından turuncu ışığı temsil eder. Aynı şekilde mavi ışığın beyinde algılanması için 0:0:97 şeklinde bir kod gereklidir; benzer şekilde yeşil ışığın kodu 31:67:36; sarı ışığın kodu da, 83:83:0'dır. Bu kodların birinde hafif bir değişiklik olsa renk tonu değişir; meselâ sarı ışığın kodu 83:83:0 yerine 83:83:01 olsa, sarının farklı bir tonu algılanır. Nesnelerin görülmesi, göz ve beynin uyum içinde çalıştırılmasıyla sağlanır. Beynin görmedeki vazifeleri: • İki ayrı gözün retinasından gelen sinyallerin üst üste çakıştırılması • Bu görüntülerin karşılaştırılarak derinliğin algılanması • Çizgi ve sınırların fark edilmesi • Görme merkezinde renk analizi • Beyinde parlaklığın algılanması (Parlaklık seviyesinin nasıl bir mekanizmayla tespit edildiği henüz kesin olarak anlaşılamamıştır) • Gözbebeği çapının kontrolü • Göz hareketlerinin kaslarla kontrolü • Retinadan gelen görüntünün parçalanıp tekrar birleştirilmesi • Ters görüntünün düzleştirilmesi • Kör noktaya düşen kısımların doldurulması ve boşlukların önlenmesi Gözler, Rabb'imizin Kur'ân-ı Kerîm'de; "De ki: 'Sizi inşa eden (yaratan), size kulak, gözler ve gönüller veren O'dur. Ne az şükrediyorsunuz?' (Mülk Sûresi, 23) âyetiyle bizleri şükrünü edâya davet ettiği organlardır. Görmenin gerçekleştirilmesinde, gözle beyin işbirliği içinde çalıştırılmaktadır. Beynin dünyaya açılan penceresi olan göz, aslında görmenin oluşumunda beyne yardımcı olmak üzere yaratılmıştır. Teknik olarak bilgisayarla görme ![]() Bilgisayarla görmede, resim hakkında bir değerlendirmede bulunabilmek için, resme ait piksel ve renk bilgileri kullanılır. Resim üzerindeki küçük kareler şeklinde tarif edilebilecek piksellerin her birinin renk değeri vardır. Meselâ resmin parlaklığını yükseltmek için, her bir pikselin değeri belli nispette artırılır. Bilgisayarın, resmin muhtevasıyla alâkalı tahminde bulunması da mümkündür. Bu işlemde, mevcut resimle ilgili bilgilerle daha önce sisteme tanıtılmış misâller, sun'î zekâ teknikleri kullanılarak karşılaştırılır ve böylece bilgi çıkarmaya çalışılır. Resimlerdeki bozuklukları giderme, kenar çıkarma, resmin kontrastını artırma, resmi büyütüp küçültme vb. uygulamalar görüntü işleme uygulamalarına verilebilecek misâllerdendir. Meselâ küçültme veya büyütme işleminde resimden bazı pikseller atılır veya resme bazı yeni pikseller ilâve edilir. Birbiriyle bağlantılı iki resmin birleştirilmesi şöyle gerçekleştirilir: Her iki resimdeki bazı ortak noktalar bulunur ve bunlar örtüştürülerek resimler birleştirilir. Bu işlem görüntü işlemede zaman alıcı ve maliyetli bir işlemdir. Bu noktada, insanın iki gözüyle elde ettiği görüntülerin, beyinde hiçbir gayret sarf edilmeden otomatik olarak tek bir resim hâline getirilmesi ve bu işlemin bize hiç hissettirilmeden her ân defalarca gerçekleştirilmesi gerçekten üzerinde düşünülmesi gereken muhteşem bir hâdisedir. Bilgisayarla görme uygulamalarına misâller Bilgisayarla görme sahasında son yıllarda büyük gelişmeler yaşanmıştır. Otomatik geçiş sistemleri (OGS) ile araç plâkalarının tanınması, kişinin avuç içi resminden tanınması, tıbbî görüntülerden otomatik olarak hastalık teşhisi ve takibi (meselâ beyin tümörlerinin tespiti), doku ve hücre analizinde belli tip hücrelerin otomatik olarak sayımı, güvenlik uygulamalarında parmak izi veya yüz tanıma, oto yollarda aşırı hız yapan araçların tespiti, uzay araştırmalarında insansız araçların çevrelerindeki nesneleri algılaması, savaşlarda hedef belirlenmesi, uydular vasıtasıyla çekilen fotoğrafların otomatik analizi ile harita üretimi, meteorolojik bilgilerin ve gezegenimizdeki değişikliklerin tespiti, eğlence endüstrisinde oyunlarda sun'î görüntü üretimi bu alanda verilebilecek misâllerden bazılarıdır. Hattâ insan gözlerinin kabiliyet sahası dışında kalan bazı fonksiyonlar da bu yolla gerçekleştirilebilmektedir. Meselâ gece görüş dürbünleri sayesinde görüntü bilgileriyle beraber başka bilgilerin de kullanılmasıyla hedefler tespit edilebilmektedir. Bilgisayarla görme teknikleri birçok açıdan henüz gelişme aşamasındadır. Meselâ, yaşadığımız dünyada uzaklık boyutu, otomatik olarak algılanır ve beynimizde biz farkında olmadan işlenir; bu sayede dünyayı üç boyutlu tanıma imkânı elde ederiz. Bilgisayarlar ise, kâğıt üzerindeki (iki boyutlu) görüntünün aslında üç boyutlu bir dünyadan çekildiğini algılayamamaktadır. Üç boyutlu görüntüler, çok büyük bir bilgi yığınının analizini gerektirdiğinden, işlenmesi çok daha zordur ve pratik açıdan uygulanabilirliği sınırlıdır. Ancak ileride yeni bazı yazılımlar geliştikçe, belki insanın görmesine benzer (üç boyutlu) görüntüler yaygın hâle gelebilecektir. İnsanın görme sistemi söz konusu olduğunda ise boyut, uzaklık gibi değişkenler, hiçbir karmaşıklık ve yük getirmeden bize bahşedilen görme sistemi ile algılanmaktadır. Öyle ki, bir insanın sabahları uyandığında görebilmek için yapması gereken tek şey, gözlerini açmaktır. Bunun dışında en ufak bir gayret göstermesi gerekmez. Görmenin fizyolojik muhtevası ve beyinle işbirliği içinde gerçekleştirilen görme/tanıma göstermektedir ki, beyin ve diğer bazı organlarla bağlantılı şekilde çalıştırılan gözler, son derecede girift ve hikmetli mekanizmalarla bezenmiştir. Yüce Yaratıcı'nın görme hususunda bize bahşettiği kolaylık, görme işleminin basit bir hâdise olduğu mânâsına gelmez. Bilgisayarla görme, sun'î zekâ gibi teknolojik uygulamalar ise, beyinden ve görme fonksiyonlarından ilham alınarak yapılmaktadır. Kaynaklar - Computer Imaging, Scott E. Umbaugh, CRC Press Book, 2005, sayfa 3-87 |
|





