
Bugün için sıradanlaşan; sesli posta, ses tanıma,yapay ses, paket - anahtarlamalı ses gibi bir çok uygulamanın temelinde bu alanda öncülük yapan mühendis James L. Flanagan vardır.
Örneğin Atlas Okyanusu'nun altından geçen ve basit elektrik sinyallerini taşıyan 300 Hz bant genişliğindeki telgraf kablolarını ele alalım ve bunu ses iletimi için kullanalım. 1952'de bu büyük bir problemdi ve teknoloji çok gelişmemişti.
Vocoding olarak adlandırılan ses sıkıştırma teknikleri II. Dünya Savaşı sırasında sesin radyo dalgalarıyla iletilmesi için kullanılmaya başlandı. Fakat iletilen sesin kalitesi yetersizdi.
Sonunda bu iş MIT'den mezun bir öğrenci olan James L. Flanagan'a kalmıştı, çok daha iyi bir fikirle ortaya çıktı. Flanagan ses işaretinden on farklı frekansı alıp iletim için onların değişen genliklerini analog işaretlere dönüştüren vocoding teknolojisini tamamen red etti. Bunun yerine o olayın temeline yöneldi: insan ses sitemi içersinde sesin öğeleri nasıl oluşturuluyor ve tınlama nasıl gerçekleştiriliyordu? Farklı öğeler için tınlama spektrumda farklı noktalarda tepe değerine ulaşmaktadır. İşte bu noktalardaki frekanslara formant frekanslar denilmektedir.
İnsan konuşmasında formant frekanslar konuşmacının ağız hareketlerine ve şekillerine bağlıdır. Farklı hareket ve şekillerin kombinasyonları farklı formantlara sebep olmaktadır. Flanagan bunlardan üç tanesini ele aldı. Her bir formant için frekanstaki değişimleri kodlayarak eski yönteme - sabit pozisyonlu frekanslardaki işaretlerin genliklerini kodlayan - oranla sesi daha etkili ifade edebilen bir yöntem geliştirmiş oldu. Bu tip bir kodlama bahsedilen telgraf hatları üzerinde denenmemiş olsa da ilerisi için bir aşama kaydedilmiş oldu.
Flanagan ayrıca insan kulağının kodlama hatalarını ne kadar doğrulukta tespit edebileceğini anlamak için deneyler de yaptı. Böylece kendi geliştirdiği ve gelecekteki ses sıkıştırma algoritmaları için mühendislik ölçütlerini de geliştirmiş oldu. Journal of the Acoustical Society of America dergisinin editörüne gönderilen kısa bir mektup bu deneylerin hala en sık talep edilen yayın olduğunu göstermektedir.
Flanagan'ın ses sıkıştırma alanındaki çalışmaları yıllar sonraki bazı ilerlemelerin habercisi oldu. Örneğin doğrusal öngörücü kodlama gibi. Bu yöntemde her bir örnekleme noktasındaki ses işaretinin değeri geçmiş örneklerin kombinasyonundan kestirilmektedir. Bu tip bir kodlama düşük bant genişliğine sahip iletim hattında sesin iletilmesi için kullanılmaktadır - cep telefonları, sesli mesajlar, bilgisayar-tabanlı sesler.
Flanagan'ın çalışmalarına destek olan sonraki fikirler modern otomatik ses tanıma sistemlerinin, MP3 gibi ses sıkıştırma algoritmalarının ve bugünkü VoIP uygulamalarının geliştirilmesine katkıda bulundu. "Wayne Gretzky çok iyi bir hokey oyuncusuydu çünkü o topa değil topun gideceği yere hamle yapıyordu" Florham Park'daki IP ve Ses Servisleri Araştırma Labrotuvarı asbaşkanı Rich Cox'un dediği gibi Jim de aynen böyle biriydi. O noktaya ulaşmak onlarca yılı alsa da Flanagan bazı şeylerin nereye gittiğini önceden görebiliyordu.
Ses teknolojisine katkılarından dolayı Flanagan 2005 IEEE Onur Madalyası ile ödüllendirildi.
Kaynak:
http://www.spectrum.ieee.org/may05/1117