Muhtemelen zaman zaman fark etmişsinizdir, telefon görüşmesi yaparken karşınızdakinin gerçek sesinden farklı bir ses duyarsınız. Bunun sebebi aslında sesin kodek adı verilen algoritmalar ile kodlanmasıdır. Bu yazımda bunu biraz açıklamaya çalışacağım.

Bir telefon konuşmasında telefonlarımızda bulunan mikrofonlar ortamdaki ses dalgalarını (sinyallerini) en basit deyişle bir diyafram ve bobin düzeneği sayesinde elektrik sinyallerine çevirir. Bu sinyaller analog sinyallerdir ve bu sinyalleri karşı tarafa iletebilmek için dijitalleştirmeye ihtiyaç vardır.

Sesin elektrik sinyaline çevrilmesi
Sesin Elektrik Sinyaline Çevrilmesi

Bu işlem için ilk önce analog sinyali örneklemek gerekir. Belirli süre aralığında analog sinyalin genlik değerleri ölçülür (sampling – örnekleme). Ölçülen bu değerler belirli bir aralığa oturtularak değerler bulunur (quantization – kuantalama). Artık sayısal veriler elimizde olduğuna göre bu değerlerin karşı tarafa iletilmesi gerekecektir. Bu iletimi ikili düzende iletmek için de bir kodlama mekanizmasına ihtiyaç vardır (encoding). Bunu da sağladıktan sonra yukarıdaki işlemler karşı tarafta tersten çalıştırılırsa telefonun hoparlöründen bir ses dalgası çıkarılabilir ve bu sayede ses karşıya iletilmiş olur.

Örnekleme, Kuantalama ve Kodlama Süreçleri

Buraya kadar her şey tamam, peki neden ses farklı iletiliyor? Burada bakmamız gereken iki adet yer var. 

1. Örnekleme 

Analog sinyali dijitale çevirirken belirlenen örnekleme aralığı sesin sürekliliğini belirleyen bir etmendir. Sabit ses sinyallerinde çok fazla kayıp yaşanmazken değişken sinyallerde bu fark hissedilebilir (aşağıdaki grafikte daha açık görebilirsiniz). 

Örnekleme Oranları Karşılaştırması

2. Kuantalama 

Ölçülen genlik değerlerini bir skalaya oturtma işlemidir. Burada da tamamen skalanın genliği önem kazanmaktadır. Örneğin 8 bitlik bir kuantalama 256 adet farklı değer verirken 24 bitlik bir kuantalama 16 milyondan fazla farklı değer elde edilebilir. Aşağıda aynı örnekleme oranında farklı kuantalama oranlarında sinyalin değişimini görebilirsiniz:

Farklı Oranlarda Kuantalama

İnsan sesi frekans aralığı ana kısmı 300-3400 Hz olmak üzere 100 – 7000 Hz aralığındadır. Nyquist teoremine göre örneklemenin minimum bozulma ile yapılabilmesi için örnek sayısı maksimum frekansın minimum iki katı olmalıdır.  

Geleneksel telefon görüşmelerinde örnekleme yapılan frekans aralığı olarak 300-3400 Hz bandı kullanılır. Örneğin maksimum frekans 4000 Hz olarak alınırsa örnekleme sayısı saniyede 8000 adet olmalıdır. Bu da bize 8KHz * 8 bit / örnek = 64 Kbps değerini verir. Bu da geleneksel telefon sistemlerinde kullandığımız ses iletim teknolojisinin kullandığı bant genişliğine eşittir. Bu tür görüşmelerde insan seslerinin üst frekansları karşıya iletilmediği için sesler daha boğuk şekilde duyulur (Ör. F,S,Z gibi tiz sesleri daha çok içeren harflerde bozulmalar meydana gelir).

Şayet maksimum frekans 7000 Hz olarak alınsaydı bu durumda örnekleme sayısı saniyede 14000 olacaktı ve mesela 24 bitlik bir kuantalama kullanıldığında 336Kbps lik bir bant genişliğine ihtiyaç duyulacaktı. Bant genişliği kullanımı yükselecek, fakat sesler daha normale yakın halde iletilecekti (sıkıştırma algoritmaları kullanmadığımızı varsayıyoruz).

Kodek (Codec) Nedir?

Co-mpression (sıkıştırma) ve dec-ompression (açma) kelimelerinin birleşiminden oluşur.Yukarıda bahsedilen metotlar ve sıkıştırma algoritmaları gibi başka bileşenlerin de bir araya gelmesi ile kodek oluşur. Aşağıda bilinen kodeklerin özelliklerinin olduğu bir tabloyu görebilirsiniz: 

Örnek Kodekler ve Özellikleri

HD Ses Kalitesi Nedir?

HD ses kalitesi temelde biraz önce bahsettiğimiz örneklemenin daha geniş aralıkta yapıldığı bir ses iletim teknolojisidir. Daha yüksek bant genişliği ihtiyacı olduğu için IP tabanlı sistemlerde kullanılabilmektedir. Aynı zamanda uç cihazların da bu algoritmaları (kodek) desteklemesi gerekmektedir. Örneğin yukarıdaki tabloda en altta bulunan G.722 kodeği bu tür bir kodektir. 

Özellikle 4.5G teknolojisine geçilmesi ile birlikte bazı operatörler “HD ses kalitesi” hizmetini duyurdu. Bu aslında biraz önce bahsedilen örnekleme frekans aralığı ile doğrudan alakalı bir durum. HD ses kalitesinde örneklenen frekans bandı 50-7000 Hz aralığında bulunan ve “Wideband”  adı verilen bant aralığıdır. Dolayısı ile sesler daha gerçekçi olarak karşı tarafa iletilir. 

Frekans Bantları ve Açıklamaları

Tabi bunu sağlayabilmek için daha geniş bant genişliğine ihtiyaç vardır. Burada 4.5G’nin nimetlerinden biri olan VoLTE (Voice over LTE) teknolojisi ile çağrı IP tabanlı olarak kurulur. Dolayısı ile TDM’in limitasyonlarından kurtulmuş olunur. Bir de kullanıcı terminallerinin ilgili örnekleme kuantalama ve sıkıştırma algoritmalarını desteklemesi gerekmektedir.