Bilgisayarlı dilbilim

disiplinler arası alan

Bilgisayarlı dilbilim veya hesaplamalı dilbilim, doğal dilin istatistiksel veya kural tabanlı modelleme yöntemleriyle ve hesaplamalı bir perspektif ile inceleyen disiplinler arası bir bilgisayar bilimi alanıdır.

47 popüler haber medyasında farklı duygusallık türlerini ifade eden haber makalesi manşetlerinin yıllık ortalama yaygınlığı.

Geleneksel olarak bilgisayarlı dilbilim, bilgisayarların bilimsel olarak doğal dilin işlenmesine uygulanmasında uzmanlaşmış bilgisayar bilimcileri tarafından gerçekleştirildi. Bilgisayarlı dilbilimciler, genellikle düzenli dillerle ilgilenen bilim insanları, hedef dilde uzmanları ve bilgisayar bilimcilerini de içerebilen disiplinler arası ekip üyeleri olarak çalışırlar. Bilgisayarlı dilbilim çalışmaları genel olarak; dil bilimciler, bilgisayar bilimcileri, yapay zeka uzmanları, matematikçiler, mantıkçılar, filozoflar, bilişsel bilim insanları, bilişsel psikologlar, psikologlar, antropologlar ve nörologların birlikte görevleri paylaşmalarına dayanır.

Bilgisayarlı dilbilimin teorik ve uygulamalı bileşenleri vardır. Teorik bilgisayarlı dilbilim, dil bilimlerinde ve bilişsel bilimde yer alan teorik konulara yoğunlaşır. Uygulamalı ve bilgisayarlı dilbilim ise, insan dilinin kullanımının modellemesine ve pratik çıktısına odaklanır.[1]

Bilgisayarlı dilbilim birliği (Association for Computational Linguistics), bilgisayarlı dilbilimi şu şekilde tanımlamaktadır: "Bilgisayarlı dilbilimciler, çeşitli dilsel fenomenlerin hesaplama modellemelerinin ifadesiyle ilgilenmektedirler."[2]

Kökeni değiştir

Bilgisayarlı dilbilim genellikle yapay zeka sınıfında gruplandırılır, ancak aslında yapay zekanın geliştirilmesinin öncesinde de, bu doğrultuda çalışmalar mevcuttur. Bilgisayarlı dilbilim, 1950'lerde Birleşik Devletler'de, yabancı dildeki metinleri, özellikle Rus bilimsel dergilerinden İngilizce'ye otomatik olarak çevirmek için bilgisayarı kullanmak suretiyle ortaya konan çabalardan doğmuştur.[3] Bilgisayarlar, aritmetik hesaplamaları, insanlara göre çok daha hızlı ve daha doğru yapabildikleri için, dilin işlenmesine başlanmasından ziyade kısa zamanda hesaplama yeteneği ön plana çıkmış ve salt hesaplama işlevi düşünülmüştür.[4] Daha sonraları hesaplamalı ve niceliksel yöntemler, daha önceki modern dil formlarının yeniden yapılandırılması ve modern dillerin, geleneksel dil ailelerinin altında gruplandırılması için kullanılmaktadır. Bununla birlikte, biyolojik araştırmalardan, özellikle de gen haritalandırmasından alınan kavramları ödünç alan son zamanlardaki disiplinlerarası çalışmalar, daha karmaşık analitik araçlar sayesinde daha güvenilir sonuçlar üretmektedir.[5]

Makine çevirimi(mekanik çevirim olarak da bilinir) yaklaşık ve doğru tercümeler üretemediğinde, insan dillerinin otomatik olarak işlenmesi, başlangıçta varsayıldığından çok daha karmaşık biçimde kabul edildi. Bilgisayarlı dilbilim, dil verilerini akıllıca işlemek için algoritma ve yazılım geliştirmeye ayrılan yeni alanın adı olarak doğmuştur. Yapay zeka 1960'larda ortaya çıktığında, bilgisayarlı dilbilim alanı, insan seviyesinde anlama ve doğal dillerin üretimi ile uğraşan yapay zekanın alt bölümü haline geldi.

Bir dili diğer bir dile çevirmek için, her iki morfolojiyi (sözcük formlarının grameri) ve söz dizimini (cümle yapısının grameri) içeren her iki dilin gramerinin iyice anlaşılması gerektiği gözlemlendi. Söz dizimini anlamak için anlam bilimi ve sözlüğü yani kelime hazinesi ve hatta dil kullanımının pratikleri hakkında izah gerekliydi. Bu nedenle, diller arasında çeviri yapmak için bir çaba olarak başlayan dürtü, bilgisayarları kullanarak doğal dilleri nasıl temsil edileceğini ve nasıl işleneceğini anlamaya yönelik bütüncül bir disipline dönüşmüştür.[6]

Günümüzde bilgisayarlı dilbilim kapsamındaki araştırmalar, sayısal dilbilim bölümlerinde, bilgisayarlı dilbilim laboratuvarlarında, bilgisayar bilimleri bölümlerinde ve dilbilim bölümlerinde yapılmaktadır.[7] Bilgisayarlı dilbilim alanında yapılan bazı araştırmalar, çalışma konuşması veya metin işleme sistemleri yaratmayı amaçlarken diğerleri insan-makine etkileşimine izin veren bir sistem yaratmayı amaçlamaktadır. İnsan-makine iletişimi için kullanılan programlara "konuşmanın aracıları" denilir.[8]

Kaynakça değiştir

  1. ^ Hans Uszkoreit. What Is Computational Linguistics? 1 Aralık 2017 tarihinde Wayback Machine sitesinde [https://web.archive.org/web/20171201094609/http://www.coli.uni-saarland.de/~hansu/what_is_cl.html arşivlendi. [1]] Department of Computational Linguistics and Phonetics of Saarland University
  2. ^ "Arşivlenmiş kopya". 9 Aralık 2016 tarihinde kaynağından arşivlendi. Erişim tarihi: 30 Ocak 2017. 
  3. ^ John Hutchins: Retrospect and prospect in computer-based translation 14 Nisan 2008 tarihinde Wayback Machine sitesinde arşivlendi.. Proceedings of MT Summit VII, 1999, pp. 30–44.
  4. ^ Arnold B. Barach: Translating Machine 1975: And the Changes To Come.
  5. ^ T. Crowley., C. Bowern. An Introduction to Historical Linguistics. Auckland, N.Z.: Oxford UP, 1992. Print.
  6. ^ Natural Language Processing 10 Ağustos 2017 tarihinde Wayback Machine sitesinde arşivlendi. by Liz Liddy, Eduard Hovy, Jimmy Lin, John Prager, Dragomir Radev, Lucy Vanderwende, Ralph Weischedel
  7. ^ Computational Linguistics – Department of Linguistics – Georgetown College
  8. ^ Jurafsky, D., & Martin, J. H. (2009). Speech and language processing: An introduction to natural language processing, computational linguistics, and speech recognition. Upper Saddle River, N.J: Pearson Prentice Hall.