Prof. Dr. Bülent ÖZKAN » Turkish Corpus

“Derlem Tabanlı Sözlükbilim Çalışmaları” Konulu Seminer

Bülent Özkan — Sun, 31 May 2015 11:47:56 +0000

Türk Dil Kurumu uzman ve uzman yardımcılarına yönelik olarak düzenlenen Sözlük Bilimi Semineri 26 Ocak 2015 tarihinde gerçekleştirildi. Seminerde, sözlük biliminin temel sorunları ele alındı ve bu sorunlar için çözüm yolları tartışıldı. Seminere konuşmacı olarak Eskişehir Osmangazi Üniversitesinden Prof. Dr. Erdoğan Boz, Sakarya Üniversitesinden Prof. Dr. Engin Yılmaz, Mersin Üniversitesinden Doç. Dr. Bülent Özkan ve Ankara Üniversitesinden Doç. Dr. Paşa Yavuzarslan katıldı.

Seminerin ilk sunumunu Prof. Dr. Erdoğan Boz yaptı. “Basılı Sözlüklerden Elektronik Sözlüklere” başlıklı sunumuyla Boz, basılı sözlüklerden elektronik sözlüklere geçiş süreci üzerine genel bir değerlendirme yaparak bilgisayar ve elektronik aletlerin yaygınlaşması ve İnternet’in hayatımıza hâkim olmasıyla oluşan modern (yeni) hayatla, elektronik sözlüklerin devrinin başladığını ve basılı sözlüklerin devrinin kademeli olarak kapandığını belirtti. Boz, elektronik sözlüklerin dil bilimi, bilgisayarlı dil bilimi, dil ve edebiyat, terim bilimi, halk bilimi, güzel sanatlar, animasyon, sinema ve televizyon gibi birçok alanı ilgilendiren disiplinler arası bir çalışma alanı olduğunun altını çizdi. Boz’un altını çizdiği bir diğer önemli nokta da kuramsal sözlük bilimi alanında alt yapının çok eksik olduğu ve bu konuda alınması gereken çok mesafe olduğudur. Boz, sözlük bilimi çalışmalarında kuramsal çalışmalarla birlikte ISO standartlarına uyum sağlanmasının, kurumsal denetimin yapıldığı ve eleştiri ortamının oluşturulduğu bir sözlük hazırlanmasının, sözlük bilimi araştırma ve uygulama merkezlerinin açılmasının, sözlük bilimi alanında yayın yapacak bir derginin olmasının ve sözlük bilimi kuramının oluşturulmasının gerekliliğini belirterek konuşmasını sona erdirdi.

İkinci sunum Doç. Dr. Bülent Özkan tarafından yapıldı. “Elektronik Sözlükler ve Derlem Tabanlı Sözlük Çalışmaları” başlıklı sunumunda Özkan, bugüne kadar yapılan sözlük oluşturma çalışmalarının tanık toplamak, kişisel bilgilere dayanmak, fiş indeksi oluşturmak vb. yaklaşımlarla yapıldığını ancak bugüne bakıldığında bu yaklaşımların yerlerini bilişim teknolojilerinin paralelinde yeni birtakım yöntem ve yaklaşımlara bıraktığını belirtti. Derlemleri, bir dili dil bilimsel ölçütlere göre örneklemek amacıyla o dile ait yazılı ve sözlü metinlerden seçilerek standartlara göre düzenlenen metin parçalarının bütünü olarak tanımlayan Özkan, derlem oluşturulurken dikkat edilmesi gereken ölçütlerden ve derlem oluşturma süreçlerinden söz etti. Sözlük bilimi uygulamalarında da belirli bir dilde oluşturulmuş derlemlerden veri çıkarımında standartlaşmış birtakım araç ve yöntemlerin kullanıldığını, bunların en yaygın kullanılanlarının sözcük sıklığı çıkarımı ve bağımlı dizin oluşturma olduğunu dile getirdi. Özkan, bugün için sözlük bilimi çalışmalarının artık derlemler olmaksızın yürütülemeyeceğini, Türkçenin söz varlığının öncelikli olarak derlem dil bilimi yöntemleriyle yeniden yapılandırılması gerektiğini ve uluslararası alanda Türk sözlükçülüğünü ileriye taşımak için çalışmaların üst düzey hedefler belirlenerek yürütülmesi zorunluluğunu dile getirerek konuşmasını bitirdi.

Öğleden sonraki ilk sunumu Prof. Dr. Engin Yılmaz yaptı. “Sözlük Hazırlamada Temel Ölçütler: Hedef Kitle ve Amaç” adlı konuşmasında sözlük hazırlamanın ilk aşamasının «amacın belirlenmesi» olduğunu; amaç, bir dilin bütün sözvarlığını ortaya koymaksa buna uygun bir çalışma yapılması gerektiğini; belli bir düzeydeki öğrenciye seslenmekse, sözvarlığının sınırının ona uygun düzenlenmesi gerektiğini belirtti. Genel dile ilişkin bir sözlük mü hazırlanacağı, yoksa terim sözlüğü, deyimler sözlüğü gibi özel alan sözlüklerinin mi hazırlanacağının amaç belirleme aşamasında kesinleştirilmiş olması gerektiğini dile getirdi. Ayrıca sözlüğün hangi hedef kitleye sesleneceğinin belirlenmesinin de diğer aşamaların buna uygun olarak ilerlemesi açısından önemli olduğunu ekledi. Sözlüğün eş zamanlı mı art zamanlı mı hazırlanacağının tespitinin de önemli bir diğer etken olduğunu belirtti. Konuşmasının ikinci bölümünde de terim sözlükleriyle ilgili sorunları ele aldı. Terim sözlükleri hazırlanırken ele alınacak en önemli noktanın terimlerin nasıl yapıldığı, nasıl tanımlandırıldığı, örneklerin yeterli ve yerinde olup olmadığının tespiti olduğunu ekledi.

Dördüncü ve son sunum ise Doç. Dr. Paşa Yavuzarslan tarafından yapıldı. Yavuzsarslan,“SözlüklerdeMadde Başlarına Dair Bilgi Kategorileri” adlı sunumda bir sözlüğün mikro yapısı olarak adlandırılan dilsel kategorilerin neler olduğu ve bunların Türk Dil Kurumu sözlüğünde nasıl sunulduğuyla ilgili açıklamalarda bulundu. Yazım ve sesletim bilgisinin, biçim bilgisinin, söz dizimi bilgisinin ve özellikle eylemlerin, sıfatların ve ilgeçlerin istem ve üye yapısının, sözcük türlerinin, bağlam ve kullanım bilgisinin sözlükte gösterilmesigerektiğinden bahsetti.

Seminer, uzman ve uzman yardımcılarının çeşitli soru ve görüşleriyle katıldığı tartışma bölümüyle sona erdi.

(Kaynak:http://tdk.gov.tr/index.php?option=com_content&view=article&id=548&Itemid=74)

EŞDİZİM SÖZLÜĞÜ RESMİ AÇILIŞ TÖRENİ

Bülent Özkan — Mon, 03 Nov 2014 19:57:11 +0000

TÜRKİYE TÜRKÇESİNİN EŞDİZİM SÖZLÜĞÜ RESMİ AÇILIŞ TÖRENİ

TÜBİTAK-SOBAG – 114R033 “Türkiye Türkçesinde Fiilimsiler”

Bülent Özkan — Thu, 09 Oct 2014 10:51:16 +0000

TÜBİTAK-SOBAG – 114R033 “Türkiye Türkçesinde Fiilimsiler”. Mersin. [Yürütücü].

Proje Özeti

Türkçeye anlatım gücü ve kıvraklığı kazandıran, anlatılanları kısa yoldan aktarmayı sağlayarak gereksiz tekrarları önleyen, aktarılmak istenilen düşüncenin iletilmesinde kolaylık sağlayan ve sözdizimsel olarak tümceleri akıcı, kolay biçimde birbirine bağlayan fiilimsiler kullanım yoğunluğu açısından Türkçede önemli bir yer tutmaktadır.

Projenin amacı, Türkiye Türkçesinde farklı dilbilgisi terimleriyle karşılansa da genelde tüm araştırmacıların üzerinde uzlaştıkları isim-fiil, sıfat-fiil ve zarf-fiil olarak kavramlaştırılan fiilimsi/eylemsi kategorisinde yer alan dilbilgisel yapıları, derlem dilbilimin ilke ve yöntemleriyle oluşturulmuş 35 milyon (+/-) sözcükbirim içeren bir derlemden biçimsel ve işlevsel nitelikleri ile diğer dilbilgisel görünümleri açısından bütüncül olarak araştırma konusu yapmaktır.

Bu çerçevede projenin amacını, fiilimsilerin morfolojik yapılarını, bu morfolojik yapılardan kaynağını alan işlevlerini, bunlara bağlı olarak fiilimsilerin ana dili ve yabancı dil olarak Türkçenin öğretiminde önceliklerini, bu önceliklere bağlı olarak da fiilimsilerin eşdeğerliliklerini, tabakalara (metin türleri vb.) göre dağılımlarını, dizgesel etiketlerini ve deyim/kalıp ifadelerde kullanımlarını belirlemek şeklinde açıklayabiliriz.

Bu anlamda projenin araştırma soruları ise şu şekilde sıralayabiliriz:

Fiilimsilerin morfolojik yapı özellikleri nasıldır?
Fiilimsi yapılarının işlevsel nitelikleri nelerdir?
Ana dili ve yabancı dil olarak Türkçenin öğretiminde öncelikli fiilimsi kullanımlarının yapı ve işlevleri nelerdir?
Fiilimsilerin işleve bağlı olarak eşdeğerlilikleri nasıldır?
Tabakalara göre (metin türleri vb.) fiilimsilerin dağılımları nasıldır?
Fiilimsilerin dizgesel etiketleri ve deyim/kalıp ifadelerde kullanımları nasıldır?

Yukarıda sıralanan araştırma soruları çerçevesinde araştırma konusu yapılan fiilimsilerin 35 milyon (+/-) sözcükbirim içeren bir derlemden araştırılması, biçimbirimsel çözümlemeler, sıklık dizinleri, sözbiçimler, bağlam içi anahtar sözcük gösterimi ya da bağımlı dizinler, birliktelik kullanımları ve eşdizimlilikler, tanık/örnek dizgeler, sözlükbirimsel veri ve istatistik uygulamalar gibi görünümleri de beraberinde barındırır (Özkan 2013).

Şimdiye kadar fiilimsiler üzerine yürütülmüş olan çalışmalara göz attığımızda (bk. Literatür Özeti) yapılan çalışmaların ya Türkçenin belirli bir kullanım alanını kapsadığını ya da sınırlı metin arşivleri aracılığıyla fiilimsilerin birtakım özelliklerini ortaya koymaya çalıştığını gözlemleriz. Ulaşılmak istenen hedefler ve beklenen çıktıların sağlayacağı katkılar açısından bu projeyle, Türkiye Türkçesinde fiilimsilerin yukarıda sıralanan araştırma soruları çerçevesinde, Türkiye Türkçesini temsil gücü yüksek bir derlem aracılığıyla değerlendirilecek olması çalışmanın özgünlüğü açısından önemlidir. Öte yandan projeyle Türk lehçeleri üzerine yürütülen çok sayıda karşılaştırmalı çalışmada kullanılacak olan Türkiye Türkçesinin bütüncül bir fiilimsi topografyası ortaya koyulmuş olacaktır. Yine, araştırma sorularına bağlı olarak ortaya koyulan sonuçlar, Türkçenin öğretiminde kullanılacak olan önemli veri setleri olarak literatürde yerini alacaktır. Projeyle ulaşılacak olan çıktılar, dilbilimsel çalışmaların tüm alanlarında, hatta makineli çeviri gibi bilişim teknolojileri ile dilbilimim birleştiği alanlarda bile, işlenmiş ve yapılandırılmış veri setleri olarak kullanılma potansiyeline sahiptir.

Ayrıca proje yöntembilimsel anlamda dil çalışmaları paralelinde farklı yaklaşımlar sunmaktadır. Türkçe üzerine yürütülecek olan devam çalışmalarında bu projenin ortaya koyduğu yöntem ve sonuçlar bu anlamda alana önemli katkılar sağlayacaktır.

Project Summary

Verbal is an important concept in Turkish with its usage frequency in that it gives power for expressions; provides a short way to transmit messages; prevents unnecessary repetitions and connects the sentences in fluent ways.

The aim of the project is to search the verbal which has been named with different grammatical names and which have been put into categories as gerund, participles, and verbal adverbs via the corpus. The corpus (including approximately 35 million entries) has been built up in line with the principles of corpus linguistics. The verbal is going to be examined according to syntactic and functional qualities.

On this aspect, the aim of the project can be explained as to identify the morphological structures of verbal; the specific uses of this morphological structures; the importance of verbal in teaching Turkish as both native and foreign language; the distributions of them into strata (different text types etc.); their systematic labels and their use in idioms/patterns.

The research questions of the study are as follows:

How are the morphological structures of verbal presented?
What are the functional properties of verbal structures?
What are the priorities in functional and structural uses of verbal in terms of teaching Turkish as both native and foreign language?
How are the equivalents of verbal regarding the functions?
How are the distributions of verbal in line with strata (text types etc.)?
How are the uses of verbal in systematic labels and idioms/patterns?

The verbal, retrieved from corpus (approximately 35 million words), includes the study of morphemic analyses, frequency lists, word styles, showing the key words in context or dependent structures, collocation uses, evidence-sample sequences, lexicographic data, and statistical applications (Özkan 2013).

When the studies on verbal, which have been conducted so far (see Literature view), are examined, it can be said that the studies include a definite part of Turkish or tries to attach importance to verbal via limited text archives. With its targets and with its expected contributions, the project is authentic with its corpus which can lead to a detailed analysis of the research questions. On the other hand, a total verbal topography, which can be used in many comparative studies with Turkish dialects, is going to be presented. Furthermore, the results are going to be important for literature of teaching Turkish studies. Last but not least, the obtained outcomes have the potential to be used in machine based translation (which combines information technologies and linguistics).

Also, the project presents different methodological approaches. Therefore, this study is expected to have important contributions in Turkish with its methodology and results.

TÜBİTAK-SOBAG – 114E791 “Türkçe için ‘Kendi Kendine Derlem’ Platformu Oluşturma”

Bülent Özkan — Tue, 09 Sep 2014 06:00:42 +0000

TÜBİTAK-SOBAG – 114E791 “Türkçe için ‘Kendi Kendine Derlem’ Platformu Oluşturma”. Mersin [Yürütücü].

Proje Özeti

Bu projenin amacı, Türkçe üzerine çalışan dil/dilbilim araştırmacıları için araştırmacıların araştırma sorularına bağlı olarak biçimlendirilebilen, araştırmacıya özel, esnek, kolay ulaşılabilir, veri tabanı destekli ve bu çerçevede araştırma sonuçlarının sağlıklı bir şekilde raporlanabildiği bir derlem platformu geliştirmektir.

Bilindiği üzere batı dilleri için geliştirilmiş olan metin işleme/derlem yazılımları o dillere özgü standart birtakım veri işleme özelliklerine sahiptir. Türkçe için kısmen kullanılabilen söz konusu yazılımlar, Türkçe karakter desteği sunabilmelerine karşın bu yazılımların en büyük eksikliği, oluşturuldukları diller de dahil olmak üzere, araştırma sorularına bağlı olarak işlenen verilerin standart olması, ortaya çıkan raporların saklanamaması ve amaca uygun olarak düzenlenememesidir. Bu yazılımların belirli alanlarda özelleşmiş olmaları da söz konusu yazılımların eksiklikleri olarak değerlendirilebilir. Örneğin, AntConc, WordSmith Tools, MonoConc Pro, TextStat, Nooj benzeri sık kullanılan paket yazılımlar sıklık, bağımlı dizin, anahtar sözcük gösterimi, n-gram hesaplama, eşdizimlilik hesaplama gibi geliştirildikleri diller için çıktılar verebilmektedir. Kısmen de olsa bu çıktılar metin belgeleri olarak dışa aktarılabilmekte ve sonuç olarak araştırmacı metin yığınlarından elde edilmiş ancak ayrıştırılmamış, filtrelenmemiş başka bir metin yığını ile karşı karşıya kalmaktadır. Söz konusu paket yazılımların bir diğer olumsuz yönü farklı işletim sistemlerine özgü olmalarıdır. Her ne kadar paket yazılımların UNIX, Mac, Windows gibi farklı işletim sistemleri için sürümleri mevcutsa da bu durum programlara erişimi ve kullanımını genellikle zorlaştırabilmektedir.

Oysa dil/dilbilim çalışmaları bugün daha ayrıntılı araştırma sorularına cevap arama eğilimindedir. Türkçe üzerine yürütülen derlem çalışmalarının sınırlılığı ve gün geçtikçe derlem oluşturma ve derlem dilbilim yöntemleriyle Türkçeyi değerlendirme eğiliminin de arttığı bir gerçektir. Ayrıca söz konusu metin işleme/derem yazılımlarını kullanmayı öğrenmek bile başlı başına bir iş olarak araştırmacıların karşısında durmaktadır. Diğer taraftan her dilbilimciden derlem oluşturma/işleme gibi özel bir alana dair yazılım bilgisi edinmesi de pratik bir yaklaşım gibi görünmemektedir. Bu anlamda kullanıcı dostu, kolay erişilebilir, araştırma sorularına bağlı olarak geliştirilebilen esnek bir platforma ihtiyaç vardır. Kullanıcı dostu ve sadece bir tarayıcı (browser) aracılığıyla oluşturulacak olan Türkçe için “Kendi Kendine Derlem Platformu” (KKDP) söz konusu tüm olumsuzlukları kullanıcının yararına dönüştürebilecektir.

Önerilen “Kendi Kendine Derlem Platformu” her geçen gün geçerliliği artan bir uygulama alanı olan derlem dilbilimin ilke ve yöntemlerini kuramsal ve uygulamalı açıdan temel alarak oluşturulacaktır. Bu çerçevede proje dilbilimcilere var olan standart derlem çıktıları vermenin yanında araştırmacıların araştırma sorularına bağlı olarak biçimlendirilebilen, araştırmacıya özel, esnek, kolay ulaşılabilir, veri tabanı destekli ve araştırma sonuçlarının sağlıklı bir şekilde raporlanabildiği bir derlem altyapısı sunmayı hedeflemektedir. Proje ekibi söz konusu derlem altyapısını oluşturacak olan bütünleşik sistemin parçalarını farklı derlem projelerinde başarılı sonuçlar üreterek deneyimlemiştir (bk. 7.3.2. Proje Ekibinin Önerilen Proje Konusuyla İlgili Projeleri) Bu noktada proje ekibi edindiği birikimi diğer dilbilimcilerin de istifadesine sunmayı amaçlamaktadır.

Diğer taraftan, son yıllarda dünyada bilişim teknolojilerinin sunduğu olanaklar dil/dilbilim alanında yürütülen bilimsel çalışmaların nitelik ve niceliğini arttırmıştır. Önerilen projeyle, Türkçe üzerine yürütülen çalışmaların da nitelik ve niceliğinin artacağı öngörülmektedir. Bu anlamda batıda uygulamalı dilbilim çerçevesinde karşımıza çıkan dilbilgisi, ağız, çeviri bilim, tarihsel dilbilgisi ve dilsel değişim, dil öğrenimi ve öğretimi, anlambilim, kullanımbilim, toplum dilbilim, söylem çözümlemesi, biçembilim ve yazınbilim gibi dilbilimin alt dallarında (McEnery vd., 2006) araştırmacılar derleme dayılı çalışmalar yürütebilme olanağına sahip olacaklardır. Örneğin, sözcük anlambilimi ya da cümle anlambilimiyle ilgilenen bir araştırmacı standart derlem işleme basamaklarının yanında kendi derleminde yer alacak olan tabakaları ve metinleri belirleyebilecek, tabakaların ve metinlerin metadatalarının girişini yapabilecek, istediği dil birimini araştırma soruları çerçevesinde istediği etiketleri kullanarak işaretleyebilecek ve sonuç olarak tüm bunları sağlıklı bir şeklide raporlayabilecektir.

Project Summary

The aim of this project is to develop a corpus platform which can be shaped in line with the research questions of the scholars, and which is special for the scholar, user friendly, and supported with database. Considering this perspective, this corpus is going to provide a corpus platform in which the results of the research can be reported in a functional way.

As it is known, corpora of Western languages have the standard properties which are specific to apply the data of those languages. Corpora softwares have the opportunity to support its users with Turkish charecters. The biggest limitation of those corpora softwares, including the languages they have been formed, is that the data shaped in line with the research questions cannot be stored and arranged according to research goals. Another limitation may be evaluated as the drawbacks of them. To give an example, some softwares like AntConc, WordSmith Tools, MonoConc Pro, TextStat, Nooj can print results for the target languages as for frequency, bound lists, key words, n-gram calculation and collocation calculation. Despite being partial, those prints can be transferred into text documents. The research again faces with texts which have not been filtered and separated from the other texts. Another negative side of those corpora is that they are not proper for different operating systems. Though they have got versions for different operating systems like UNIX, Mac, Windows, this situation may generally lead to difficulties in terms of accessing and using them.

On the other hand, nowadays, linguistic researchers tend to find out answers for more detailed research questions. It is a fact that there is a limitation in corpus studies, and as the days pass by, there is an increasing interest to evaluate Turkish via corpus linguistics and creating corpus. Furthermore, learning word processing and corpus softwares is an important problem for the researchers. Moreover, it is not a practical solution to make linguists learn the knowledge of softwares for creating corpora. In that sense, they need a platform which is user friendly, easy to reach and shaped in line with research questions. “Do it Yourself Corpora”, which is going to be shaped with its browser and user friendly properties, can turn the disadvantages into advantages.

The proposed “Do it Yourself Corpora” is going to be prepared in terms of the theories and the applications of corpus linguistics, which is an increasingly valid application area. Under this perspective, the project aims to present a corpus database, which can be shaped in line with the research questions of the scholars, which is special for the scholar, user friendly, and supported with database, rather than presenting only standard corpus output. The project team has already experienced successful results from the previous corpus projects as integrated parts of this project (see The previous projects of the project team on proposed topic). At this point, the project team aims to share the information they have obtained so far.

In other respects, recently, thanks to the advances in information technologies, quality and quantity of scientific studies on linguistics have increased. With the proposed project, it is predicted that the quality and quantity of Turkish studies is also going to increase. In this sense, the researchers are going to have the opportunity to conduct research on grammar, dialect, translation, historical grammar and language changes, language learning and changing, pragmatics, sociolinguistics, discourse analysis, stylistics and poetics, all of which are encountered under the perspective of applied linguistics in Western world (McEnery et al., 2006). For instance, a researcher interested in word semantics or sentence semantics will have the chance to identify texts and structures of the corpus, will enter the metadata of texts and structures, will tag the results in line with the research questions. Thus, the researcher is going to report the results in a functional way.

“TÜRKÇENİN TARİHSEL DERLEMİ” OLUŞTURULUYOR

Bülent Özkan — Mon, 09 Jun 2014 11:13:39 +0000

Bu projeyle amacımız Türkçenin tüm tarihi boyunca kullanıldığı metinleri araştırmacılar için tek bir veri tabanında toplamak.

Bugüne kadar veriye dayılı dil araştırmaları bağlamında Türkçeyi araştırma konusu yaptık. Bunların tamamı ulusal araştırma projeleri olarak destek alan çalışmalardı ve literatürde yerini aldı. Bu projelerden bir kısmını doğrudan bir kısmı ise gerek projelerin hazırlanış aşamalarında gerekse de yürütülüşü sırasında danışmanlıklarını üstlenilerek diğer araştırmacılarla birlikte sonuçlandırdı.

Projenin kapsamı, 7.’ın sonlarından başlayan ve 13. yy.’a kadar süren Eski Türkçe ve Karahanlı Türkçesi dönemleri dışında kalan Türkçenin tarihi metinlerini bir derlem çalışmasıyla bir araya getirmek.

Bu çerçevede genel kabul gördüğü biçimiyle derlemin içeriği dönemsel adlarıyla şu şekilde listelenebilir:

1- Harezm Türkçesi (14.yy)

2- Kıpçak Türkçesi (13.-17. yy)

2.1. Altın Orda Kıpçak Türkçesi (13-16. yy)

2.2. Memlûk Kıpçak Türkçesi (14-16. yy)

2.3. Ermeni Kıpçakçası (16-17. yy)

3- Eski Anadolu Türkçesi (13-15. yy)

3.1. Osmanlı Türkçesi (15-19. yy.)

4- Çağatay Türkçesi (15-19.yy).

Türkçenin tarihinde yazılmış manzum (şiir) ve mensur (düz yazı) binlerce eser var. Bu eserler ayrıca farklı türlerde yazılmış eserler. Proje bugüne kadar Türk Dili’ne hizmet vermiş yüzlerce araştırmacının katılımıyla yürümek durumunda. Bu amaç doğrultusunda tüm araştırmacıları metinlerini paylaşmaya/bağışlamaya davet ediyorum.

PROJE SONUÇLANDIĞINDA…

Her şeyden önce Tarihi Türk Dilleri araştırmacıları için eşsiz bir kaynak oluşturulmuş olacak.

Türk kültür tarihçiliği açısından çok önemli veriler tek bir kaynaktan araştırmacılarca sorgulanabilecek.

Türkçenin tarihi boyunca kullanılmış söz varlığı, araştırmacıların tek bir sorguyla erişebileceği elektronik bir kaynakta toplanacak.

Devam çalışmalarında Türkçenin tarihi dönemlerine ait dilsel yapılar örneğin; karşılaştırmalı yapı bilgisi, söz dizimi gibi özellikleri araştırma olanağı tüm araştırmacıların paylaşımına sunulacak.

Tarihsel dil bilgisi araştırmalarında dönemlere ait söz varlığı çalışmaları büyük hız kazanacak.

Metin bağışıyla bu proje tüm Türk Dili araştırmacılarına ait ortak bir çalışma olması bakımından bilgi paylaşımının bu denli hızlı olduğu çağımızın bilişim ruhunu yansıtan bir niteliğe sahip olacak. Etkileşimli bir proje olması açısından bu proje bir ilk olma niteliği taşımaktadır.

PROJE ÇIKTILARINA NASIL ULAŞILACAK?

Proje çıktıları genel ağ üzerinden anlık olarak paylaşılacak. Öncelikli olarak metin bağışında bulunan araştırmacılara açılacak olan sistem ilerleyen dönemde tüm araştırmacıların erişimine sunulacak.

SİSTEM NELERİ SORGULAMA OLANAĞI SUNACAK?

Bir araştırmacı hangi sözcüğün hangi tarihi dönem ve sahalarda kullanıldığını merak ettiğinde yapacağı sorgu sonucunda arama yaptığı sözcüğün geçtiği eseri, eserin sayfa numarasını ve tanık cümlelerini görebilecek.

Bu sorgu aynı zamanda eserin dönemini, dönemin genel dil özelliklerini, eser üzerinde yapılan çalışmaların bibliyografik bilgisini de araştırmacılara sunacak. Devam çalışmalarında verilerin işaretlenme ve etiketleme durumuna bağlı olarak anlam sorguları sonucu hangi dönemde hangi sözcük arama yapılan anlam için kullanılmış olduğu bilgisi de araştırmacılara sunulacak bilgi paketleri arasında yerini alacak.

Projeye ulaşılabilirlik açısından Anadolu Sahası ve Doğu Türkçesi ile başlanacak. Bu nedenle araştırmacılarımızdan öncelikli olarak bu sahalara ait metinleri paylaşmalarını rica ediyoruz.

Proje için ilerleyen yıllarında başka kurumlardan da destek arayışı içerisinde olunacaktır.

Başlangıç hedefimiz bir altyapı oluşturmak ve sağlam kurulmuş bir altyapı üzerine projeyi inşa ederek Anadolu Sahası ve Doğu Türkçesi’nin tarihsel metinlerini işlemektir.

Yürütülen ve içerisinde yer alınan projelerden edinilen birikimler bu projeyle tüm Türk Dili Dünyası’yla paylaşılacak.