作者
Gürkan ŞAHİN, Banu DİRİ, Tuğba Yıldız
简介
Özetçe— Çeşitli anlamsal ilişkilere ait kavramsal ikililerin farklı kaynaklardan (sözlük tanımları, derlem vb.) otomatik ve yüksek doğrulukla çıkartılması doğal dil işlemedeki (DDİ) önemli çalışmalardan birisidir. Bu çalışmada Türkçe parça-bütün ilişkisi ikililerinin derlemden çıkartılması için hibrit bir yöntem önerilmiştir. Önerilen yöntemde derlem istatistik bilgileri, WordNet benzerlik fonksiyonları ve Word2Vec kelime vektör benzerliklerinden yararlanılmıştır. Başlangıç parça-bütün ikilileri oluşturulmuş ve ilişkiye ait şablonlar derlemden çıkartılmıştır. Şablonların güvenilirlik puanları hesaplanmış ve güvenilir şablonlar yeni ikililer üretmede kullanılmıştır. Üretilen yeni parça-bütün ikilileri için çeşitli güvenilirlik puanları hesaplanmıştır. Yöntemin başarısı 19 bütün kavram için üretilen parça kavramların doğrulukları hesaplanarak ölçülmüş ve ortalama %83 (ilk 10 ikili), %74 (ilk 20 ikili), %68 (ilk 30 ikili) tutturma değerleri elde …