-- R Project & R Studio

R Project | Textcat Function

Merhabalar, şu sıralar Sentiment Analysis (Duygu Analizi) diğer bir deyişle “Opinion Mining” ile içli dışlı olduğum üzere bir metnin hangi dile ait olduğu (language detection) anlayabilmek için kullanışlı olduğunu düşündüğüm “textcat” fonksiyonundan bahsetmek istiyorum. Öncelikle “textcat” fonksiyonunu kullanabilmemiz için sistemimize download ve install etmemiz gerekiyor. Ardından;

setwd("D:/RProject/Functions/") # Çalışma dizinimizi set ediyoruz.

install.packages('textcat') # textcat fonksiyonunu download ediyoruz.

library('textcat') #textcat fonksiyonunu sisteme install ediyoruz.

textcat(
  c(
    "This is an English sentence.",
    "Das ist ein deutscher Satz.",
    "Esta es una frase en espa~nol.",
    "Ja, ich bin Programmierer von Computern in einer Firma",
    "Lütfen, bana yardım edebilir misiniz?"
  )		
)

Output:
[1] "english" "german"  "spanish" "german"  "turkish"

Görüldüğü üzere fonksiyonun kullanımı ve çıktıları oldukça kolay okunabiliyor. Büyük bir metin içerisindeki cümlelerin hangi dile ait olduklarını (language detectiontextcat fonksiyonu elde edebiliriz. Fonksiyon hakkında daha fazla bilgi almak ve örnekleri incelemek için;

  • ?textcat
  • ??textcat
  • args(textcat)
  • example(textcat) incelemende fayda var.

Konu hakkında bana uslumetin@gmail.com‘ dan ulaşabilirsiniz. Yeniden görüşmek üzere selamlar 🙂