Dijital platform kullanıcıları, bu platformların sunduğu özelleştirilmiş hizmetlerden yararlanmak ve bunları zaman ve mekan bağımsız olarak tüketmek istemektedirler. İnternet üzerinden yayın yapan bu platformlar arasında dünya çapında en yaygın olanlardan biri de Netflix’tir. Bu çalışmanın amacı TF-IDF (term frequency–inverse document frequency) algoritması ve Kosinüs Benzerliği (Cosine Similarity) ile Doğal Dil İşleme (NLP) ile Netflix kullanıcı verileri üzerinde bir içerik öneri sistemi uygulaması geliştirmektir. Bu bağlamda çalışmamızda yapılan analizler ile benzerlik yöntemleri ve uygun eşleşme verilerinin bulunması, böylelikle kullanıcılara kişisel bazda öneri yapılması hedeflenmiştir. Çalışma kapsamında hem Türkçe hem de diğer dillerdeki filmler ve diziler üzerinde farklı deneyler yapılmıştır. Yapılan deneyler neticesinde kosinüs benzerliği kullanılarak en yüksek benzerlik başarısı %91, en düşük benzerlik başarısı ise %43 olarak elde edilmiştir. Deneyler aynı veriler üzerinde kosinüs benzerliği ile birlikte TF-IDF algoritması ile yapıldığında ise başarı oranı %99 ile %80 arasında elde edilmiştir. Çalışma sonuçları, TF-IDF algoritması ve kosinüs benzerliği birlikte uygulanarak yapılan deneylerde, kosinüs benzerliği kullanılarak yapılan deneylere nazaran daha yüksek başarı oranının elde edildiğini ortaya koymaktadır. Çalışmamızın benzerlik yöntemleri ve uygun eşleşme verileri kullanılarak kişisel bazda öneri yapmayı hedefleyen içerik tabanlı öneri sistemi uygulamalarının geliştirilmesi bağlamında literatüre katkı sağlayacağı değerlendirilmektedir.
Eser Adı (dc.title) | Netflix Verileri Üzerinde TF-IDF Algoritması ve Kosinüs Benzerliği ile Bir İçerik Öneri Sistemi Uygulaması |
Yazar (dc.contributor.author) | Hakan Aydın |
Yayın Yılı (dc.date.issued) | 2022 |
Tür (dc.type) | Makale |
Özet (dc.description.abstract) | Dijital platform kullanıcıları, bu platformların sunduğu özelleştirilmiş hizmetlerden yararlanmak ve bunları zaman ve mekan bağımsız olarak tüketmek istemektedirler. İnternet üzerinden yayın yapan bu platformlar arasında dünya çapında en yaygın olanlardan biri de Netflix’tir. Bu çalışmanın amacı TF-IDF (term frequency–inverse document frequency) algoritması ve Kosinüs Benzerliği (Cosine Similarity) ile Doğal Dil İşleme (NLP) ile Netflix kullanıcı verileri üzerinde bir içerik öneri sistemi uygulaması geliştirmektir. Bu bağlamda çalışmamızda yapılan analizler ile benzerlik yöntemleri ve uygun eşleşme verilerinin bulunması, böylelikle kullanıcılara kişisel bazda öneri yapılması hedeflenmiştir. Çalışma kapsamında hem Türkçe hem de diğer dillerdeki filmler ve diziler üzerinde farklı deneyler yapılmıştır. Yapılan deneyler neticesinde kosinüs benzerliği kullanılarak en yüksek benzerlik başarısı %91, en düşük benzerlik başarısı ise %43 olarak elde edilmiştir. Deneyler aynı veriler üzerinde kosinüs benzerliği ile birlikte TF-IDF algoritması ile yapıldığında ise başarı oranı %99 ile %80 arasında elde edilmiştir. Çalışma sonuçları, TF-IDF algoritması ve kosinüs benzerliği birlikte uygulanarak yapılan deneylerde, kosinüs benzerliği kullanılarak yapılan deneylere nazaran daha yüksek başarı oranının elde edildiğini ortaya koymaktadır. Çalışmamızın benzerlik yöntemleri ve uygun eşleşme verileri kullanılarak kişisel bazda öneri yapmayı hedefleyen içerik tabanlı öneri sistemi uygulamalarının geliştirilmesi bağlamında literatüre katkı sağlayacağı değerlendirilmektedir. |
Açık Erişim Tarihi (dc.date.available) | 2022-01-29 |
Yayıncı (dc.publisher) | Academic Journal of Information Tecnology |
Dil (dc.language.iso) | Tr |
Konu Başlıkları (dc.subject) | Yapay Zeka, Makine Öğrenmesi, Doğal Dil İşleme, Dil İşleyicileri, Veri Yönetimi |
Konu Başlıkları (dc.subject) | Makine Öğrenmesi |
Konu Başlıkları (dc.subject) | Doğal Dil İşleme |
Konu Başlıkları (dc.subject) | Dil İşleyicileri |
Konu Başlıkları (dc.subject) | Veri Yönetimi |
Tek Biçim Adres (dc.identifier.uri) | https://hdl.handle.net/20.500.14081/1858 |
Dergi Sayısı (dc.identifier.issue) | 13 |
DOI (dc.identifier.doi) | 10.5824/ajite.2022.01.002.x |
Orcid (dc.identifier.orcid) | 0000-0002-0122-8512 |
Bitiş Sayfası (dc.identifier.endpage) | 53 |
Başlangıç Sayfası (dc.identifier.startpage) | 32 |
Dergi Cilt (dc.identifier.volume) | 48 |