Netflix Verileri Üzerinde TF-IDF Algoritması ve Kosinüs Benzerliği ile Bir İçerik Öneri Sistemi Uygulaması

Dijital platform kullanıcıları, bu platformların sunduğu özelleştirilmiş hizmetlerden yararlanmak ve bunları zaman ve mekan bağımsız olarak tüketmek istemektedirler. İnternet üzerinden yayın yapan bu platformlar arasında dünya çapında en yaygın olanlardan biri de Netflix’tir. Bu çalışmanın amacı TF-IDF (term frequency–inverse document frequency) algoritması ve Kosinüs Benzerliği (Cosine Similarity) ile Doğal Dil İşleme (NLP) ile Netflix kullanıcı verileri üzerinde bir içerik öneri sistemi uygulaması geliştirmektir. Bu bağlamda çalışmamızda yapılan analizler ile benzerlik yöntemleri ve uygun eşleşme verilerinin bulunması, böylelikle kullanıcılara kişisel bazda öneri yapılması hedeflenmiştir. Çalışma kapsamında hem Türkçe hem de diğer dillerdeki filmler ve diziler üzerinde farklı deneyler yapılmıştır. Yapılan deneyler neticesinde kosinüs benzerliği kullanılarak en yüksek benzerlik başarısı %91, en düşük benzerlik başarısı ise %43 olarak elde edilmiştir. Deneyler aynı veriler üzerinde kosinüs benzerliği ile birlikte TF-IDF algoritması ile yapıldığında ise başarı oranı %99 ile %80 arasında elde edilmiştir. Çalışma sonuçları, TF-IDF algoritması ve kosinüs benzerliği birlikte uygulanarak yapılan deneylerde, kosinüs benzerliği kullanılarak yapılan deneylere nazaran daha yüksek başarı oranının elde edildiğini ortaya koymaktadır. Çalışmamızın benzerlik yöntemleri ve uygun eşleşme verileri kullanılarak kişisel bazda öneri yapmayı hedefleyen içerik tabanlı öneri sistemi uygulamalarının geliştirilmesi bağlamında literatüre katkı sağlayacağı değerlendirilmektedir.

Erişime Açık
Görüntülenme
80
04.05.2023 tarihinden bu yana
İndirme
1
04.05.2023 tarihinden bu yana
Son Erişim Tarihi
12 Eylül 2024 13:33
Google Kontrol
Tıklayınız
Tam Metin
Tam Metin İndirmek için tıklayın Ön izleme
Detaylı Görünüm
Eser Adı
(dc.title)
Netflix Verileri Üzerinde TF-IDF Algoritması ve Kosinüs Benzerliği ile Bir İçerik Öneri Sistemi Uygulaması
Yazar
(dc.contributor.author)
Hakan Aydın
Yayın Yılı
(dc.date.issued)
2022
Tür
(dc.type)
Makale
Özet
(dc.description.abstract)
Dijital platform kullanıcıları, bu platformların sunduğu özelleştirilmiş hizmetlerden yararlanmak ve bunları zaman ve mekan bağımsız olarak tüketmek istemektedirler. İnternet üzerinden yayın yapan bu platformlar arasında dünya çapında en yaygın olanlardan biri de Netflix’tir. Bu çalışmanın amacı TF-IDF (term frequency–inverse document frequency) algoritması ve Kosinüs Benzerliği (Cosine Similarity) ile Doğal Dil İşleme (NLP) ile Netflix kullanıcı verileri üzerinde bir içerik öneri sistemi uygulaması geliştirmektir. Bu bağlamda çalışmamızda yapılan analizler ile benzerlik yöntemleri ve uygun eşleşme verilerinin bulunması, böylelikle kullanıcılara kişisel bazda öneri yapılması hedeflenmiştir. Çalışma kapsamında hem Türkçe hem de diğer dillerdeki filmler ve diziler üzerinde farklı deneyler yapılmıştır. Yapılan deneyler neticesinde kosinüs benzerliği kullanılarak en yüksek benzerlik başarısı %91, en düşük benzerlik başarısı ise %43 olarak elde edilmiştir. Deneyler aynı veriler üzerinde kosinüs benzerliği ile birlikte TF-IDF algoritması ile yapıldığında ise başarı oranı %99 ile %80 arasında elde edilmiştir. Çalışma sonuçları, TF-IDF algoritması ve kosinüs benzerliği birlikte uygulanarak yapılan deneylerde, kosinüs benzerliği kullanılarak yapılan deneylere nazaran daha yüksek başarı oranının elde edildiğini ortaya koymaktadır. Çalışmamızın benzerlik yöntemleri ve uygun eşleşme verileri kullanılarak kişisel bazda öneri yapmayı hedefleyen içerik tabanlı öneri sistemi uygulamalarının geliştirilmesi bağlamında literatüre katkı sağlayacağı değerlendirilmektedir.
Açık Erişim Tarihi
(dc.date.available)
2022-01-29
Yayıncı
(dc.publisher)
Academic Journal of Information Tecnology
Dil
(dc.language.iso)
Tr
Konu Başlıkları
(dc.subject)
Yapay Zeka, Makine Öğrenmesi, Doğal Dil İşleme, Dil İşleyicileri, Veri Yönetimi
Konu Başlıkları
(dc.subject)
Makine Öğrenmesi
Konu Başlıkları
(dc.subject)
Doğal Dil İşleme
Konu Başlıkları
(dc.subject)
Dil İşleyicileri
Konu Başlıkları
(dc.subject)
Veri Yönetimi
Tek Biçim Adres
(dc.identifier.uri)
https://hdl.handle.net/20.500.14081/1858
Dergi Sayısı
(dc.identifier.issue)
13
DOI
(dc.identifier.doi)
10.5824/ajite.2022.01.002.x
Orcid
(dc.identifier.orcid)
0000-0002-0122-8512
Bitiş Sayfası
(dc.identifier.endpage)
53
Başlangıç Sayfası
(dc.identifier.startpage)
32
Dergi Cilt
(dc.identifier.volume)
48
Analizler
Yayın Görüntülenme
Yayın Görüntülenme
Erişilen ülkeler
Erişilen şehirler
6698 sayılı Kişisel Verilerin Korunması Kanunu kapsamında yükümlülüklerimiz ve çerez politikamız hakkında bilgi sahibi olmak için alttaki bağlantıyı kullanabilirsiniz.
Tamam

creativecommons
Bu site altında yer alan tüm kaynaklar Creative Commons Alıntı-GayriTicari-Türetilemez 4.0 Uluslararası Lisansı ile lisanslanmıştır.
Platforms