– Yalova Üniversitesinden bir araştırma ekibi, yeni tip koronavürüs (Kovid-19) salgınının Türkiye’deki toplumsal tesirlerine yönelik çalışmalara kaynaklık etmesi maksadıyla, 11 Mart’tan bu yana Twitter’den paylaşılan bildirileri “veri seti”nde topladı.
Sanayi Mühendisliği Kısmında vazifeli Dr. Talim Üyesi İbrahim Sabuncu ve mekteplisi Zeynep Yürek’ten oluşan ekip, toplumsal medya analitiği üzerine “Koronavirüs Türkçe Tweet Olgu Seti” çalışması başlattı.
Türkiye’de birinci vakanın görülmesinin akabinde, bu hususta toplumsal medya platformu Twitter’da paylaşılan Türkçe iletileri toplayan ekip, 23 Nisan’da 4,8 milyon tweetin bulunduğu data setini duyurdu.
Sabuncu ve mekteplisi, daha sonra dünyanın önde gelen mühendislik tertibi olup 420 binden fazla üyesi bulunan Elektrik ve Elektronik Mühendisleri Enstitüsünün (IEEE) done tabanına yükleme yaptı. IEEE’nin düzenlediği yarışta 3’üncü olan ekip, bu çalışmayı Türkiye Ilmî ve Teknolojik Araştırma Kurumunun (TÜBİTAK) done setleri kısmına de aktardı.
– “Veri seti, varsayım ve tedbire çalışmalarında kullanılabilecek”
Dr. Tedrisat Üyesi İbrahim Sabuncu, AA muhabirine yaptığı açıklamada, yarışta kullandıkları data setini, Kovid-19’un Türkiye’deki toplumsal tesirlerini araştırmak emeliyle hazırladıklarını söyledi.
Koronavirüsle ilgili Türkçe yazılmış Twitter bildirilerini “veri madenciliği” yazılımıyla topladıklarını belirten Sabuncu, şöyle devam etti:
“Bu tweetler, Kovid-19’un Türkiye’ye toplumsal tesirleri ile ilgili toplumsal medya tahlili, metin madenciliği, mevzu modelleme üzere çalışmalar yapmak için kıymetli bir data kaynağı oluşturmaktadır. Bu datalar, Türkiye’deki kişilerin Kovid-19 ile ilgili endişelendikleri mevzuları, gereksinimlerini, beklentilerini, başkanlardan taleplerini anlamak, virüsün yayıldığı noktaları, yayılma suratını ve gelecekteki vaka sayılarını varsayım edebilmek, Kovid-19 ile ilgili kasıtlı, yalan, yanlış haber ve haber paylaşanları tespit edebilmek üzere pek çok farklı bahis ile ilgili yapılacak tahlillerde kullanılabilecek.”
Data toplamaya, Türkiye’de birinci vakanın görüldüğü 11 Mart’ta başladıklarına değinen Sabuncu, gayrı araştırmacıların da yararlanabilmesi için bu haberleri TÜBİTAK ve IEEE’nin done portalına yüklediklerini lisana getirdi.
Sabuncu, “TÜBİTAK’ın Kovid-19 portalında bizden evvel İngilizce olgu seti vardı. Biz yükledikten sonra Türkçe tweet data setimize erişilebiliyor. Burada yüklü done setimiz 4,8 milyon tweet barındırıyor lakin 23 Nisan sonrası da done toplamaya devam ettiğimiz için bu sayı 6 milyona ulaştı.” dedi.
– “Ülkemiz, üniversitemiz ismine şad olduk”
Sabuncu, maksatlarının Türkiye’de Kovid-19 ile ilgili toplumsal medya analitiği üzerine çalışmalar yapan bilim kişilerinin data setinden faydalanmasını sağlamak olduğunu aktardı.
Done setini IEEE portalına yüklerken bir müsabakaya da katıldıklarını anlatan Sabuncu, şunları kaydetti:
“Bizim data setimiz, en fazla ziyaretçi alan 3’üncü olgu seti oldu. Doğal biz bu durumda memleketimiz, üniversitemiz ismine şad olduk. Türk bayraklı logomuzun olduğu olgu setimizin listeye girmesi bizi onore etti. Saf bizim asıl gayemiz, koronavirüsle savaşta yararlı haberlerin üretilmesi, hem ilmî hem de halka yarar sağlayacak bir çalışma yapmaktır. Bu çalışmamızı önümüzdeki devir ahir bitirip sonucunu paylaşacağız.”
Toplumsal medya analitiğinin pek çok bahiste kullanıldığı haberini veren Sabuncu, kasım ayında ABD’de yapılacak başkanlık seçimleri iddiası için de yeni bir data yekuna çalışması başlattıklarını ve bunu seçimlerden evvel açıklamayı hedeflediklerini kelamlarına ekledi.
Memurlar