Sosyal Medya Verileri ile Suç Tahmini Mümkün mü?

sosyal-medya-buyuk-veri-suc-tahmini

Dünya daha “medeni” bir yer olduğundan beri insanlar ne yaptığınız kadar, nasıl yaptığınıza da dikkat eder oldu. Sonuç odaklı bir yaşamdan süreç odaklı bir yaşama doğru kayan insanoğlu kaş yaparken göz çıkarılmasını artık hoş karşılamıyor.

Yeni okuduğum bir haberi bu zaviyeden değerlendirdiğimde rahatsız olmakla ümitvar olmak arasında arafta kalıyorum. ABD ve Avrupa teknoloji basınında yayınlanan haberlere göre Los Angles Polis Departmanı, veri analizi ve algoritmik yöntemlerle suça eğilimli kişileri tespit edecek ve suç unsuru oluşmadan engel olacak. Haberde konu edilen, potansiyel suçluların henüz suça teşebbüs edemeden engellenebilecek olması toplum güvenliği açısından sevindirici bir durum olarak algılansa da bu işin nasıl yapılacağı sorusu insanları huzursuz ediyor.

Habere göre LAPD, şehri daha güvenli bir yer haline getirebilme amacıyla büyük veriden faydalanmaya karar vermiş. Geçmiş suçlar, tutuklama kayıtları, suç işlenen konumlar, suçluların etnik ve demografik sınıflandırmaları, sağlık kayıtları gibi 15 veri kaynadığından elde ettiği bilgileri oldukça büyük bir veritabanında toplayan LAPD, CIA’in geliştirdiği LASER sistemini kullanarak suç henüz oluşmadan tahmin ederek şiddet suçlarını engellemeye çabalıyormuş. Person of Interest senaryosu gibi bir haber fakat farklı olarak metin bir senaryo değil haber metni. Henüz izlemediyseniz kesinlikle tavsiye ederim.

Sivil toplum örgütleri tarafından protesto edilen sistemin özel hayatın gizliliğini ihlal ettiği ve insanları potansiyel suçlu olarak fişlediği belirtiliyor. Fakat departmanın sistemden vazgeçmeyi düşünmediği sistemin günden güne geliştirilmesinden anlayabiliyoruz.

Avrupa’da da durum çok da farklı değil. Sıklıkla dile getirdikleri insan hakları ve kişisel hayatın gizliliği gibi kavramların aksine oldukça güçlü gözetleme ve suç tahmin sistemlerine sahip olan ülkeler arasında başı İngiltere çekiyor. İngiltere’de kullanılan yapay zeka temelli sistemlerin suç istatistikleri nedeniyle siyahi vatandaşları potansiyel suçlu olarak görmesi sisteme yöneltilen en önemli eleştirilerden sadece biri. Sistem için 2013 yılında yapılan testlerde  düşük risk grubundaki kişilerin tespitinde yüzde 98 oranında, yüksek risk grubundaki kişilerin tespitinde ise yüzde 88’lik bir doğruluk oranına ulaştığı rapor edilmiş.

predictive-crime-hotspot-mapping

Kaliforniya Üniversitesi Tahmin Teknolojileri Enstitüsü sosyal medya verilerinden finans, sağlık, güvenlik ve politika konularında tutarlı tahminler yapılabilmesi adına çeşitli araştırmalar yürütüyor. Güvenlik üzerine yapılan araştırmalarda 10-24 yaş arası Afro-Amerikan gençlerin ölüm nedenleri arasında ateşli silahla yaralanmanın en büyük suç riski olduğu görülmüş ve sosyal medyayı en fazla kullanın yaş grubunun da 18-29 olduğu bilgisinden hareketle bu gençlerin sosyal medya paylaşımları takip edilmeye başlanmış. Toplanan verilerin medikal prosedürler çerçevesinde inceleneceği, insanlar tarafından erişilmeden yapay zeka ile değerlendirilerek bir tahminleme yapılacağı program yöneticisi tarafından belirtilmiş. Fakat bu sistemlerin tamamını konsolide ederek nitelikli bir tahmin yapma imkanının sadece NSA ve CIA elinde olduğu gerçeği herkesi ürkütmeye devam ediyor.

Güvenlik birimleri geçmiş zamanlarda sosyal medya verilerini genellikle adli vakaları aydınlatmada ve suçluları yakalamada kullanılıyordu, yani fayda suç/olgu gerçekleştikten sonra ortaya çıkıyordu. Fakat gelişen teknolojiyle birlikte sosyal medya verileri ile (olgu gerçekleşmeden ) salgın tahminleri, borsaya yönelik tahminler ve suç tahminleri tutarlı bir şekilde önceden yapılabilmeye başlandı.

Olayın bir diğer yüzü ise Marysville’de karşımıza. Kolejdeki bir öğrencinin silahla diğer öğrencileri katletmesini Twitter‘dan paylaşması ve Miami’de 14 yaşında intihar eden Naika Venant’ın, Facebook üzerindeki paylaşımları toplumda, “eğer paylaşımlar takip edilse vakalar engellenebilir miydi?” sorusunu canlı tutmaya devam ediyor. Etik ve mahremiyet üzerine yaşanan kaygılarla daha güvenli bir şehirde yaşama fikri arasında gidip gelen insanlar sosyal medya verileriyle suç/intihar tahmini konusuna tam anlamıyla ikna olmuş durumda değil gibi görünüyor.

Suç tahmini konusundan açıklanan en net çalışmalardan biri EPJ Data Science‘ın yayınladığı “Crime event prediction with dynamic features” başlıklı araştırma raporudur. Araştırmaya göre Brisbane’da belirli lokasyonlarda check-in yapan 20.000 ve New York’ta check-in yapan 230.000’den fazla kullanıcının paylaşımları üzerinden bir analiz raporu yayınlanmış.

suc-tahmin-algoritmasi-grafikli

Bu modele göre haritada bölgelere ayrılan lokasyonların uzun süreli suç geçmişi, coğrafi bilgiler, bölgenin demografik yapısı, aynı türdeki suç yoğunluğu, bölgede paylaşılan tweet konuları ve olaya özgü değişkenler kodlanan algoritmalarla sınıflandırılıyor ve milyonlarca verinin analizinden sonra ortaya belirli bir davranış ve olay örüntüsü çıkıyor. Aşağıda gördüğünüz grafik İngiltere polisinin suçla mücadele örüntüsüdür ve yetkililer tüm tedbirlerini bu örüntüyü baz alarak kurgulamaktadır.

suc-davranis-oruntusu

Sosyal medya paylaşımlarında da aynı grafik geçerlidir. Yüz milyonlarca anahtar kelime yaş, ırk, eğitim düzeyi, cilt rengi, etnik köken, din ve konum bilgisi gibi sınıflandırma etiketleriyle büyük veri fabrikalarına akar. Yapay zeka ve maharetli istatistikçiler tarafından yorumlanan bu verilerden eşsiz öngörüler üretilebilir. Örneğin “cinayet” kelimesinin en çok hangi şehirde ve hangi yaş grubundaki kullanıcılar tarafından kullanıldığını rahatlıkla tespit edebilirsiniz. Bir adım daha ilerleyelim; yapay zekanın beklentileri aşan gelişim hızı büyük verinin çok daha nitelikli bir şekilde yorumlanabilmesine de imkan sağladı. Yani artık tek tek kelimeleri değil, kelime öbeklerini ve hatta cümleleri araştıran yapay zeka destekli yazılımlar güvenlik birimlerinin kullanımına sunulmuş durumda. Bu yetenekler de suçun tahmin edilmesini bir hayli kolaylaştırıyor olsa gerek.

Veri Görselleştirme ve Suç Tahmin Sistemleri

Buraya kadar anlatılanlar size düşük bütçeli bir Azınlık Raporu (Minority Report) senaryosu gibi geldiyse durumu sizin için biraz daha netleştirmek adına çok da uzak olmadığımız bir markanın çözümü ile yazıya devam edelim. Ülkemizde de kulak aşinalığımız olan Japonya menşeli Hitachi’nin  “Visualization Predictive Crime Analytics” çözümüne kısaca bir göz atalım.

Sistem, makine öğrenmesi marifetiyle herhangi bir insanın gözlemleyemeyeceği bir suç örüntüsünü (pattern) yüz binlerce sensörden ve onlarca kaynaktan aldığı eş zamanlı veri ile tespit ederek güvenlik birimlerine bilgi aktarabiliyor. Sistemin en önemli veri kaynakları ise;

  • Tarihsel suç istatistikleri
  • Okullara ve metroya yakınlık
  • Ateşli silah sensörleri
  • Plaka okuyucuları
  • Toplu taşıma haritaları
  • Hava durumu raporları
  • Sosyal medya paylaşımları

Bu modelde olduğu gibi bir önceki suç tahmin modelinde de sosyal medya paylaşımları hayati derecede önemli. Zira diğer tüm veri kaynakları statik verileri ifade ederken sosyal medyadan elde edilen veriler dinamik veri kaynağı olarak sonuca yüksek oranda etki etmektedir. Zira sosyal medya verilerini doğrudan insanlar kitlesel olarak ve kontrolsüz bir şekilde üretmektedir ve bu nedenle suç tahminlerinin doğruluğuna etkisinin %15 civarında olduğu düşünülmektedir.

Sistem en çok belirli bir bölgedeki çeteler arasındaki kavgaların tahmininde oldukça büyük bir başarı göstermiş, paylaşımlar, komşular ve suç arasındaki korelasyonu insanların tahminlemesi mümkün değilken bilgisayarların bu tahmini yüksek bir doğruluk oranıyla ve önceden tespit edebildiği gösterilmiş.  Hitachi yetkilisi Darrin Lipscom da suça etki eden faktörlerin sayısı arttıkça “insanın” suç tahmininde yetersiz kalacağına dikkat çekerek sistemin önemine vurgu yapmış. Lipscom, sistemin 200 metrekarelik bir alanda dahi doğru tahmin yapabilecek şekilde geliştirildiğini ifade etmiş.

Geleneksel suç tahmin modelleri genellikle ilgili bölgede uzun süre görev yapan polislerin deneyimlerine ve erişilebilir durumda olan suç kayıtlarına dayanmaktaydı fakat hayatımıza giren bilişim teknolojileri ile söz artık yapay zeka ile güçlendirilmiş bilgisayarlara geçecek gibi görünüyor.

Konu hakkında yazıya eklemek istediğim o kadar çok örnek var ki, yazıyı daha fazla uzatmamak adına bu örnekleri ve haberleri aşağıdaki galeride toplamaya çalıştım. 

Eleştiriler ve Çekinceler

Kötü niyetli insanların masum insanlara zarar veremeden engellenmesi fikri sistemin kabul görmesi açısından oldukça tatmin edici bir gerekçe. Hangi aklı başında insan göz göre göre birilerine kötülük yapılmasını onaylayabilir ki? Fakat bu sisteme “suç tahminleme” ismini vermekle sadece suç tahmininde kullanılacağı anlamına gelmiyor ki toplumun bu tip sistemlere güvensizliğinin temelinde de bu neden yatıyor.

Suç gibi sıra dışı bir konuda dahi yüksek oranda tutarlı tahminler yapabilen bir sistemin vatandaşların satın alma tercihleri, oy verecekleri parti, ülke gündemine dair tepkileri, bir kişi veya konu hakkındaki muhtemel davranışları da rahatlıkla tahmin edilebilecek. Tahmin edilebilirliğin sakıncasını da sevgili Buğra Ayan muhteşem bir şekilde ifadelendirmiş. (Tahmin edilebilen) Hesaplanabilen bir hayatınız varsa, bu veri ile öfkeniz, zekanız manipule edilebilir.”

Öfkenizin manipüle edilebilmesinin ne anlama geldiğini ülkemizde de defalarca yaşayarak öğrendik fakat sosyal medya üzerinden kitle manipülasyonu yapılabileceğine inanmayanlar hala bu durumu ret etmekte ısrar ediyor. Böylesi durumlarda ben Selçuk Şirin hocanın 200 Dolara Sokak Çatışması! başlıklı yazısının linkini paylaşıyorum.

Büyük veriden hareketle suçların tahmin edilebilmesinin kamu yararı içerdiği düşünülse bile  mahremiyetimizin devlet içerisindeki birimlerin iç çekişmesine kurban gitmeyeceğine dair elimizde hiç bir garanti bulunmuyor. Bu endişenin karşılığını NSA, CIA ve FBI arasında yaşanan köşe kapmaca oyunundan rahatlıkla anlayabiliriz. Yıllardır ülkelerin yönetim organları üzerinde kök salan kuruluşların ellerindeki gücü demokrasiye olan büyük inançları nedeniyle sivil yönetimlerin hizmetine vereceğini düşünüyor olamazsınız.

Kitlelere özgürlük sanrısı aşılayan sosyal medya şirketlerinin, aslında insanları tahmin edilebilirlik kafesine tıkmaya çalıştıklarını ne zaman görüp (infografik) ve günlük hayatımızla birlikte davranışsal örüntülerimizi bedavaya kullandığımız servisler aracılığıyla onlara vermekten ne zaman vazgeçeceğiz? Ne zaman sosyal medya şirketlerinin özgürlük ve demokrasi havarisi olmadıklarının farkına varıp aslında kusursuzca hazırlanmış bir sorgu odasında olduğumuzu idrak edeceğiz? Öyle bir sorgu ki ne bir gram kimyasala ne de askeri tarihte üretilmiş biri diğerinden daha vahşi sorgu tekniklerine gerek kalmaksızın sorgulanan herkesten en mahrem bilgilerini dahi rahatlıkla alabilecek kadar etkili…

Türkiye İçin Tehlike Çanları Çalıyor mu?

İngiltere merkezli We Are Social‘in rakamlarına göre ülkemizde 102 milyonluk bir sosyal medya kullanıcı kitlesi var.

  • Facebook 52 milyon
  • Instagram 33 milyon
  • Twitter 8.83 milyon
  • Snapchat 8.53 milyon

Bu toplama Youtube, WhatsApp ve LinkedIn eklendiğinde rakam muhtemelen 200 milyona ulaşacaktır. Türkiye nüfusunun 81 milyon olduğunu düşünürsek her bir Türk vatandaşının davranışsal alışkanlıkları ve tercihlerine dair bilginin 3 ayrı sosyal medya servisine aktığını söyleyebiliriz. Böylesi bir kuşatmanın altında aşağı yukarı hangi dönem ne yemek istediğimizden hangi fikre reaksiyon göstereceğimize, hangi söz ile sakinleştiğimizden tuvalette hangi kitabı okuduğumuza kadar bütün yaşamsal deneyimlerimiz büyük veri şirketlerinin masasında olmaktan kurtulamayacaktır. Ve hatta kızımızın hamile olup olmadığını pazarlama şirketleri bizden daha önce bilecektir, abartı mı geldi? Aşağıdaki flood’u okuyun.

Sosyal medya kullanımlarımızdan elde edilen bu veriler sadece ticari anlamda bizleri sağmal inek yapmak için kullanılmıyor. Belirli dönemlerde toplumsal sinir uçlarına dokunmayı bir yana bırakın adeta tekme atıldığına şahitlik ediyoruz. Kaynağı belirsiz haberler ve görseller yalan haber sarmalı içerisinde tüm ülkeye sadece dakikalar içerisinde yayılıyor. Ve yine saniyeler içerisinde sosyolojik anlamda cepheler açılıyor, kamplar kuruluyor ve küfürler, tehditler, hakaretler sosyal medya akış ekranlarında yerini alıyor. Hangi tartışmaya kaç kişinin katıldığı, o tartışmada kaç tweet atıldığı, gerginliğin nereye kadar tırmandırıldığı, tartışmaya katılan kitlenin ne kadarının mobilize edilebildiği anbean takip edilerek istatistikler ve yorumlar stratejik araştırma enstitülerinde raporlara dökülüyor ve toplumların davranış örüntüleri ortaya çıkarılıyor. Ve ne yazık ki yapay zeka destekli örüntü okuma teknikleri tahmin edebileceğimizin çok ötesinde yüksek bir başarım oranıyla çıkarsama yapabiliyor.

Belki de davranışsal örüntüler o kadar açık ki, kolundaki saati ararken işe geç kalan beyaz yakalı misali biz göremiyor ve fark edemiyoruz. Uzun süreli ve kronolojik bir düzende insan hayatını takip eden yapay zekadan böylesi bir bağlantının ve bağıntının kaçma ihtimali neredeyse sıfıra yakın. Sıfıra yakınlığı sağlayan tek sebep de elektriğin kesilme ihtimali olsa gerek.

Gelecek gerçekten endişe yaratarak gelecek gibi görünüyor. Dünya mahremiyet kavramının delik teşik olacağı, sosyal psikolojinin teknolojinin de yardımıyla insanların otomatik davranış kalıplarının kusursuz bir haritasını çıkaracağı ve bunun sonucunda da kitlesel dalgalanmaların çok daha düşük maliyetlerle binlerce kilometre uzaktan tetiklenebileceği, bilginin güç değil silah olacağı, insanların “insan” değil veri olarak görüleceği, farklılıklarıyla dünyayı zenginleştiren insanların tek tipleştirileceği kaotik garip bir yere doğru evriliyor. Yani kısaca insanoğlu Henry David Thoreau‘nun dediği gibi kendi icat ettiği araçların aracı haline geliyor.

 

Kaynaklar

  1. China takes surveillance to new heights with flock of robotic Doves, but do they come in peace? 
  2. How the LAPD uses data to predict crime
  3. Crime event prediction with dynamic features
  4. UC Institute for Prediction Technology
  5. Büyük veri: Biri bizi gözetliyor
  6. Yüz Tanıma Teknolojisi ile Gizlilik Artık Hayal Oluyor
  7. Crime-predicting A.I. isn’t science fiction. It’s about to roll out in India
  8. Police using analytics to predict crime
  9. HRW: Çin Şincan’da ‘suç tahmin eden yazılım’ kullanıyor

Leave a Reply

E-posta hesabınız yayımlanmayacak.

77 − = 74