İstatistik ve analitik, veri biliminin iki dalıdır ve erken kahramanlarının birçoğunu paylaşırlar, bu yüzden arada sırada hangisinin nerede başlayıp nerede bittiği hakkında canlı tartışmalar devam etmektedir. Ancak pratikte, bu isimleri taşıyan modern eğitim programları tamamen farklı uğraşları vurgular. Analistler, verilerinizde ne olduğunu keşfetmeye özelleşirken, istatistikçiler daha çok verinin ötesinde neyin çıkarılabileceğine odaklanırlar.
Feragatname: Bu makale, yalnızca istatistik veya analitiği öğreten eğitim programlarının tipik mezunları hakkındadır ve her iki konuyla ilgili kendini geliştirmeyi başaranları hiçbir şekilde küçümsemez. Aslında seçkin veri bilimcilerinin analitik ve istatistik (aynı zamanda makine öğrenimi) konusunda tam uzman olmaları beklenir… ve mucizevi bir biçimde bu insanlar nadir de olsa aramızdalar.
Çalışmanızla ilgili tüm gerçeklere sahip olduğunuzda, soruları sorup verilerle yanıtlamak için ihtiyacınız olan tek nitelik sağduyudur. Cevabı aramanız yeterlidir.
Hemen şimdi temel analitiği iş başında görmek ister misiniz? Hava durumunu Google’layın. Bir arama motoru kullandığınızda, temel analitik yapıyorsunuz. Hava durumu verilerini çekiyor ve onlara bakıyorsunuz.
Çocuklar bile olguları çevrimiçi ortamda hiç zorlanmadan arayabilir. İşte veri biliminin demokratikleşmesi budur. Bugün New York'un Reykjavik'ten daha soğuk olup olmadığını mı merak ediyorsunuz? Neredeyse anında tatmin edici bir cevap alabilirsiniz. O kadar kolay ki artık bunu bile analitik olarak adlandırmıyoruz, ama öyle. Şimdi bu bilgiye bir asır önce erişmeye çalıştığınızı hayal edin. (Tam olarak bir asır önce.)
Bir arama motoru kullandığınızda, temel analitik yaparsınız.
Eğer işiniz işlenmemiş olguları raporlamaksa çoğunlukla bir insan arama motoru gibi çalışıyorsunuz demektir. Ne yazık ki, bir insan arama motorunun iş güvencesi, patronlarının cevapları kendi başlarına arayabileceklerini ve aracıyı devre dışı bırakabileceklerini asla öğrenmemesine bağlıdır... özellikle de havalı analitik araçların, şirket içi bilgileri sorgulamayı Google Arama Motoru kullanmak kadar kolay hale getirmesi sebebiyle.
Bunun tüm analistlerin işsiz kalacağı anlamına geldiğini düşünüyorsanız henüz uzmanlaşmış kişilerle tanışmamışsınız demektir. Belirli bir soruyu verilerle yanıtlamak, ilk etapta hangi soruların sorulmaya değer olduğu konusunda ilham üretmekten çok daha kolaydır.
"İşte tüm internet, git orada işe yarar bir şeyler bul."
Hızlı kodlama becerilerine ve liderlerinizin neyi ilham verici bulduğuna dair keskin bir anlayışın yanında, yer altında ne olduğuna dair (henüz) hiçbir fikriniz olmadan yeni bir kıtada maden arayan birinin güçlü karakterine ihtiyacınız var. Veri seti ne kadar büyük olursa ve potansiyel olarak ortaya çıkarabileceği olgular hakkında ne kadar az bilgi sahibi olursanız, zaman kaybetmeden içinde dolaşmak o kadar zor olur. Dişe dokunur bir sonuç bulmadan önce hiçbir işe yaramayan bir çok şey bulma durumunun üstesinden gelmek için sarsılmaz bir meraka ve duygusal dayanıklılığa ihtiyacınız olacak.
Analitik eğitim programları genellikle öğrencilerini büyük veri kümelerine bakmaya yönelik yazılım becerileriyle donatırken, istatistik eğitim programlarının bu becerileri isteğe bağlı olarak öğretme eğilimindedir.
Eksik bilgilerle uğraşmanız gerektiğinde çıta yükselir. Belirsizliğiniz olduğunda, sahip olduğunuz veriler ilgilendiğiniz konuları kapsamaz, dolayısıyla sonuç çıkarırken daha dikkatli olmanız gerekir. Bu yüzden iyi analistler hiçbir sonuca varmazlar.
Bunun yerine, kendilerini olguların ötesine uzanmaya çalışırken bulurlarsa, açık fikirliliğin timsali olmaya çalışırlar. Zihninizi açık tutmak çok önemli, aksi takdirde doğrulama yanılgısına kapılırsınız; eğer veride yirmi hikaye varsa, yalnızca sizin inandığınız şeyi destekleyeni göz önüne alırsınız… ve diğerlerini görmezden gelirsiniz.
Yeni başlayanlar, keşif analitiğinin amacının soruları yanıtlamak olduğunu sanarlar ama asıl amaç onları gündeme getirmektir.
İstatistiğin titizliği olmadan, verilerinizin ötesine atılan İkarus gibi dikkatsiz bir yükselme büyük olasılıkla bir fiyaskoyla sonuçlanacaktır. (Analistler için ipucu: İstatistik alanından tamamen kaçınmak istiyorsanız, sonuca varma dürtüsüne direnin. İş tamam!)
Analitik, hipotezler oluşturmanıza yardımcı olur. Sorularınızın kalitesini artırır.
İstatistikler hipotezleri test etmenize yardımcı olur. Cevaplarınızın kalitesini artırır.
Veri konusunda bilgisiz olanlar arasında yaygın bir hata, keşif analitiğinin amacının, aslında soruları gündeme getirmek olmasına rağmen soruları yanıtlamak olduğunu düşünmesidir. Analistlerin veri sondajları, daha iyi sorular sorduğuklarından emin olmanın yoludur, ancak buldukları modeller, yeni veriler üzerinde istatistiksel olarak test edilene kadar ciddiye alınmamalıdır. Analitik, hipotezler oluşturmanıza yardımcı olurken istatistikler ise bunları test etmenize olanak tanır.
İstatistikçiler, bir analistin mevcut veri setinde bulduğu fenomenin bunun ötesinde de geçerli olduğu gibi davranmanın mantıklı olup olmadığını test etmenize yardımcı olur.
Denklemleri daha karmaşık olduğu için kendilerinin daha geçerli olduğunu düşünen diğer veri bilimi türlerinin analistlere oldukça zorbalık yaptığını gözlemledim. Öncelikle, uzman analistler aynı denklemleri kullanıyor (yalnızca farklı bir amaç için) ve ikinci olarak, geniş ve sığ tbaktığınızda, aynı derecede dar ve derin görünüyor.
Veri bilimi kuruluşunuzun etkinliği, güçlü analitik akıncılara bağlıdır. Yoksa büyük bir özenle yanlış yerde kazı yaparsınz. Bu yüzden analistlere yatırım yapın ve onları takdir edin, sonra da analistlerinizin size getireceği potansiyel içgörüleri titizlikle takip etmek için istatistikçilere başvurun.
İyi sorular ve iyi cevaplar arasında seçim yapmak acı zordur (ve çoğu zaman eski bir alışkanlıktır), bu nedenle her iki türde veri uzmanıyla çalışmak için yeterli kaynağınız varsa, bu işi kolayca çözersiniz. Ne yazık ki, tek gider personel harcamaları değildir. Ayrıca katkılarından yararlanmak için bol miktarda veriye ve veri bölme alışkanlığına da ihtiyacınız var. (En az) iki veri kümesine sahip olmak, önce ilham almanıza ve teorilerinizi hayal gücünden başka bir şeye dayalı olarak oluşturmanıza ve ardından bunların geçerli olup olmadığını kontrol etmenize olanak tanır. Bu, niceliğin inanılmaz ayrıcalığıdır.
Aradaki farkın yanlış anlaşılması, istatistikçilerin gereksiz zorbalık yapmasına ve pek çok gözden geçirilmemiş görüşün analistler tarafından bitmiş ürün olarak sunulmasına neden olur.
Bol miktarda veriye sahip insanların verileri bölme alışkanlığının edinememesinin tek nedeni, bu yaklaşımın önceki yüzyıldaki veri kıtlığında uygulanabilir olmamasıydı. Bölmeyi göze almaya yetecek kadar veriyi bir araya getirmek zordu. Uzun bir tarih, analitik ve istatistik arasındaki duvarları o kadar kalınlaştırdı ki, bugün her iki taraf da diğerine çok az sempati duyuyor. Bu, üzerine düşünmediğimiz için alışkanlık edindiğimiz eski moda bir bakış açısıdır. Aradaki farkın yanlış anlaşılması, istatistikçilerin gereksiz zorbalık yapmasına ve pek çok gözden geçirilmemiş görüşün analistler tarafından bitmiş ürün olarak sunulmasına neden olur. Verilerden değer elde etmeyi önemsiyorsanız ve veri bolluğunuz varsa, ihtiyaç duyulan yerde hem ilham almak hem de titizlenmek için ne gibi bir bahaneniz var? Verinizi bölün!
Her iki türde veri uzmanıyla çalışmak için yeterli kaynağınız varsa, bu işi kolayca çözersiniz.
Veri bölmenin disiplinler arasında birbirlerinin gücünü artırmasını sağladığını fark ettiğinizde, kendinizi verinin neden başka şekilde ele alındığını merak ederken bulacaksınız.