Cassie Kozyrkov

Veri Analisti mi, Veri Bilimcisi mi?

İki Anahtar Rol Arasındaki Fark

Merhaba! Bugün veri dünyasının gizemli diyarına hoş geldin! Evet, şaka yapmıyorum - veri gerçekten de bir diyar gibi. Bu diyarda, veri analistleri ve veri bilimcileri gibi kahramanlar bulunuyor. Peki sen hangi kahramanın işine daha çok uyarsın? Haydi birlikte keşfedelim!

Veri Analisti: Veri Dünyasının Dedektifi!

Veri analisti, sanki bir dedektif gibi davranır. O, verilerin arasında kaybolur, ipuçlarını takip eder ve sonunda gerçeği açığa çıkarır. İstatistikler, tablolar, grafiklerle dolu bir dünya onun için ev gibi. Veri analistleri, her bir rakamın arkasındaki hikâyeyi anlamak için dedektif gibi iz sürerler. Bir sayısal pusulanın gösterdiği yönlerde ilerlerken, merakları onları bilinmeyenlere doğru çeker. Problemleri çözmek için yaratıcı çözümler bulurlar ve karmaşık veri setlerini anlaşılır ve etkileyici hikayelere dönüştürürler. İşte senin için veri analistinin en büyük görevleri:

Veri Toplama ve Temizleme: Veri analistleri, verilerin kirli olup olmadığını kontrol eder ve onları temizler. Her türlü veri tuzağına karşı uyanık olmaları gerekir!

Diyelim ki bir e-ticaret veri tabanında kullanıcıların kişisel bilgilerini tutan bir tablonuz var ve bazı kullanıcıların doğum tarihleri hatalı veya eksik. Bu durumda, doğum tarihi alanını temizlemek için bir SQL sorgusu yazabiliriz. Örneğin, doğum tarihi alanındaki değeri '1900-01-01' olarak ayarlayabiliriz:

Bu sorgu, 'Kullanıcılar'tablosundaki 'DogumTarihi' alanındaki eksik veya hatalı değerleri '1900-01-01'olarak günceller. Burada `IS NULL` ifadesi, doğum tarihi alanının boşolduğu kayıtları seçmek için kullanılır. `CURRENT_DATE` fonksiyonu isebugünün tarihini temsil eder ve bu tarihten daha ileri bir doğum tarihi olankayıtları seçmek için kullanılır.


_______________________________

İlham Arayanlar

Bunun tüm analistlerin işsiz kalacağı anlamına geldiğini düşünüyorsanız henüz uzmanlaşmış kişilerle tanışmamışsınız demektir. Belirli bir soruyu verilerle yanıtlamak, ilk etapta hangi soruların sorulmaya değer olduğu konusunda ilham üretmekten çok daha kolaydır.

"İşte tüm internet, git orada işe yarar bir şeyler bul."

Hızlı kodlama becerilerine ve liderlerinizin neyi ilham verici bulduğuna dair keskin bir anlayışın yanında, yer altında ne olduğuna dair (henüz) hiçbir fikriniz olmadan yeni bir kıtada maden arayan birinin güçlü karakterine ihtiyacınız var. Veri seti ne kadar büyük olursa ve potansiyel olarak ortaya çıkarabileceği olgular hakkında ne kadar az bilgi sahibi olursanız, zaman kaybetmeden içinde dolaşmak o kadar zor olur. Dişe dokunur bir sonuç bulmadan önce hiçbir işe yaramayan bir çok şey bulma durumunun üstesinden gelmek için sarsılmaz bir meraka ve duygusal dayanıklılığa ihtiyacınız olacak.

İşte bir sürü veri. Peki, analistler, nereden başlamak istersiniz? Görsel: Kaynak

Analitik eğitim programları genellikle öğrencilerini büyük veri kümelerine bakmaya yönelik yazılım becerileriyle donatırken, istatistik eğitim programlarının bu becerileri isteğe bağlı olarak öğretme eğilimindedir.

Bilinenin ötesine geçmek

Eksik bilgilerle uğraşmanız gerektiğinde çıta yükselir. Belirsizliğiniz olduğunda, sahip olduğunuz veriler ilgilendiğiniz konuları kapsamaz, dolayısıyla sonuç çıkarırken daha dikkatli olmanız gerekir. Bu yüzden iyi analistler hiçbir sonuca varmazlar.

Bunun yerine, kendilerini olguların ötesine uzanmaya çalışırken bulurlarsa, açık fikirliliğin timsali olmaya çalışırlar. Zihninizi açık tutmak çok önemli, aksi takdirde doğrulama yanılgısına kapılırsınız; eğer veride yirmi hikaye varsa, yalnızca sizin inandığınız şeyi destekleyeni göz önüne alırsınız… ve diğerlerini görmezden gelirsiniz.

Yeni başlayanlar, keşif analitiğinin amacının soruları yanıtlamak olduğunu sanarlar ama asıl amaç onları gündeme getirmektir.

İkarus Görsel: Kaynak

İstatistiğin titizliği olmadan, verilerinizin ötesine atılan İkarus gibi dikkatsiz bir yükselme büyük olasılıkla bir fiyaskoyla sonuçlanacaktır. (Analistler için ipucu: İstatistik alanından tamamen kaçınmak istiyorsanız, sonuca varma dürtüsüne direnin. İş tamam!)

Analitik, hipotezler oluşturmanıza yardımcı olur. Sorularınızın kalitesini artırır.

İstatistikler hipotezleri test etmenize yardımcı olur. Cevaplarınızın kalitesini artırır.

Veri konusunda bilgisiz olanlar arasında yaygın bir hata, keşif analitiğinin amacının, aslında soruları gündeme getirmek olmasına rağmen soruları yanıtlamak olduğunu düşünmesidir. Analistlerin veri sondajları, daha iyi sorular sorduğuklarından emin olmanın yoludur, ancak buldukları modeller, yeni veriler üzerinde istatistiksel olarak test edilene kadar ciddiye alınmamalıdır. Analitik, hipotezler oluşturmanıza yardımcı olurken istatistikler ise bunları test etmenize olanak tanır.

İstatistikçiler, bir analistin mevcut veri setinde bulduğu fenomenin bunun ötesinde de geçerli olduğu gibi davranmanın mantıklı olup olmadığını test etmenize yardımcı olur.

Denklemleri daha karmaşık olduğu için kendilerinin daha geçerli olduğunu düşünen diğer veri bilimi türlerinin analistlere oldukça zorbalık yaptığını gözlemledim. Öncelikle, uzman analistler aynı denklemleri kullanıyor (yalnızca farklı bir amaç için) ve ikinci olarak, geniş ve sığ tbaktığınızda, aynı derecede dar ve derin görünüyor.

Veri bilimi kuruluşunuzun etkinliği, güçlü analitik akıncılara bağlıdır. Yoksa büyük bir özenle yanlış yerde kazı yaparsınz. Bu yüzden analistlere yatırım yapın ve onları takdir edin, sonra da analistlerinizin size getireceği potansiyel içgörüleri titizlikle takip etmek için istatistikçilere başvurun.

İkisine de ihtiyacınız var!

İyi sorular ve iyi cevaplar arasında seçim yapmak acı zordur (ve çoğu zaman eski bir alışkanlıktır), bu nedenle her iki türde veri uzmanıyla çalışmak için yeterli kaynağınız varsa, bu işi kolayca çözersiniz. Ne yazık ki, tek gider personel harcamaları değildir. Ayrıca katkılarından yararlanmak için bol miktarda veriye ve veri bölme alışkanlığına da ihtiyacınız var. (En az) iki veri kümesine sahip olmak, önce ilham almanıza ve teorilerinizi hayal gücünden başka bir şeye dayalı olarak oluşturmanıza ve ardından bunların geçerli olup olmadığını kontrol etmenize olanak tanır. Bu, niceliğin inanılmaz ayrıcalığıdır.

Aradaki farkın yanlış anlaşılması, istatistikçilerin gereksiz zorbalık yapmasına ve pek çok gözden geçirilmemiş görüşün analistler tarafından bitmiş ürün olarak sunulmasına neden olur.

Bol miktarda veriye sahip insanların verileri bölme alışkanlığının edinememesinin tek nedeni, bu yaklaşımın önceki yüzyıldaki veri kıtlığında uygulanabilir olmamasıydı. Bölmeyi göze almaya yetecek kadar veriyi bir araya getirmek zordu. Uzun bir tarih, analitik ve istatistik arasındaki duvarları o kadar kalınlaştırdı ki, bugün her iki taraf da diğerine çok az sempati duyuyor. Bu, üzerine düşünmediğimiz için alışkanlık edindiğimiz eski moda bir bakış açısıdır. Aradaki farkın yanlış anlaşılması, istatistikçilerin gereksiz zorbalık yapmasına ve pek çok gözden geçirilmemiş görüşün analistler tarafından bitmiş ürün olarak sunulmasına neden olur. Verilerden değer elde etmeyi önemsiyorsanız ve veri bolluğunuz varsa, ihtiyaç duyulan yerde hem ilham almak hem de titizlenmek için ne gibi bir bahaneniz var? Verinizi bölün!

Her iki türde veri uzmanıyla çalışmak için yeterli kaynağınız varsa, bu işi kolayca çözersiniz.

Veri bölmenin disiplinler arasında birbirlerinin gücünü artırmasını sağladığını fark ettiğinizde, kendinizi verinin neden başka şekilde ele alındığını merak ederken bulacaksınız.

Eğitim Programlarımız hakkında bilgi almak için formu doldurabilirsin.

Formu doldurduğun için teşekkürler!
En kısa zamanda seninle iletişime geçeceğiz.
Oops! Something went wrong while submitting the form.