Analityka danych i Data Science – różnice i podobieństwa

Dla kogo: Dla wszystkich tych, którzy słyszeli o Analityce Danych i Data Science, ale nadal nie do końca rozumieją, jakie są między nimi różnice. Również dla tych, którzy nie słyszeli o Data Analytics lub Data Science i chcą się dowiedzieć czegoś ogólnego na ich temat.

Jak co roku przed świętami spotkałem się z moimi przyjaciółmi. Kilka lat temu wszyscy studiowaliśmy Informatykę na Politechnice Warszawskiej. Tym razem, z powodu pandemii, spotkaliśmy się online. Podczas wspólnego spędzania czasu online, moja przyjaciółka zapytała o różnice pomiędzy Analityką Danych a Data Science. Wtedy zdałem sobie sprawę, że będzie to dobry temat na mój pierwszy artykuł.

W ostatnich czasach wykorzystanie danych stało się dużą częścią technicznego świata. Na naszych oczach zwiększała się moc obliczeniowa komputerów, a wraz z nią i innymi sprzyjającymi warunkami jak np. rozwój nauki pojawiały się nowe sposoby i narzędzia wykorzystujące ogromne ilości danych do podejmowania określonych decyzji. Właśnie dlatego tak często można teraz usłyszeć o zarówno o Analityce Danych, jak i o Data Science. Zdefiniowanie różnic i podobieństw między tymi pojęciami często sprawia problemy wielu ludziom. Dziś postaram się pokrótce wyjaśnić Analitykę Danych i Data Science oraz podam krótkie przykłady możliwych zadań dla osób, które pracują w tym obszarze.

Analityka danych

Analityka danych obejmuje badanie dużych zbiorów danych, wyciąganie z nich istotnych wniosków i odpowiadanie na pytania, które wpływają na podejmowanie strategicznych decyzji biznesowych. Analitycy danych pośród różnych innych zadań badając dane identyfikują trendy, tworzą wykresy, wizualizują i opisują wyniki badań w raportach. Obowiązki analityków danych mogą się znacznie różnić w zależności od branży i firmy, ale ogólnie mówiąc analitycy danych znajdują rozwiązania na istniejące już problemy przy użyciu danych historycznych.

Przykładowy problem i zadanie do wykonania:

W pewnym team’ie firmy X prowadzącej sklep internetowy analityk danych dostał zadanie, aby zwizualizować i sprawdzić zyski firmy ze sprzedaży konkretnych produktów. Analityk danych ma do dyspozycji dane historyczne dotyczące sprzedaży danych produktów. Z tych danych może wyliczyć zyski firmy z poszczególnych miesięcy i wizualizuje je tworząc wykresy. Wykresy te wraz ze swoimi spostrzeżeniami zapisuje tworząc raport ze swoich analiz.

Data Science

Jeśli Data Science jest domem dla różnych metod i narzędzi, to Analityka Danych jest jednym z pokoi w tym domu.

W przeciwieństwie do Analityki Danych, Data Science nie ogranicza się do odpowiadania na istniejące już konkretne pytania i problemy. Osoba pracująca jako Data Scientist poza sprawdzaniem stawianych hipotez, zadaje pytania, próbuje budować zależności i rozwiązuje nowe problemy. Stawiane pytania mogą być na tyle nieoczywiste, że wcześniej nikt nie zdawał sobie sprawy, że odpowiedzi na nie mogą wprowadzić kolejne innowacje i zyski. Wszystko to brzmi dość abstrakcyjnie, więc spróbujmy to jeszcze skonkretyzować. Data Science jest interdyscyplinarną dziedziną wykorzystującą statystykę, ekonometrię, analizę danych i metody sztucznej inteligencji oraz wiedzę dziedzinową (ang. domain knowledge). Data Scientist buduje i tworzy modele statystyczne i algorytmy uczenia maszynowego głównie w celach predykcyjnych używając przy tym ustrukturyzowane i nieustrukturyzowane dane. Wiele osób, które próbują określić czym jest Data Science pisze, że jeśli Data Science jest domem dla różnych metod i narzędzi, to Analityka Danych jest jednym z pokoi w tym domu.

Przykładowy problem i zadanie do wykonania:

Firma X nie jest zadowolona z zysków ze sprzedaży produktów, o których raport dostarczył wcześniej analityk danych. Firma ta postanawia skierować zapytanie do grupy Data Scientist’ów, czy widzą jakąś możliwość zwiększenia tych zysków. Osoby pracujące w grupie Data Science zadają sobie pytania np. Czy klienci, którzy kupili określony produkt posiadają jakieś charakterystyczne cechy. Data Scientist’ci wykorzystują różne metody i sprawdzają jakie cechy klienta mogły spowodować, że prawdopodobieństwo zakupu danego produktu wzrosło. Posiadając takie informacje są w stanie powiedzieć do jakich klientów skierować różne kampanie reklamowe. Takie właśnie działania mogą sprawić, że sprzedaż i jednocześnie zyski z zakupu wzrosły.

Typowe umiejętności

Umiejętności i znajomość typowych narzędzi może się bardzo różnić zarówno wśród Analityków Danych, jak i u Data Scientist’ów. Wszystko zależy od branży i często nawet firmy w jakich osoby z tych obszarów pracują. Typową i bardzo widoczną różnicą często jest programowanie. Można być analitykiem danych bez znajomości języków programowania, ale nie jest to możliwe, żeby być Data Scientist’em.

Typowe umiejętności Analityka Danych:

  • Strukturalny język zapytań SQL
  • Umiejętność krytycznego myślenia
  • Umiejętność prezentowania
  • Statystyka
  • Wizualizacje danych
  • Tworzenie raportów
  • Microsoft Excel
  • Język programowania R lub Python

Typowe umiejętności Data Scientist’a:

  • Strukturalny język zapytań SQL
  • Umiejętność krytycznego myślenia
  • Umiejętność prezentowania
  • Statystyka i algebra liniowa
  • Wizualizacje danych
  • Przynajmniej jeden język programowania: R, Python, Scala
  • SAS – szczególnie w bankowości
  • Algorytmy uczenia maszynowego

Podsumowanie

Mimo że istnieją różnice i podobieństwa pomiędzy Analityką Danych i Data Science, to jest jedna rzecz, bez której żadne z nich nie miałoby racji bytu – oczywiście chodzi o dane. Obecnie na rynku pracy jest duże zapotrzebowanie zarówno na osoby wyspecjalizowane w Analityce Danych, jak i Data Science. Najprawdopodobniej nie ulegnie to zmianie i można się wręcz spodziewać, że zapotrzebowanie będzie jeszcze bardziej rosło. Z Data Science mocno wiążą się też takie obszary jak uczenie maszynowe (ang. Machine Learning), głębokie sieci neuronowe (ang. Deep Learning) i sztuczna inteligencja i to będzie jednym z kolejnych tematów moich artykułów. Jeśli tylko czujesz, że któryś z tych obszarów jest dla Ciebie lub jesteś zainteresowany taką tematyką, to obserwuj mojego bloga, a zapewne znajdziesz tutaj coś dla siebie. 🙂

Bibliografia:

  1. Data Analytics vs. Data Science, Kristin Burnham
  2. Data Science vs. Data Analytics — What’s the Difference?, Dana Liberty
  3. Data Science vs Data Analytics — How to decide which one is right for you?, Springboard India
  4. Data Science vs. Data Analytics vs. Machine Learning: Expert Talk, Srihari Sasikumar
  5. Photo by Myriam Jessier on Unsplash

Zostaw komentarz

Twój adres e-mail nie zostanie opublikowany.

pl_PL