Tarbijatena jätame iga liigutusega veebiavarustesse endast maha andmeid. Teenusepakkujad koguvad kõik need kokku ja talletavad suurtesse andmebaasidesse.
- Koolitaja, andmebaaside professionaal Kaarel Moppel. Foto: Cybertec
Kuid mida nendega peaks edasi tegema? Kuidas andmeid baasides korrektselt talletada, hallata ning hiljem kätte saada töötlemiseks? Aitab sissejuhatus andmeteadusesse SQLi ja Pythoni abil.
Teisisõnu – tere tulemast andmeteadusesse ehk kuidas kogutud andmete põhjal teha kasulikke otsuseid! Andmeteadus ise on ükskõik milline tegevus, mis aitab andmete põhjal kasulikke otsuseid teha.
See võib tähendada mittetehnilisi toiminguid nagu kirjalikke analüüse või kirjeldavat statistikat, veidi tehnilisemat tööd nagu andmete ettevalmistamist või visualiseerimist, või matemaatiliselt keerulisemaid asju nagu ennustamist (masinõppe meetodeid kasutades).
Asukoht IT- ja ärimaailma vahepeal
Andmeteadus paikneb kuskil IT- ja ärimaailma vahepeal. See on elementaarne matemaatika, kus statistikateadmised on vajalikud, kuid teadusega pole sel midagi pistmist. Andmeteadus on andmetest info ammutamise ja suurandmete ehk big data tähenduse mõistmise kunst.
Tööstus 4.0, digitaliseerimine, masinõpe ja asjade internet on andmete kogumise täiesti uuele tasemele viinud. Statistikast tuleb välja, et praegu kogutakse paari päevaga sama palju andmeid kui seda tehti interneti algusest kuni millenniumini. Andmeteadus on nüüd teadusharu, millel on oluline tähtsus ettevõtluses-, tööstuse- ja teadusmaailmas.
Üks väga lihtne näide, mida andmeteadusega teha saab – mustrite paika panemisel etteantud tegevuste käivitumine. Kõik andmed, mida töödeldakse on märgistatud ehk meie enda sisestatud kriteeriumid.
Kaks iseloomulikku näidet
Illustratiivne näide: sisendiks on külm ilm ehk temperatuur -10 kraadi ja päikesepaiste, väljundiks aga algoritm või otsusutuspuu, mis annab kiiresti enam-vähem õige vastuse mingile küsimusele – antud juhul õiged tingimused mõnusaks suusatamiseks. Hea tulemuse jaoks on reeglina vaja palju sisendandmeid ja proovida paari erinevat algoritmilist lähenemist.
Samuti saab kasutada klasterdamist ehk sarnaste objektide automaatset grupeerimist. Nii on võimalik avastada ebaregulaarsusi, kus asi algab probleemist. Näiteks: annad ette mõned võtmekohad ja kui mingi näitaja on tavalisest erinev, siis tuleb kohe teade. Seda saaks kasutada koormuse kontrolliks. Kui iga päev on keskmine koormus A ja kui see peaks tavapärasest rohkem tõusma või kukkuma, siis tuleks selle kohta kohe teade vastutavale isikule.
Need on vaid kaks väga lihtsat näidet, mida andmeteadusega andmetest tuletada saaks. Päris maailm selle taga on palju avaram ja sügavam.
Koolitus annab baasteadmised
Kui teid huvitab andmeteadus, SQL ja algtasemel on teil ka programmeerimisoskus (Python), siis sissejuhatav koolitus andmeteadusesse on selleks kõige parem. Koolitusest saab baasteadmised, et siseneda andmeteaduse maailma.
Kaarel Moppel, andmebaaside professionaal ja praktik, seletab koolitusel lahti põhilised mõisted ja nende kasutusvaldkonnad, võetakse läbi levinumad andmeteaduse algoritmiklassid, õpitakse andmekogusid praktiliselt käsitlema failide ja SQL abil ning lõpetuseks viiakse läbi lihtsam andmeanalüüs ja visualiseerimine Pythoni abil.
Andmeteadus on suur ja väga oluline maailm paremate äriotsuste sisendi andmisel. Õppige, kuidas andmetega ümber käia, kuidas neid talletada ning mida kõike on võimalik andmetest välja tuua.
Ja eelnevalt veel kolm küsimust, millele mõelda:
Kas te juba väärindate kogutud andmeid, et teha nende baasil ärile kasulikke otsuseid?
Kas te sooviksite kulusid säästa otsustusprotsesside autmatiseerimise abil?
Kas tänapäeva andmeanalüüsi buzzword'id tekitavad segadust?
Kui tunned koolituse vastu huvi, siis rohkem infot leiad all olevalt lingilt!
Esimene koolitus toimub 24.-26. märtsil IT Koolituses.
Loe koolituse kohta rohkem siit!
See teema pakub huvi? Hakka neid märksõnu jälgima ja saad alati teavituse, kui sel teemal ilmub midagi uut!
Seotud lood
Arvutipargi renditeenus on mugav, säästlik ja (tuleviku)kindel. Green IT tegevjuht Asko Pukk usub, et ettevõtete äriline fookus peab alati olema enda põhitegevusel, sektoril, mida teatakse peensusteni, et olla konkurentidest paremad – just selleks vajaliku aja ja raha renditeenus vabastab.