El rol del Data Scientist

El Data Science o la Ciència de les Dades, moltes vegades confosa amb el concepte de Big Data, és una evolució de la tradicional anàlisi de dades. Amb l’avanç de les noves tecnologies i la irrupció de la quarta revolució industrial, les tècniques que abans ens servien per analitzar i extreure informació de les dades, han quedat obsoletes. Això ha passat bàsicament per dues raons:

  • En primer lloc, perquè han aparegut mètodes d’anàlisi molt més potents i precisos.
  • I en segon lloc, perquè la quantitat i la qualitat de les dades de què disposem han crescut tan exponencialment que els antics mètodes ja no són ni tan precisos ni tan eficients en molts casos.

La figura del Data Scientist

Així doncs, es requereix una figura que sigui la pertinent (r)evolució del típic analista de dades. Una figura capaç d’entendre les noves tecnologies i les noves metodologies d’anàlisi, capaç de reinventar-se i continuar aprenent a gran velocitat i, sobretot, capaç de traduir-ho tot a un llenguatge “apte per a tots els públics”. Posant tots aquests requisits en una coctelera i sacsejant-la sorgeix la figura del Data Scientist, l’evolució de l’analista de dades tradicional que estàvem buscant.

Com treballa un Data Scientist i quina és la seva metodologia?

Hi ha diverses metodologies de treball, i com que la majoria tenen els mateixos punts clau, el següent gràfic és molt il·lustratiu del que és el cicle de vida d’un projecte dut a terme per un Data Scientist.

  1. Es comença amb la comprensió del problema de negoci, típicament mantenint reunions amb els usuaris finals del projecte i actualitzant-se amb la literatura disponible i exemples prèviament efectuats en aquest camp.
  2. Tot seguit cal entendre quines dades es tenen, on i com se’n pot disposar i l’accessibilitat a aquestes dades.
  3. En el següent pas es netegen i preparen les dades.
  4. Un cop tenim el conjunt de dades net i “sa”, es comença el procés de modelització*.
  5. Amb els resultats dels models passem a l’avaluació dels resultats**.
  6. Finalment, els projectes solen acabar amb el desplegament dels models, industrialitzant-los o incorporant-los en el sistema informàtic del client.

Vols saber més sobre Data Science?

Per a tots aquells interessats a saber una miqueta més sobre Data Science us deixem algunes lectures recomanades:

  • Extens article sobre què és Data Science, qui és un Data Scientist i algun altre concepte bàsic d’aquest “món”: Fes click aquí
  • Article sobre les diferències entre un estadístic i un Data Scientist: Fes click aquí
  • Interessant web d’entrevistes en format podcast a diferents Data Scientists: Fes click aquí

VidaCaixa

Recent Posts

Antic subsidi per a persones de més de 55 anys el 2024

De vegades, l’edat pot ser un obstacle per trobar feina. Per ajudar a la reinserció…

3 dies ago

Ajuts a la dependència i cures en l’entorn familiar

Tenir cura d’un familiar en una situació de dependència és una feina que requereix temps…

3 dies ago

Com són les pensions màximes i mínimes el 2024

El sistema de pensions a Espanya és un dels pilars del nostre estat del benestar.…

3 dies ago

Així va néixer l’almoinera: de primera guardiola a bossa viral

La necessitat d’un objecte que et permeti transportar objectes personals, entre ells els diners, és…

4 dies ago

Inflació: què és, com es mesura i com ens afecta

L’augment de preus afecta la teva butxaca i la inflació s’ha convertit en un tema…

4 dies ago

Paga extra funcionaris 2024: com calcular-la i quan es cobra

Quan arriba l’estiu o Nadal i veiem que el nostre compte bancari treu fum, la…

5 dies ago