Aujourd'hui, les «big data», les «analytics» et autres sont des mots à la mode. Et pour une bonne raison.
En 2012, HBR a nommé «data scientist» le «travail le plus sexy du siècle». Mais qu'est-ce que la science des données implique vraiment? Et plus important encore, comment pouvez-vous acquérir les compétences nécessaires pour vous appeler un scientifique de données?
Qu'est-ce que Data Science?
Il était une fois, les scientifiques de données étaient la plupart du temps dans l'espace scolaire. Maintenant, avec la recrudescence de la grande collecte de données et le besoin d'analyse, les scientifiques de données sont devenus très en demande dans une gamme de sociétés et d'industries, petites et grandes.
La science des données en tant que profession incorpore une gamme de compétences dans les domaines des mathématiques, des statistiques et de la programmation informatique. C'est une industrie dominée par les hommes, les estimations des femmes en science des données sont d'environ 10%.
Selon Glassdoor, le salaire national moyen des chercheurs de données est de 113 436 $. En ce qui concerne la rémunération seule, la science des données est beaucoup plus attrayante que d'autres carrières similaires.
Compétences nécessaires pour être un scientifique de données
Comme tous les emplois, les compétences spécifiques requises pour occuper des postes en science des données dépendent de l'entreprise individuelle.
Mais il existe certains outils de compétences / logiciels qui restent cohérents.
- Langages de programmation statistiques, comme R et SAS
- Langage d'interrogation de base de données tel que SQL
- Statistiques de base telles que les tests statistiques, les distributions, les estimateurs du maximum de vraisemblance, etc.
- Méthodes d'apprentissage automatique telles que k-Plus proches voisins, forêts aléatoires, méthodes d'ensemble, etc.
- Calcul multivariable et algèbre linéaire
- Enregistrement de données et développement de nouveaux produits axés sur les données
- Connaissance de la plateforme Hadoop
- Outils de visualisation tels que Flare, HighCharts ou AmCharts
Comment devenir un chercheur de données
De nos jours, il existe trois options viables pour devenir un data scientist:
- Auto-apprentissage via des programmes comme Udacity
- Participer à un camp d'entraînement en science des données
- Aller à l'école d'études supérieures pour une maîtrise
Bien sûr, il y a des avantages et des inconvénients à chaque méthode.
Auto-étude
Avantages:
- Pratique: peut être fait sur votre propre temps dans n'importe quel environnement et à tout rythme
- Abordable: pourrait coûter de 0 à 600 $.
- Gain de temps: les cours en ligne peuvent être complétés dans les 8-18 mois.
Les inconvénients:
- Recevoir seulement un certificat après l'achèvement
- Pas de participation de pair à pair ou d'enseignant à étudiant
- Aucune aide à la recherche d'emploi
Boot Camp de Data Science
Avantages:
- Peu de temps engagement: peut être complété dans 6 semaines à 3 mois
- Relativement abordable, au moins par rapport à l'obtention d'une maîtrise (les camps d'entraînement varient de 16 000 $)
- Idéal pour ceux qui cherchent à changer de carrière rapidement
- De nombreux camps d'entraînement offrent une assistance dans le processus de recherche d'emploi après l'achèvement
Les inconvénients:
- N'obtenez qu'un portefeuille de projets - pas de «véritable» expérience de travail
- Beaucoup à apprendre dans un court laps de temps
- Pourrait être jusqu'à 40 heures par semaine de travail (contrairement à l'auto-apprentissage où vous pouvez aller à votre propre rythme et toujours travailler à temps partiel / temps plein)
Une maîtrise
Avantages:
- Diplôme à l'achèvement
- Apprentissage structuré avec des instructeurs professionnellement formés
- Expérience dans le monde réel: de nombreux programmes comprennent des stages qui ajouteront à l'expérience et aux connaissances
- Beaucoup de temps pour apprendre et absorber toutes les informations
Les inconvénients:
- Cher: pourrait coûter entre 20 000 $ - 70 000 $ - sans compter les frais de subsistance
- Longue durée: peut aussi prendre le plus longtemps (9-20 mois)