Erste Schritte in Data Science - Wie du praktische Erfahrungen sammelst (2024)

Eines der Hauptprobleme von Anfängern in Data-Science ist das Sammeln erster Erfahrungen. Du bist motiviert zu lernen und entschlossen, den Sprung ins Data Science Becken zu wagen? Dir fehlt das praktische Wissen, um dir die Hände mit realen Daten schmutzig zu machen? Dann ist dieser Artikel das Richtige für dich!

Wir gucken uns an, wie du deine Reise in die Datenverarbeitung beginnen kannst. Darüber hinaus gehen wir darauf ein, wie du ein erfolgreiches Bewerbungsgespräch führst.
Der Einfachheit halber gucken wir uns den Ablauf in 5 Schritten an.

Einer der häufigsten Fehler von Anfängern ist es, nach x-beliebigen Daten zu suchen. Diese wollen sie nutzen, um ihre neu erlernten Fähigkeiten zum ersten Mal einzusetzen und zu üben. Bis zu einem gewissen Grad besteht hier kein Problem, vor allem, wenn du noch lernst, Algorithmen und Techniken anzuwenden. Lediglich traditionelle Algorithmen in diesem Bereich zu kennen, reicht nicht aus. Du brauchst Übung mit Daten, die sich auf spezifische Branchen beziehen.

Sehen wir uns dafür ein Beispiel an:

Nehmen wir an, du möchtest in der Automobilbranche arbeiten. Hierfür belegtest du Kurse zu den Themen Datenanalyse und Machine Learning. Gearbeitet hast du mit Bundesligadaten desselben Jahres, wodurch du wichtige Erkenntnisse und Vorhersagen entschlüsseln konntest. Des Weiteren arbeitetest du mit den berüchtigten “Vorhersage zu Wohnungspreisen”-Daten. Dadurch warst du in der Lage, dein Wissen zu Machine Learning einzusetzen. Aus diesem Grund denkst du, dass du eine gute Partie für die Automobilfirma bist. Du kennst dich mit Datenanalyse und Machine Learning Techniken aus, und die Erfahrung ist das i-Tüpfelchen.

Mit diesem Selbstbewusstsein bewirbst du dich zuversichtlich für die Stelle eines Data Engineers… und erhältst eine Absage. Wieso?

Der Grund ist, dass es eine andere Person mit denselben technischen Fähigkeiten wie dich gab. Diese Person hat zusätzlich mit Daten aus der Automobilindustrie — wie die “Risikoanalyse bei autonomen Fahrzeugen” gearbeitet.

Die Arbeit mit Daten ist nicht die einzige Art von Kenntnis, die du besitzen musst. Business Intelligence-Tools Kenntnisse wie PowerBI oder MLOps sind besonders wichtig. Durch dieses Wissen verwenden rekrutierende Unternehmen und Kunden weniger Zeit für den Wissenstransfer. Das Gleiche gilt für die Interpretation der Daten, da Einsicht in die Funktionsweise der Branche und ihre Fachbegriffe besteht.

Du brauchst dir aber keine Sorgen machen, wenn du dir bei der Wahl der Branche unsicher bist. Die wenigsten wissen zu Beginn ihrer Karriere, wo sie letztendlich landen wollen oder werden. Wähle zunächst einmal eine Branche aus und erkunde sie, bis die anfängliche Neugier vergeht. (“Schließlich beginnt Lernen mit Neugierde, nicht wahr?”)

Kurz gesagt: Sammle praktische Erfahrungen mit den Daten der Branche, in der du in Zukunft arbeiten willst.

“Wenn ich eine Stunde Zeit hätte, um den Planeten zu retten, würde ich 59 Minuten damit verbringen, das Problem zu definieren und eine Minute, um es zu lösen” — Albert Einstein

An dieser Stelle fragst du dich vielleicht, ob die Erfahrung mit relevanten Branchendaten “der einzige entscheidende Teil” ist. Nun, das stimmt nicht ganz.

Du musst Zeit aufwenden, um zu verstehen, wie diese Branche funktioniert. Dies wird dir helfen, bestehende Probleme der Branche zu erkennen. Ohne ein Problem, das es zu lösen gilt, gibt es keine Arbeit für dich!

Wenn du die Einflussfaktoren und die Problematiken kennst, mit denen ein Unternehmen konfrontiert wird, kannst du diese eher lösen. So verfügst du über mehr Motivation und Wissen, um das Problem anzugehen. Darüber hinaus verbessern sich deine analytischen Fähigkeiten. Letztendlich, wenn du einen Weg findest, um einer Organisation in deiner Zielbranche beizutragen, wirst du zu einer nützlichen Ressource.

Kurz gesagt: Verstehe die Arbeit, finde das Problem, schaffe Platz für dich!

“Kaggle” sollte kein Fremdwort für dich sein, wenn du in die Welt der Datenwissenschaften einsteigst. Es ist der Tempel des Lernens für Anfänger und ein Experimentierfeld für Fortgeschrittene. Wenn du die ersten beiden Punkte soweit abgeschlossen hast, ist der nächste Schritt, Daten zu finden, um praktische Erfahrungen zu sammeln. Kaggle hat eine Fülle von Datensätzen für jedes Interessenfeld. Such nach dem Bereich, der dich interessiert, wie Gesundheitswesen, Bildung, Fintech, Reisen, Online-Shopping oder ähnliches.

Jeder Datensatz, der auf Kaggle vorhanden ist, hat eine Beschreibung, wie und woher die Daten stammen. Das erweist sich als besonders hilfreich, wenn du ein Fazit ziehst und Berichte erstellst. Mach dir keine Sorgen, wenn du einmal festhängst, die Kaggle-Community und ihre Diskussionsforen sind in solchen Momenten für dich da. Im schlimmsten Fall sind die Beiträge von Teilnehmern verfügbar. Diese sind hilfreich, um gute Ausgangspunkte zu finden — eine häufige Schwierigkeit für Anfänger.

Lade zunächst einen Datensatz aus deinem Interessengebiet herunter, der dich am meisten interessiert und motiviert. “An Tagen, an denen du 1000 Gründe zum Aufgeben hast, wird deine Motivation als Treibstoff dienen”. Mach es dir also nicht noch schwerer.

Tauch also in die Daten ein und entwickle deinen eigenen Ansatz für:

1. Datenbereinigung
2. Formuliere relevante Fragen, um in der Analyse voranzukommen
3. Entwicklung von Merkmalen
4. Visualisierung deiner Ergebnisse
5. Berichterstattung
6. Modellbildung und Vorhersagen (für ML-Aufgaben)

Kurz gesagt: Lade einen Datensatz herunter und mach dir die Hände schmutzig. Vergiss nicht, deine Arbeit auf github und im Kaggle-Profil zu dokumentieren.

Wettbewerbe/Hackathons sind eine gute Möglichkeit, um herauszufinden, wo du in Sachen Lernen stehst. Es ist jedoch ein No-Go für absolute Anfänger. Diese Wettbewerbe wirken ohne ein grundlegendes Verständnis des Themas und der erforderlichen Programmierkenntnisse einschüchternd.

Lernende, die bereits Erfahrung haben und 2–3 Projekte zum Selbststudium durchgeführten, können ihre Hackathon-Reise mit Wettbewerben auf Anfängerniveau beginnen. Die Auszeichnungen, die du in solchen Wettbewerben erhältst, werden von Recruitern und der Data Science Gemeinschaft hoch angesehen.

Data Science-Hackathons ausgerichtet, um ein reelles Problem aus einer Industrie darzustellen. Die Teilnehmenden müssen innerhalb einer Zeitspanne eine Lösung für dieses Problem finden. Hierbei gewinnt die Lösung mit der höchsten Präzision und Relevanz. Am Ende stellt jedes Team seine Idee und seinen Ansatz zur Antwort des Problems in einer Präsentation vor.

Ein Beispiel:

Du erhältst einen Datensatz über die LinkedIn-Marketingkampagnen eines Unternehmens. Die Aufgabe lautet, die wichtigsten Erkenntnisse über die Marketingkampagne herauszufinden. Sprich: Was funktionierte und wo und wann sollte das Unternehmen in Zukunft investieren. (Ziemlich realistisch und geschäftskritisch, nicht wahr?)

Die beliebtesten Plattformen für diese Hackathons, mit denen du dich auseinandersetzen solltest sind: Kaggle, DrivenData, DataCrunch, HackerEarth und Topcoder.

Bei diesen Wettbewerben entwickelst du die Kompetenz, in einem funktionsübergreifenden Team schnell Probleme zu lösen. Das leitet dich an, deine Grenzen zu kennenzulernen. Nicht zu vergessen, es ist eine gute Gelegenheit zum Networking mit den Unternehmen, die diese Wettbewerbe sponsern. Darüber hinaus erhältst du die Möglichkeit dich zu vernetzen, was ein zusätzlicher Vorteil der Teilnahme ist. So erhältst du auch praktisches Verständnis für die alltäglichen Aufgaben eines Data Scientists. Besonders für Personen, die keinerlei Berufserfahrung in diesem Bereich haben, kann dies interessant sein.

Kurz gesagt: Nimm an Hackathons teil, um Hacks zu entwickeln. Neben den Hackathons kannst du helfen, indem du Fragen auf Stack Overflow und anderen Plattformen beantwortest.

Du hast alle vier oben genannten Punkte befolgt und begeisterst dich weiterhin für das Gebiet der Informatik? Dann möchtest du wahrscheinlich mit diesen Fähigkeiten Geld verdienen — wieso auch nicht?

Aber bevor du vor dem Bewerbungsgespräch stehst, musst du dein Portfolio und Lebenslauf erstellen. Ein Kaggle-Profil und ein GitHub-Repository mit dokumentierten Projekten helfen dir, dein Profil hervorzuheben. Füg deine erwähnenswerten Hackathon-Erfahrungen in deinen Lebenslauf ein. Zur Vorbereitung auf das Vorstellungsgespräch kannst du Websites wie Leetcode und HackerEarth nutzen. Diese Websites enthalten sowohl branchenbezogene Fragen als auch Fragen zu verschiedenen Data Science Themen.

Neben statistischen Konzepten und Wahrscheinlichkeitstheorie sind grundlegende Modellierungskonzepte wichtig. Beispiele hierfür sind: Regression, Klassifizierung und Clustering ebenfalls wichtig und sollten vor dem Bewerbungsgespräch nochmal aufbereitet werden. Um deine statistischen Konzepte aufzufrischen, kannst du mehrere Seiten besuchen, darunter Brilliant.org und MIT Open courseware. Diese sind kostenlos erhältlich und werden von FAANG-Recruitern empfohlen.

Kurz gesagt: Bereite dich auf die Data Science Theorie für Bewerbungsgespräche vor.

Mit diesen Schritten wirst du bald in deiner Karriere voll durchstarten können.

Sammle also weiter notwendige, praktische Erfahrungen, um deine Data Science Karriere so zu gestalten, wie du es möchtest. Zwar gibt keine Garantie für den Erfolg, aber wie Sir Isaac Newton einst sagte: “Meine Kräfte sind gewöhnlich. Nur meine Anwendung bringt mir Erfolg”

Wende weiterhin dein Wissen an, denn du weißt nie, wann ein weiser Apfel deinen Kopf trifft!

Ein Blogartikel reicht dir nicht? Dann schau dir gerne auch unser YouTube Video zu dem Thema praktische Erfahrungen in Data Science an.

Hast du Interesse daran, eine Karriere im Bereich Data Science zu starten? Dann ist der Datamics Karriereguide das richtige für dich!

Der Karriereguide — mehr als nur die praktische Erfahrung
Du hast noch nichts von unserem Karriereguide gehört? Wir haben eine Übersicht der wichtigsten Themen für dich zusammengestellt, die dir bei der Orientierung in deiner Karriere helfen soll. Die praktische Erfahrung ist nur einer der wichtigen Punkte — zum Lebenslauf, Hardskills und Networking gesellen sich auch noch wichtige andere Themen.

Zum Download geht’s hier lang >> Download Karriereguide <<

Erste Schritte in Data Science - Wie du praktische Erfahrungen sammelst (2024)
Top Articles
Latest Posts
Article information

Author: Dong Thiel

Last Updated:

Views: 6124

Rating: 4.9 / 5 (79 voted)

Reviews: 86% of readers found this page helpful

Author information

Name: Dong Thiel

Birthday: 2001-07-14

Address: 2865 Kasha Unions, West Corrinne, AK 05708-1071

Phone: +3512198379449

Job: Design Planner

Hobby: Graffiti, Foreign language learning, Gambling, Metalworking, Rowing, Sculling, Sewing

Introduction: My name is Dong Thiel, I am a brainy, happy, tasty, lively, splendid, talented, cooperative person who loves writing and wants to share my knowledge and understanding with you.