enterPy 2020: Vom Scripting zum Data Application Engineering
Data Science in der Praxis bedeutet fast immer auch Softwareentwicklung. Projekte aus dem Bereich Datenanalyse und Machine Learning beginnen meist sehr experimentell – hier unterstützen interaktive Notebook-Umgebungen wie Jupyter den Data Scientist dabei, die Daten zu explorieren und schnell Ideen auszuprobieren. Ergebnis ist oft eine mehr oder weniger aufgeräumte Sammlung von Notebooks und Python-Skripten, die noch weit von einer produktionsreifen Software entfernt ist. Es empfiehlt sich aber, schon früh Best Practices aus dem Software Engineering in den Workflow zu integrieren.