Data Science Bücher – Theorie und Praxis

In diesem Beitrag möchte ich einige meiner empfohlenen Bücher zum Erlernen von Data Science und maschinellem Lernen in Theorie und Praxis vorstellen.

Theorie

Dies sind alles grundlegende Lehrbücher des maschinellen Lernens. Wenn Sie mindestens eines davon eingehend studieren, d. h. das Formulieren von Modellen, das Ableiten und Implementieren der wichtigsten Inferenzalgorithmen und das Durchführen der Übungen, haben Sie einen soliden Hintergrund. Die Bücher können ziemlich technisch sein, wenn Sie neu im Bereich des maschinellen Lernens sind, aber sobald Sie eines durchgearbeitet haben, werden Sie andere recht zugänglich finden.

  • The Elements of Statistical Learning (ESL), von Jerome H. Friedman, Robert Tibshirani und Trevor Hastie
    Einer der Klassiker, es gibt auch einen Online-Kurs und ein neues Lehrbuch, begleitet von R-Code.

  • Mustererkennung und maschinelles Lernen (PRML) von Christopher Bishop
    Ähnlich wie ESL ist dieses hoch angesehene Buch ein weiteres Muss.

  • Maschinelles Lernen: Eine probabilistische Perspektive, von Kevin R. Murphy
    Wenn Sie PRML gründlich studieren, werden Sie mit den meisten Inhalten in Murphys Buch vertraut sein. Nichtsdestotrotz ein unterhaltsames und umfassendes Buch mit einem starken Fokus auf einen prinzipiellen, probabilistischen Ansatz zur Modellierung. Es kommt auch mit Code in Matlab.

  • Probabilistische grafische Modelle, Daphne Koller und Nir Friedman
    Grafische Modelle bieten einen Rahmen für die Darstellung, Inferenz sowie das Lernen probabilistischer Modelle. Dieses leistungsstarke Framework bietet eine vereinheitlichende Sicht auf viele ML-Modelle, die ansonsten nur als ein Bündel unterschiedlicher Modelle angesehen werden könnten. Es gibt auch einen Online-Kurs auf Coursera.

  • Reinforcement Learning, eine Einführung, von Richard S. Sutto und Andrew G. Barto
    Obwohl es sich noch um einen Entwurf handelt, ist die zweite Veröffentlichung gut geschrieben und motiviert die Konzepte und Anwendungen von RL wirklich gut.

  • Neuronale Netze und Deep Learning, von Michael Nielsen

  • Deep Learning, Ian Goodfellow und Yoshua Bengio und Aaron Courville
    Das Buch von Michael Nielsen ist praktischer und enthält einige coole interaktive Inhalte zum besseren Verständnis, während Goodfellow et al. umfassender ist. Ich empfehle, sie in der angegebenen Reihenfolge zu lesen.

Trainieren

Datenwissenschaft für Unternehmen, von Foster Provost und Tom Fawcett
Dieses Buch ist für technisch nicht versierte Zielgruppen wie Unternehmensmanager zugänglich. Es enthält auch einige solide Prinzipien zur Durchführung von Data-Science-Projekten. Sehr empfehlenswert.

  • R für Data Science, von Garrett Grolemund und Hadley Wickham, http://r4ds.had.co.nz/
    Dies ist ein Muss, insbesondere für R-Benutzer.

  • Angewandte Vorhersagemodellierung, von Kjell Johnson und Max Kuhn
    Geschrieben vom Autor des beliebten R-Pakets caret, ist dies ein weiteres Muss. Es enthält viele praktische Tricks und Ratschläge nicht nur für die Modellierung, sondern auch für die Datenaufbereitung, die für verschiedene Modellklassen geeignet ist.

  • Data-Mining-Techniken: Für Marketing, Vertrieb und Kundenbeziehungen, von Gordon S. Linoff und Michael JA Berry
    Lassen Sie sich vom Titel nicht in die Irre führen, dies ist eine gute Lektüre zu Data-Science-Techniken im Allgemeinen, nicht nur für CRM.

  • Datenaufbereitung für Data Mining, von Dorian Pyle
    Dieses Buch, das 1999 veröffentlicht wurde, aber auch heute noch sehr aktuell ist, bietet eine gute Checkliste mit Dingen, die bei der Vorbereitung von Daten für die Analyse zu überprüfen sind.

  • Bandit-Algorithmen zur Website-Optimierung, von John Myles White
    Dieses Buch stellt Standardalgorithmen für mehrarmige Banditen vor und enthält Implementierungen in mehreren Sprachen.

  • Praktische Data Science mit R, John Mount und Nina Zumel
    Nicht so ausgefeilt wie das Buch von Johnson und Kuhn, aber mit wenigen netten Techniken, die man kennen sollte.

Similar Posts

Leave a Reply

Your email address will not be published.