Splunk for Analytics and Data Science (SADS) – Details

Detaillierter Kursinhalt

Thema 1 - Analyse-Workflow

  • Definieren Sie Begriffe aus den Bereichen Analytik und Datenwissenschaft
  • Beschreiben Sie den Arbeitsablauf für die Analyse
  • Beschreiben Sie gängige Nutzungsszenarien
  • Splunk Machine Learning Toolkit navigieren

Thema 2 - Explorative Datenanalyse

  • Beschreiben Sie den Zweck der Datenexploration
  • SPL-Befehle für die Datenexploration zu identifizieren
  • Aufteilung der Daten für Test und Training mit dem Befehl sample

Thema 3 - Vorhersage numerischer Felder mit Regression

  • Unterscheiden Sie Vorhersagen von Schätzungen
  • Identifizierung von Vorhersagealgorithmen und Annahmen
  • Beschreiben Sie die Passform und wenden Sie Befehle an
  • Modellierung numerischer Vorhersagen in MLTK und Splunk Enterprise
  • Verwenden Sie den Befehl score, um Modelle zu bewerten

Thema 4 - Bereinigen und Vorverarbeiten der Daten

  • Definition der Vorverarbeitung und Beschreibung ihres Zwecks
  • Beschreiben Sie Algorithmen, die Daten für die Verwendung in Modellen vorverarbeiten
  • Verwenden Sie FieldSector, um relevante Felder auszuwählen
  • Verwendung von PCA und ICA zur Reduzierung der Dimensionalität
  • Daten mit StandardScaler und RobustScaler normalisieren
  • Vorverarbeitung von Text mit Imputer, NPR, TF-IDF, HashingVectorizer und dem Befehl cluster

Thema 5 - Clusterdaten

  • Define Clustering
  • Identifizierung von Clustermethoden, Algorithmen und Anwendungsfällen
  • Verwenden Sie den Smart Clustering Assistant zum Clustern von Daten
  • Bewertung von Clustern anhand der Silhouettenbewertung
  • Prüfen Sie die Kohärenz von Clustern
  • Beschreiben Sie die besten Praktiken für Clustering

Thema 6 - Erkennung von Anomalien

  • Definition von Anomalieerkennung und Ausreißern
  • Identifizierung von Anwendungsfällen für die Erkennung von Anomalien
  • Verwendung des Splunk Machine Learning ToolKit Smart Outlier Assistant
  • Erkennen von Anomalien mit dem Algorithmus der Dichtefunktion
  • Optimierung der Anomalieerkennung mit lokalem Ausreißerfaktor
  • Ergebnisse mit der Visualisierung "Verteilungsdiagramm" anzeigen

Thema 7 - Schätzung und Vorhersage

  • Unterscheiden Sie Vorhersagen von Prognosen
  • Verwenden Sie den Smart Forecasting Assistant
  • Verwendung des StateSpaceForecast-Algorithmus
  • Multivariate Daten prognostizieren
  • Berücksichtigung der Periodizität in jeder Zeitreihe

Thema 8 - Klassifizierung

  • Definieren Sie wichtige Klassifizierungsbegriffe
  • Klassifizierungsalgorithmen verwenden
  • AutoPrediction
  • LogistischeRegression
  • SVM (Support-Vektor-Maschinen)
  • RandomForestClassifier
  • Bewertung von Kompromissen bei Klassifikatoren
  • Auswertung der Ergebnisse mehrerer Algorithmen