Text Mining und Natural Language Processing I
Unkategorisierte Kundenservice-Anfragen, Verträge ohne automatisiertes Ablagesystem, wissenschaftliche Veröffentlichungen, Leserkommentare in einer Online Community – all das sind Beispiele für unstrukturierte Textdaten, die heute oft noch manuelle verarbeitet werden.
Methoden der Textanalyse und der Verarbeitung natürlicher Sprache (NLP) können heute helfen, diese bisher manuell durchgeführten, zeitaufwändigen und fehlerbehafteten Prozesse effizienter zu gestalten und ermöglichen neue Einblicke. Zusätzlich bieten sie großes Potenzial, Kosten einzusparen oder sich einen Wettbewerbsvorsprung durch neues Wissen zu erarbeiten – und dabei die eigenen Nerven zu schonen.
Linguistische Methoden, Vektorisierung, Clustering, Topic Modelling und Klassifikation gibt es viele Methoden, die unterschiedliche Probleme lösen und geschickt kombiniert sich besonders in Kombination zu ihrer größten Leistungsfähigkeit entfalten können.
Im Training zeigen wir, wie man die gesamte Textverarbeitungspipeline automatisiert – von der reinen Texterfassung, der Bereinigung der Texte, der Anreicherung mit Hilfe von Machine Learning bis zur visuellen Darstellung. Anhand eines Beispielprojekts lernen die Teilnehmer alle Stufen kennen und erlangen.
Dieses erste Training zu Text Mining und NLP erklärt am Vormittag klassische Methoden des Text Mining, die auch ohne die neueren Methoden aus Teil II (am Nachmittag) gewinnbringend eingesetzt werden können.
Vorkenntnisse
* Das Training richtet sich an alle Entwickler, Architekten und Data Scientists, die sich mit der Massenverarbeitung von Text auf dem Level der Architektur, der Implementierung und dem laufenden Betrieb beschäftigen möchten.
* Vorkenntnisse in Python und in Machine Learning sind ebenso hilfreich wie der Umgang mit Jupyter-Notebooks.
Lernziele
Teilnehmer können nach dem Workshop eigene Textanalyse-Projekte mit der vorgestellten Pipeline starten und kennen sich mit den verwendeten Techniken (NLP, Vektorisierung, Klassifikation, Topic Modelling) aus.