Download Diplomarbeit
Transcript
Andere Arten neuraler Netze haben etwa Feedbackpfade von Output- zu InputSchicht oder eine ringförmige Architektur. Die Eingabe für ein mehrschichtiges Netz könnten z.B. Helligkeitswerte von Bildpunkten sein und seine Ausgabe ein Zahlenwert für die Erkennung eines bestimmten Musters. Die Initialisierung eines neuralen Netzes erfolgt oft mit zufälligen Werten für die Gewichtungen der Verbindungen. Beim Training des Netzes mit Beispieldaten wird der Klassifikationsfehler vom Output in Richtung der Inputschicht zurückgerechnet (back-propagation). Dabei werden die Gewichte entsprechend ihres Anteils an einem richtigen oder falschen Ergebnis verstärkt oder abgeschwächt. Das neuronale Netz findet auf diese Weise eine interne Repräsentation für den Informationsgehalt der Daten. 4.6.2 PCA und ICA Principal Component Analysis (PCA) und Independent Component Analysis (ICA) sind Methoden, die Komplexität eines Merkmalsraumes durch die Auffindung von orthogonalen Basisfunktionen (PCA) bzw. von entropiemaximierenden Basisfunktionen (ICA) zu reduzieren. Dadurch eignen sich diese Algorithmen zur Darstellung von Merkmalen mit möglichst wenigen relevanten Parametern. Die Grundannahme ist, dass sich ein Signal aus einer linearen Kombination verschiedener Quellen zusammensetzt. Die PCA liefert durch die Singulärwertzerlegung Komponentenfunktionen, das Originalsignal kann durch Multiplikation der Komponenten mit einer Matrix aus Eigenvektoren hergestellt bzw. durch die inverse Matrix in die Komponenten zerlegt werden. Die ICA lockert die Bedingung der Orthogonalität. Sie eignet sich zur Separation unbekannter Signalquellen (blind source separation) in statistisch unabhängige Komponenten und wird erfolgreich zur Artefaktkorrektur in Biosignalen eingesetzt, wo etwa der Gehalt des EOGs aus dem EEG bei bestmöglicher Beibehaltung der EEGWellen entfernt werden soll. Bei der ICA werden zur Separation von N Quellen mindestens N Signalableitungen benötigt, die Aufteilung in Komponenten erfolgt nach räumlichen Kriterien [MAK00]. 4.6.3 SVMs Support Vector Machines (SVMs) eignen sich für eine binäre Klassifizierung eines Eingabevektors. Das Ergebnis der Klassifizierung ist positiv (enthalten) oder negativ (nicht enthalten). Durch ein Training mit Datensätzen erfolgt eine Aufspaltung des Merkmalsraumes in zwei Hälften, wobei eine Hyperebene durch die Trainingsdaten gelegt wird, die eine maximale Distanz zu positiven und negativen Ergebnissen garantiert (Rand, Margin). Bei der Präsentation eines neuen Vektors fällt dieser in eine Hälfte und wird entsprechend klassifiziert. Im Unterschied zu Neuronalen Netzen finden SVMs immer ein globales Minimum [BUR98]. - 83 - Abb. 4.9: Klassifikation mit Support-Vektoren