Download Diplomarbeit

Transcript
Andere Arten neuraler Netze haben etwa Feedbackpfade von Output- zu InputSchicht oder eine ringförmige Architektur. Die Eingabe für ein mehrschichtiges Netz
könnten z.B. Helligkeitswerte von Bildpunkten sein und seine Ausgabe ein Zahlenwert für die Erkennung eines bestimmten Musters. Die Initialisierung eines neuralen
Netzes erfolgt oft mit zufälligen Werten für die Gewichtungen der Verbindungen.
Beim Training des Netzes mit Beispieldaten wird der Klassifikationsfehler vom Output
in Richtung der Inputschicht zurückgerechnet (back-propagation). Dabei werden die
Gewichte entsprechend ihres Anteils an einem richtigen oder falschen Ergebnis verstärkt oder abgeschwächt. Das neuronale Netz findet auf diese Weise eine interne
Repräsentation für den Informationsgehalt der Daten.
4.6.2 PCA und ICA
Principal Component Analysis (PCA) und Independent Component Analysis (ICA)
sind Methoden, die Komplexität eines Merkmalsraumes durch die Auffindung von
orthogonalen Basisfunktionen (PCA) bzw. von entropiemaximierenden Basisfunktionen (ICA) zu reduzieren. Dadurch eignen sich diese Algorithmen zur Darstellung von
Merkmalen mit möglichst wenigen relevanten Parametern. Die Grundannahme ist,
dass sich ein Signal aus einer linearen Kombination verschiedener Quellen zusammensetzt. Die PCA liefert durch die Singulärwertzerlegung Komponentenfunktionen,
das Originalsignal kann durch Multiplikation der Komponenten mit einer Matrix aus
Eigenvektoren hergestellt bzw. durch die inverse Matrix in die Komponenten zerlegt
werden. Die ICA lockert die Bedingung der Orthogonalität. Sie eignet sich zur Separation unbekannter Signalquellen (blind source separation) in statistisch unabhängige
Komponenten und wird erfolgreich zur Artefaktkorrektur in Biosignalen eingesetzt, wo
etwa der Gehalt des EOGs aus dem EEG bei bestmöglicher Beibehaltung der EEGWellen entfernt werden soll. Bei der ICA werden zur Separation von N Quellen mindestens N Signalableitungen benötigt, die Aufteilung in Komponenten erfolgt nach
räumlichen Kriterien [MAK00].
4.6.3 SVMs
Support Vector Machines (SVMs) eignen sich für eine
binäre Klassifizierung eines Eingabevektors. Das Ergebnis der Klassifizierung ist positiv (enthalten) oder
negativ (nicht enthalten). Durch ein Training mit Datensätzen erfolgt eine Aufspaltung des Merkmalsraumes in zwei Hälften, wobei eine Hyperebene durch
die Trainingsdaten gelegt wird, die eine maximale
Distanz zu positiven und negativen Ergebnissen garantiert (Rand, Margin). Bei der Präsentation eines
neuen Vektors fällt dieser in eine Hälfte und wird entsprechend klassifiziert. Im Unterschied zu Neuronalen
Netzen finden SVMs immer ein globales Minimum
[BUR98].
- 83 -
Abb. 4.9: Klassifikation mit Support-Vektoren