Feature Extraction bei Bildern < Künstl. Intelligenz < Praktische Inform. < Hochschule < Informatik < Vorhilfe
|
Hallo
Ich habe ein Datensatz bestehend aus FMRI Bildern. Jedes Bild gehört zu einer Klasse. Der Datensatz ist wie folgt:
Class 1: 9 images
Class 2: 10 images
Class 3: 6 images
Class 4: 12 images
Jedes Bild ist 4D (time series), d.h. 90x60x10x350 wobei 350 die zeitliche Dimension ist (i.e. 350 3D Volumen). I möchte nun einen machine learning classifier auf diesen Daten trainieren.
Nun möchte ich zuerst feature extrahieren und dann feature selection anwenden, z.B. PCA und dann clustering wie es im paper "Principal Feature Analysis: A Multivariate Feature Selection Method for fMRI Data" beschrieben ist (http://www.hindawi.com/journals/cmmm/2013/645921/). Für feature extraction sehe ich folgende Möglichkeiten:
1. Jedes voxel is ein Feature und man nimmt den Durchschnitt der time series jedes Voxels. Jedes Bild hat somit genau ein feature Vektor mit Dimension 90*60*10 = 54'000.
2. Jedes Voxel ist ein Feature und jeder Zeitpunkt (d.h. jedes 3D Volumen) ist ein Datenpunkt. Jedes Bild hat somit 350 feature Vektoren wobei jeder Feature Vektor Dimension 90*60*10 = 54'000 hat.
3. Alle Voxel der ganzen time series in einen feature Vektor packen, welcher Dimension 90*60*10*350 = 18'900'000 hat. Jedes Bild hat nur einen feature Vektor.
4. Die correlation Werte zwischen allen Voxel berechnen und den Wert als feature nehmen. Dies ist aber rechnerisch wohl nicht machbar.
Ich ziehe 2. vor aber ich bin mir nicht sicher ob das eine gute Idee ist.
Wie würdet ihr die feature extraction machen? Und wie würdet ihr es mit correlation mit einem rechnerisch lösbaren Aufwand machen?
Wie würdet ihr die cross-validation auf dem Datensatz machen? Das Problem ist ja, dass die Klassen unausgewogen sind...
Vielen Dank für euere Antworten.
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 00:20 Sa 30.05.2015 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|