Bonjour,
En faite j'ai un Homework de classification des images satellitaires. Je suis bloqué au niveau de split tedt train set pour faire un réseau de neurones ( deep learning). Je veux assurer que chaque groupe contient des données unique: pas de redondance dans les pixels. L'algorithme peut être quelques chose près de ca.
def train_valid_test_split (id_array, label_array, bands_array):
# 1- récuper la liste des classes
# boucler sur les classes, récupérer les ID uniques par classes
# faire un random shuffle sur les ID
# diviser la liste des ID (affecter 50% dans une liste train, 20% dans une liste validation, et 30% dans une liste test) à la fin de la boucle, récupérer les idx_train, idx_valid et idx_test en faisant np.where (np.isin( id_array, lstIDTrain/Valid/Test ))
# et renvoyer (return) les données (train/valid/test) des images et les labels sur les tableaux bands_array et label_array
return train_bands, valid_bands, test_bands, train_label, valid_label, test_label
Pourriez vous m'aider à écrire cette fonction SVP ??
-----