Salut la communauté
J'aimerai créer un algorithme à partir d'un fichier texte, mais étant débutant je rencontre des difficultés dans l'élaboration de l'algorithme, j'en suis pour l'instant seulement à la rédaction manuscrite.
Je vous explique l'idée :
J'aimerai extraire d'un fichier texte (en l’occurrence un fichier de sous-titrage vidéo au format srt.), uniquement les parties qui m'intéresse (à savoir les dialogues) qui sont entrecoupées par les marqueurs temporels pour indiquer le timing des sous-titres lors de la lecture vidéo. Je cherche donc à récupérer toutes les phrases du fichier et les remettre dans l'ordre, à la suite.
---
Petit exemple :
94
00:06:08,076 --> 00:06:11,021
J'ai pris soin
de préciser l'heure et le lieu
95
00:06:11,188 --> 00:06:12,956
lors de mon appel anonyme.
---
Du coup, j'aimerai que mon résultat final soit : "J'ai pris soin de préciser l'heure et le lieu lors de mon appel anonyme."
L'idée la plus simple serait peut-être de supprimer tous les nombres, mais c'est pas très satisfaisant car si il y a des nombres dans le dialogue que j'aimerais garder. Est-ce que je pourrais faire en sorte de ne pas supprimer les nombres qui sont insérés dans une chaîne de caractères ? Ex : " Il est partit à 11h du matin". Est-ce que je pourrais par exemple faire comprendre à l'ordinateur : 1) ceci est une phrase 2) tous les chiffres doivent être supprimés sauf ceux qui sont insérés dans une phrase ??
Aussi, vous me recommandez d'utiliser quel langage pour faire ça ? Python ?
En tout cas merci d'avance pour votre aide je vous serais infiniment reconnaissant ! Clem.
-----