Comment expliquer que son ordinateur « rame » pour rechercher une donnée qu’il contient, alors qu’il donne une solution quasi immédiate en parcourant l’ensemble du Net ?
-----
Comment expliquer que son ordinateur « rame » pour rechercher une donnée qu’il contient, alors qu’il donne une solution quasi immédiate en parcourant l’ensemble du Net ?
Salut,
N'oublie pas de dire bonjour.
1) Il faudrait que tu donnes des exemples plus précis car là ça fait un peu appel à madame Irma
(et en particulier que signifie "l'ensemble du net", car crois moi, si tu lances un bot pour scanner toutes les ip, ça va te prendre des mois !!!! Même avec une connexion de la mort qui tue.... comme la mienne )
2) Pourquois poses-tu la question en physique alors que c'est clairement une question informatique (hardware, software, réseau, ça dépendra du (1)) ?
Dernière modification par Deedee81 ; 26/06/2020 à 10h36.
"Il ne suffit pas d'être persécuté pour être Galilée, encore faut-il avoir raison." (Gould)
"Il ne suffit pas d'être persécuté pour être Galilée, encore faut-il avoir raison." (Gould)
Je crois que j'ai compris. Tu compares une recherche dans google à une recherche par exemple de fichier avec l'explorateur de ton PC (ou une recherche de données dans des fichiers de ton disque dur). C'est ça ?
D'abord google :
1) Quand tu fais une recherche dans google, tu ne fais pas une recherche sur l'ensemble du net : tu fais une recherche.... dans google !!!! Ils ont des bases de données qui contiennent les données nécessaires à la recherche indexée et par page ranking. Leur centre de données contient plusieurs exaoctets !!!!
2) En plus d'avoir des bases de données, donc des index et autres mécanismes software performants, ils ont des machines de la mort qui tue et les connexions qui vont avec. C'est hyper rapide.
3) Pour peu que ta connexion ne soit pas trop pourrie, une recherche sera donc rapide
Mais la recherche de tes fichiers ou dans tes fichiers nécessite un scan de ton disque dur de plusieurs gigaoctets, sachant que ton système d'exploitation n'est pas du tout organisé comme une base de données relationnelles (ce serait trop "couteux"). Et donc ça prend du temps.
"Il ne suffit pas d'être persécuté pour être Galilée, encore faut-il avoir raison." (Gould)
Bonjour,
il reste la possibilité d'utiliser des moteurs de recherche sur les disques locaux. Il y avait Google Desktop,, mais il est discontinué. Il y en a encore une pléthore disponibles, même gratuits.
Perso, je n'ai jamais testé, donc je reste neutre sur leur utilité.
Dernière modification par jacknicklaus ; 26/06/2020 à 11h58.
There are more things in heaven and earth, Horatio, Than are dreamt of in your philosophy.
Bonjour, ça dépend si les fichiers sont indexés ou pas. Chez moi, un "locate" sous linux me donne le résultat en moins d'une seconde sur 4 disques (pleins) de 2 To...
\o\ \o\ Dunning-Kruger encore vainqueur ! /o/ /o/
Bonjour…
Pour répondre à DeeDee81
Je plaide coupable…
Visiblement dire bonjour ne suffit à rester correct.
Tu as compris, c’est ça ! bravo !!!!
Sinon, merci pour les réponses.
Windows est incroyablement mauvais pour cela
Sur Mac les résultats s’affichent à la volée, y compris pour la recherche de contenus de fichiers
La vie trouve toujours un chemin
Essentiellement parce que c'est mal indexé => il faut tout lire.
L'indexation correspond en gros à réaliser une base de donnée avec typiquement les mots d'un document. Quand tu recherches avec un mot, au lieu de parcourir tous les fichiers (ce qui implique de les ouvrir, de les mettre en mémoire, de les parcourir ligne à ligne, de les fermer) on va chercher dans l'index (la base de données) quel document contient ce mot et avec quelle fréquence.
Pour plus de détail tu peux aller lire par exemple le fonctionnement d’Elasticsearch basé sur le moteur de recherche Lucene.
Parcours Etranges
Bonjour,
Le lien que donne Gilamesh est parfait…
C’est donc un problème d’indexation. Ce qui explique les faits qui suivent.
______________________________ ___________________
Je tape entre guillemets le texte suivant dans google :
« En 1885 Fitzgerald réalisa un tel dispositif» que j’ai extrait au hasard d’un article de Bruno Jech dans le bulletin de l’union des physiciens. Chose incroyable je tombe sur l’article de cette revue et même sur ce forum!
Je tape la même chose sur mon ordi sachant que ce texte s’y trouve à plusieurs endroits en PDF :aucun résultat sous Windows 10! Sur Windows XP le texte est trouvé au bout de 7mn !
______________________________ ______________
Quel moteur de recherche me conseilleriez-vous pour que la recherche ci-dessus aboutisse?
Merci
bonjour,
n'est ce pas plus simple de faire des recherche sur des fichiers .htm que sur des fichiers .doc ou .pdf?
Il y avait aussi un moteur français, qui s'appelait Exalead si ma mémoire est bonne, qui pouvait être utilisé aussi bien en desktop qu'en moteur interne sur les applications intranet de l'entreprise et qui existait aussi en tant que moteur de recherche sur le net.
Dans le premier cas une recherche ASCII suffit (bref : pas besoin d'intermédiaire), dans les deux autres il faut au moins une interface permettant d'extraire le texte des pdf et/ou doc. Pour les doc, je n'ose imaginer le temps que ça prendra (office est d'une lenteur...).
S'ils sont indexés alors il ne faudra le faire qu'une fois (moindre mal), sinon, même pas la peine d'essayer, on en a jusqu'à l'année prochaine...
\o\ \o\ Dunning-Kruger encore vainqueur ! /o/ /o/
Bonjour
Envoyé par fustigator :
« Ça marche très bien sous Windows, il suffit de paramétrer proprement l'indexation. »
Pour vista, Windows 7 , OK…Mais comment paramétrer l’indexation sous Windows 10 ?
Aller, qui veut jouer ? je vous mets le lien du fichier pdf dont il est question.
http://materiel-physique.ens-lyon.fr...9/0815D163.PDF
Vous cachez ce pdf à un endroit improbable de votre ordi et vous feignez de ne vous rappeler que de la phrase « En 1885 Fitzgerald réalisa un tel dispositif» pour le retrouver.
Le premier qui poste a gagné…si en bon scientifique il détaille sa manip afin qu’elle puisse être reproduite.
Merci
Ton fichier ne contient pas du texte : c'est un scan donc une image. Retrouver une phrase dedans est tout de suite plus compliqué.http://materiel-physique.ens-lyon.fr...9/0815D163.PDF
Vous cachez ce pdf à un endroit improbable de votre ordi et vous feignez de ne vous rappeler que de la phrase « En 1885 Fitzgerald réalisa un tel dispositif» pour le retrouver.
oui, en fait plus les versions de win sont anciennes, plus les fonctionnalités sont récentes. Ils sont forts chez microsoft
pour la blague, win10 qui est quand même le "plus récent" n'arrivait même pas à utiliser des disques Nvme... un exploi ! Donc envisager qu'ils soient capable d'indexer des fichiers, c'est leur prêter une compétence qu'ils n'ont pas
\o\ \o\ Dunning-Kruger encore vainqueur ! /o/ /o/
Pour les .doc, je ne sais pas trop, mais pour les .docx, c'est juste des xml dans un zip (suffit juste de changer l'extension .docx en .zip pour voir comment c'est foutu, c'est assez marrant), donc facile à parcourir dans une recherche sans avoir à démarrer word. J'ai beaucoup de rapports en docx et ça m'arrive de les chercher avec la recherche windows avec l'option "un mot ou une phrase dans le fichier" et ça n'est pas trop lent (quelques minutes au pire).
m@ch3
Never feed the troll after midnight!
Oui c'est vrai que les docx sont faits différemment (et heureusement pour les linuxiens....). Par contre ça, ça marche si ça n'est pas compressé, et de mémoire il me semble que les docx le sont (au moins parfois).Pour les .doc, je ne sais pas trop, mais pour les .docx, c'est juste des xml dans un zip (suffit juste de changer l'extension .docx en .zip pour voir comment c'est foutu, c'est assez marrant), donc facile à parcourir dans une recherche sans avoir à démarrer word. J'ai beaucoup de rapports en docx et ça m'arrive de les chercher avec la recherche windows avec l'option "un mot ou une phrase dans le fichier" et ça n'est pas trop lent (quelques minutes au pire).
m@ch3
\o\ \o\ Dunning-Kruger encore vainqueur ! /o/ /o/