Site Overlay

Comment fonctionne un moteur de recherche

Moteur de recherche, programme pc pour découvrir les réponses aux préoccupations dans une sélection d’informations, qui peut être un catalogue de collection ou même une source de données mais qui est le plus souvent le World Wide Web. Un moteur de recherche en ligne sur Internet produit une liste de «pages» – fichiers de données informatiques personnelles sur Internet – qui contiennent la terminologie d’un problème. La plupart des moteurs de recherche comme Google permettent à l’utilisateur final de s’inscrire pour les termes avec et, ou, et de ne jamais affiner les questions. Ils peuvent également rechercher notamment des images, des clips vidéo ou des rapports de publications ou de titres de sites Internet. Le Net est essentiellement non organisé, et les informations sur ses pages Web sont de qualité extrêmement variable, y compris les informations commerciales, les bases de données nationales, les collections de guides d’enquête et les collections de documents personnels. Les listes des moteurs de recherche tentent de déterminer les pages fiables en les pondérant ou en les classant en fonction du nombre d’autres pages Web qui s’y réfèrent, en identifiant les «autorités» que de nombreuses pages Web envoient, et également en déterminant des «hubs» qui font référence à plusieurs pages. Ces techniques peuvent également bien fonctionner, mais l’utilisateur doit continuer à exercer ses capacités lors du choix des mélanges appropriés de termes de recherche. La recherche d’une banque peut renvoyer plusieurs millions de pages Web («hits»), la plupart provenant d’institutions bancaires commerciales. La recherche d’une institution bancaire fluviale peut néanmoins revenir au-dessus de dix millions de pages, dont beaucoup proviennent d’institutions bancaires avec stream dans le nom. Seuls plus de raffinements, y compris les berges des rivières et les zones riveraines, réduisent le nombre de portées à des dizaines de milliers de pages Web, de loin les plus connues dans lesquelles les fleuves et leurs institutions bancaires sont inquiets. Les listes de moteurs de recherche utilisent des robots d’exploration, des plans qui explorent le Web en suivant simplement des liens hypertexte de page Web en page, en documentant tout sur une page Web (appelée mise en cache) ou des éléments d’une page Web, ainsi qu’une méthode exclusive de marquage du contenu. afin de développer des indices pondérés. Les sites Web se composent souvent de leurs balises particulières sur les pages Web, qui ne sont généralement vues que par les robots d’exploration, de sorte que vous pouvez augmenter la correspondance entre les recherches et leurs sites. Les abus avec ce marquage volontaire peuvent fausser les résultats de recherche autrement pris en compte lors de la création d’un moteur de recherche. De même, un utilisateur doit savoir si certains mots clés de vente de moteurs de recherche en ligne ou non, en particulier si les sites qui ont acheté un emplacement préférentiel ne sont certainement pas indiqués séparément. Même les moteurs de recherche généraux les plus importants, tels que les moteurs de recherche, Yahoo !, Baidu et Bing, ne peuvent pas suivre la prolifération des pages Web, et chacun laisse simplement d’énormes parties découvertes.