La recherche sur le web - L©S ßlog - CyberSDF

L©S ßlog - CyberSDF



La recherche sur le web

Le mercredi 27 juillet 2005 à 16:07:: Laurent - CyberSDF:: Monde de geek

Mitternacht, viens de se rendre compte que les moteurs de recherche n'étaient plus adaptés au contenu du web.

En effet il n'y à qu'a faire un tour des blogs et leur demander les mots clés utilisés pour arriver chez eux (chez moi c'est gratiné), d'ailleurs Niko le fait de temps en temps (il faut vraiment que j'arrête de citer Niko à presque tous mes billets) et on se rend compte que le moindre mot, même si il est sans importance dans le contexte du contenu, renvoie dans les premières pages.

Mais rassurez vous, ils sont au courant et cherchent une nouvelle méthode de recherche (ou plutôt de trouvage) heuristique.

Seulement c'est pas si facile que ça. On sait faire de L'IA basique (je vous en ai déjà parlé) mais ça se complique quand on a des millions de contenus et des milliers d'utilisateurs à qui il faut répondre le plus correctement possible à des demandes parfois étranges et farfelues. Et ça, c'est sans compter sur les soit disant boites de référencement qui ont tout fait pour plomber le web avec des méthodes exécrables pour faire gagner de la hauteur à leurs clients (techniques de masquage, pages satellites, fermes de liens, etc.) dans les résultats des moteurs de recherche (d'ailleurs google à déjà réagit depuis longtemps à ce genre de pratique).

De plus il y a un autre facteur qui entre en jeu : la construction des pages web elles mêmes.
En effet une page qui respecte à minima les règles de la sémantique et a une architecture cohérente sera beaucoup plus facilement indexable qu'une autre qui sert aux robots une soupe de balises.
D'ailleurs certains outils de blogs, tel que Dotclear, et les blogs en général ont tout pour gagner des bons points auprès des moteurs ; Des pages propres, du contenu qui évolue régulièrement (c'est également le cas des web-forum), des vrais en-tête de pages, des fils RSS et/ou Atom, des URI correctes, etc.

Bref, c'est un sujet extrèmement complexe qui fait plancher pas mal d'ingénieurs et de chercheurs (dont ceux de Google).

Blogmark it ! :: trackback fermés :: fil rss des commentaires

Aucun trackback.

Commentaire(s)

1. Le mercredi 27 juillet 2005 à 18:29 :: NiKo

Je te rappelle que ton hébergement t'es *offert*, tu n'es donc pas obligé de me citer à chaque billet LOL ;)

Les commentaires sont fermés.

Toutes les fautes d'orthographes présentes sur ce site sont protégées par la licence Logo Creative common Creative common

 |  Valid XHTML  |  Valid CSS  |  Dotclear  |  Design décliné de [ON]Simple par [ NikO ]
Hébergé par Typhon.Network