|
| |
| |
 |
|
| |
|
Buscadores-abc.com
- ¿Qué es un buscador? - Información
general |
|
La existencia
de buscadores en Internet responde a una clara
necesidad: poder encontrar información,
de una manera más o menos cómoda,
dentro de un océano de datos como es esta
red.
Su mecánica es bien sencilla: basta con
escribir lo que se pretende buscar (un texto,
una frase, etc...) y el web (pues un buscador
es un web) nos indica la lista de webs (nos muestra
una relación de direcciones http) en donde
ha encontrado esa palabra.
La búsqueda no se realiza en tiempo real
por todos los servidores de webs, pues a la práctica
sería inoperante si tenemos en cuenta que
por el mero hecho físico de la velocidad
de transmisión de datos por la red, el
proceso sería eterno.
El sistema es más ingenioso: el servidor
del buscador se conecta periódicamente
a las páginas web y recoge toda la información
que hay allí alojada.
Una vez la información está en el
sistema local, la analiza y crea todo un sistema
de referencias para que cuando se produzca una
petición de búsqueda, ésta
sea lo más rápida posible (y realmente
es rapidísima).
Los servidores de webs de los cuales el buscador
analiza la información son aquellos que
están dados de alta expresamente.
Así, cuando un nuevo servidor modifica
su dirección o simplemente entra en funcionamiento
por primera vez, es necesario comunicarlo a los
buscadores para que en el próximo análisis
lo tengan en cuenta.
|
 |
| |
|
Buscadores-abc.com
- Definiciones de Robots de Búsqueda
|
|
¿Qué es un robot?
Un robot es un programa que atraviesa una estructura
de hipertexto recuperando ese enlace y todos los
enlaces que están referenciados allí.
De ello se alimentan los grandes motores de búsqueda
de la web.
La diferencia con los Directorios, es que éstos
no poseen robots, están operados por humanos
y no recuperan automáticamente los enlaces
incluídos en las páginas web, sino
que sólo se limitan a hallar lo que las personas
manualmente incluyen en ellos, pudiendo como ventaja
clasificar por secciones la temática de las
web al hacer el proceso manual.
Los robots son usualmente llamados "Web Wanderers",
"Web Crawlers", o "Spiders"
(arañas de búsqueda) y se suele imaginar
que se mueven entre los sitios como si fuesen virus,
este no es el caso, un robot simplemente visita
los sitios y extrae los enlaces que están
incluídos dentro de estos.
Arañas
(Spiders).
Es un robot, pero otorga resultados más fríos.
Gusanos (Worms).
Es lo mismo
que un robot, aunque técnicamente un gusano
es una réplica de un programa, a diferencia
de un robot que es un programa original.
Orugas (Web
crawlers).
Es lo mismo que un robot, pero hay que aclarar que
es un tipo específico de robot.
Hormigas (WebAnts) Cooperativa de robotsQué
es un Agente:
La palabra "Agente" tiene muchos significados
en el mundo de la computación de nuestros
días. Específicamente:
Agente autónomo:
Es un programa que "viaja" entre los sitios
web, decidiendo por ellos mismos cuando son movidos
a otros lugares y también deciden qué
hacer. Hay que tener en cuenta que sólo pueden
viajar entre sitios ubicados en servidores especiales
y no son muy difundidos en el área de internet.
Agente inteligente:
Son programas que ayudan al usuario por ejemplo:
a elegir productos, rellenar formularios o a encontrar
determinada cosa. Generalmente no tienen mucha tarea
en la red.
Agente de
usuario:
Es un nombre técnico para programas que ejecutan
tareas para un usuario en la red. Un ejemplo de
ellos son: Netscape Navigator, Microsoft Internet
Explorer, y Email User-agent como Qualcomm Eudora
etc. |
| |
 |
|
|
| |
 |
| |
|
Diferencias
entre Buscador con y sin robot |
 |
 |
 |
 |
| |
Buscador
sin robot:
Las direcciones añadidas, se ubican
en secciones dentro de una estructura de
árbol, debiéndose indicar
la/s categorías bajo las que se desea
queden ubicadas en el proceso de alta.
Los contenidos, en muchos casos, son analizados
y procesados por personas que visitarán
la dirección añadida, determinando
si éste cumple con los requisitos
necesarios para ser dado de alta y si los
datos introducidos son correctos.
Es imprescindible dar el alta manual de
su sitio Web para figurar dentro de la base
de datos de los directorios.
Para lograr una buena posición normalmente
no es necesario el uso de palabras clave.
Usualmente es suficiente con que el título
del sitio comience con la letra más
cercana a la A en el alfabeto o por alguno
de los primeros caracteres de la codificación
ASCII.
Hay menos resultados totales debido al menor
contenido de sus bases de datos. Estos son
mejores, más fiables y presentan
menos enlaces erróneos o poco efectivos.
Los resultados aparecen por orden alfabético
en la mayoría de los casos y ordenados
por categorías temáticas.
Las altas demoran entre 2 a 4 días.
Salvo excepciones en que por las características
del directorio, llegan a las 2 a 8 semanas
en producirse.
Son ideales para hallar páginas sencillas
con temas comunes, pues las búsquedas
se facilitan.
Buscador
con robot:
Los contenidos son indexados por medio de
un robot, araña o gusano.
No es imprescindible dar el alta a un sitio
web para figurar en él. Es aconsejable
pero no imprescindible, pues la mayoría
de los robots buscan por la web por ellos
mismos, indexando todo lo que hallan a su
paso. Aun así, el contenido de sus
bases de datos no suele superar el 5% del
total de la red.
Para lograr una buena posición es
necesario el correcto uso de palabras clave
y etiquetas dentro del código HTML.
Hay más resultados totales, estos
son menos fiables y presentan más
enlaces erróneos o poco efectivos.
Los resultados aparecen por orden de popularidad,
dependiendo de las características
del robot. Puede tomar las palabras clave
del título, descripción o
contenido.
Las altas pueden llegar a demorar varios
meses en algunos casos.
|
|
 |
 |
 |
|
|
|
|