| SECÇÃO ANTERIOR |

Sistemas de Pesquisa e Indexação
Full Text Search (Pesquisa em Texto Integral)


Cuidados

Tipicamente, há dois tipos de pesquisa em texto integral para que qualquer site de média ou grande dimensão (para sites pequenos, com até 100 lexias, é normalmente rídiculo incluir esta característica) deve estar preparado. A primeira é a que resulta da pesquisa a partir do próprio site; a segunda, a que resulta da incontornável indexação por um "spider" (os programas que catalogam toda a Web, de que o AltaVista , o Excite ou o Infoseek são sempre bons exemplos).

resultado de pesquisa no motor Excite

Em qualquer dos casos, quando o utilizador introduz umas palavras e o servidor processa o resultado, o que se obtem é uma lista de lexias. Esta lista é normalmente caracterizada e condicionada pelos seguintes 5 elementos: título, descrição, URL, keywords e significância.

A descrição é um resumo do conteúdo do lexia, que o FrontPage permite introduzir com bastante elegância. Normalmente, não deve ser superior a uma ou duas linhas e deve incluir todas as ideias fortes veiculadas pelo lexia, utilizando os termos mais representativos para a descrição desses conceitos. Não é nada fácil conseguir boas descrições. Fazer resumos é uma coisa que todos deviamos aprender na escola, claro, mas a escola é o que é...
         Tipicamente, quando o autor não se dá ao trabalho de providenciar uma descrição, o próprio motor de pesquisa "fabrica" uma, mas os resultados não costumam ser brilhantes.

O URL está à vista dos utilizadores dos browsers, pelo que acaba estupidamente por ser um factor de identificação relevante... Alguns dos motores de pesquisa na Web usam as palavras do próprio URL como um dos factores de medida de significância do conteúdo, pelo que este aspecto não é de todo de desconsiderar.

A "significância" tem a ver com o peso atribuido pelos motores de pesquisas à importância relativa dos termos utilizados. Para começar, tem a ver com a frequência (e, cada vez mais, com o próprio enquadramento) com que o termo ocorre no conteúdo do lexia, no título, na descrição e nas keywords. Mas tem também a ver com o próprio padrão de utilização do motor de pesquisa. A ideia é que os utilizadores procuram por uma dada palavra, recebem uma série de resultados, analisam as descrições fornecidas e fazem uma selecção: ao fim de algum tempo, começam a desenhar-se padrões. Claro que se o trabalho a efectuar nos primeiros factores não conseguir colocar o lexia nos primeiros 20 ou 30 resultados fornecidos pelo motor de pesquisa, a possibilidade de alguma vez um dado lexia vir a ser assumido como relevante é escassa.

- - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -
| TOPO DA PÁGINA | SECÇÃO ANTERIOR |


Companhia Nacional de Serviços
© 1999, 1998 CNS - Companhia Nacional de Serviços SA. - Todos os direitos reservados.