Classificações na Web

O homem não tem condição de lidar com cada entidade que existe no mundo de forma separada, por isso ele agrupa as entidades de acordo com características em comum. Quanto mais grupos ele cria, mais entidades consegue lidar.

Para ter um website com grande quantidade de conteúdo na Web, é preciso ter muitos agrupamentos. A Ciência da Informação desenvolveu ao longo de décadas, diversas formas de classificar entidades.

Estudiosos dessa área trouxeram esse conhecimento para a Web e surgiu a profissão do Arquiteto da Informação. Para descrever suas ferramentas, emprestaram termos que já existiam, mas às vezes aplicaram de forma ligeiramente diferente do sentido original. Explicarei alguns desses termos, como são usados hoje pelos profissionais que escrevem livros e artigos sobre o assunto.

Taxonomia é uma forma de classificação caracterizada por relações hierárquicas. Ela serve como base para formar menus de navegação em websites com várias páginas hierarquizadas, mas não é necessariamente igual a ele.

Um taxonomia pode estar contida dentro de um vocabulário controlado, que é um banco de dados que define os termos mais utilizados num determinado assunto ou porção de conteúdo e suas relações. Sua função é manter a consistência entre o conteúdo e servir como referência para as diferentes entidades que alimentam o banco de dados.

Imagine que num artigo eu escreva Interação Humano-Computador; num outro, Interação Homem-Máquina e no outro Interação Tecnologia-Ser Humano. Qual dos termos é o certo? Todos, mas existe um preferido. Se meu termo preferido fosse Interação Humano-Computador e eu tivesse um vocabulário controlado no meu Gerenciador de Conteúdo, toda vez que escrevesse os outros termos, o sistema me avisaria disso e sugeriria a mudança.

Essa mesma entrada no vocabulário poderia conter versões do termo preferido escritas com erros de ortografia, para que ao digitar errado na busca, você ainda assim chegasse ao destino. O Google faz isso de forma maravilhosa, através de algoritmos automáticos.

Um vocabulário controlado também pode conter um tesauro, ou seja, um dicionário de sinônimos. Quando você digitasse Interação Homem-Computador na busca, isso iria retornar o sinônimo Interação Humano-Computador.

Se cada termo tiver uma descrição do que significa o termo, então o vocabulário estará contendo um glossário. A utilidade maior é em ferramentas de ajuda e ensino. Pense numa tooltip que explica o que significa uma palavra que você não entendeu na página.

Se um mesmo vocabulário cuida de várias aplicações como essas, é abrangente o suficiente para abarcar qualquer novo termo, possui regras rígidas para a inclusão e gerência dos termos, então ele pode ser chamado de uma ontologia. Um exemplo é o diretório do Cadê (*nostalgia*).

Diretório do Cadê contém tudo

Caso não haja absolutamente regra alguma para a inclusão de novos termos e existam diversas pessoas incluindo termos ao mesmo tempo, então você tem uma folcsonomia. Segundo o brilhante artigo de Clay Shirky, as ontologias estão com os dias contados na Web, enquanto que as folcsonomias estão crescendo.

Provavelmente, surgirão outras ferramentas de classificação populares, diferentes da folcsonomia, que é extremamente caótica. O próprio delicious agora faz sugestão de tags, mas ainda não pode ser considerada uma classificação realmente colaborativa.

Já existem softwares de análise de conteúdo que geram classificações automaticamente. O Weka é um exemplo, mas seu principal uso é na Mineração de Dados e não na Arquitetura da Informação. Certamente no futuro, teremos softwares que farão parte do trabalho do arquiteto da informação. É essencial que surjam tais ferramentas, pois a quantidade de informação que lidamos aumenta cada vez mais.

Penso que cada usuário terá um desses ao seu lado, como se fosse um cãozinho esperto que busca o jornal e não um osso. Sim, um agente inteligente que encontraria e classificaria conteúdo na Web relevante para esse usuário, de acordo com suas preferências e, principalmente, comportamento. Se ele passa mais tempo lendo um determinado artigo, então deve gostar do assunto. A tecnologia pra isso já existe: perfil do orkut, agregador do Bloglines, personalizaçao da Amazon e etc. Já ouviu falar da Googlezon?

Fred van Amstel (fred@usabilidoido.com.br), 23.06.2005

Veja os coment?rios neste endere?o:
http://www.usabilidoido.com.br/classificacoes_na_web.html