A plataforma AGATHA tem a capacidade de analisar grandes quantidades de informação e extrair relações implícitas, padrões e participantes através de módulos dedicados à análise de vídeo e imagem, áudio e texto em várias línguas, composto por algoritmos de rastreamento e mineração de dados para recolha seletiva e direcionada de conteúdo.
Esta recolha de dados criará cópias do conteúdo para analisar e processar, indexando-as de acordo com o formato, origem ou endereço, etc., para otimização da pesquisa. Os dados obtidos através do rastreador serão armazenados na sua forma original (dados brutos) numa base de dados/repositório dedicado.
O sistema contém duas bases de dados adicionais, onde numa das quais seráão armazenadas as mesmas informações, no formulário padrão, e no outro os dados resultantes da análise de conteúdo das informações recolhidas.
Um dos desafios diz respeito às opções a serem tomadas para a definição dessas bases de dados, que terão que operar de forma interrelacional e homogeneizada para garantir a correspondência entre todas as informações armazenadas em relação aos conteúdos recolhidos, respetivas pesquisas e metadados associados ao conteúdo.