Antes de mais nada, um software concorrente do pacote ICATOOLS denominado cap3 está disponível para rodar online. Experimente

Um software popular para aglomerar seqüências é o ICAASS, do pacote de softwares ICATOOLS
Como o programa não roda em servidores WWW, é necessário algum conhecimento de UNIX
Acompanhe a demonstração e volte a consultar esse link no futuro
Desde que você tenha algum conhecimento de FTP e uma conta numa máquina UNIX para dar Telnet, os passos básicos são estes:
Primeiro usamos o módulo SSORT que pega as seqüências todas (o arquivo baixado com BatchEntrez serve, vamos chamá-lo de batch.seq) e as organiza por tamanho decrescente. A sintaxe é:
SSORT batch.seq >batch.sorted
Chamei o resultado de [batch.sorted] mas podia chamar de qualquer coisa. Vê o sinal [>] ? Em UNIX, estipula o nome do arquivo que terá os resultados. Sigamos!
Hora de aglomerar as seqüências com ICAASS. Sintaxe:
ICAASS -seq batch.sorted -index batch.index -threshold 25
Isso pega o arquivo de seqüências [batch.sorted], cria um resultado (index) [batch.index] e usa um valor de calibração de 25 (tudo que apresentar >25% de identidade vai aglomerar)
Não acabou, você precisa extrair o resultado usando ICAPRINT. Sintaxe:
ICAPRINT -index batch.index >batch.list
Agora o index [batch.index] teve seus dados extraídos e os resultados estão em [batch.list]
Superlegal olhar o [batch.list] porque as seqüências aparecem como um pai [P] e suas "children" [C] ou então seqüências únicas aparecem como órfãs [P sem C]
Mas se você gosta de estatísticas, rode o ICASTATS. Sintaxe:
ICASTATS batch.list >batch.stats
O arquivo [batch.stats] mostra quantos aglomerados com um dado número de seqüências foram gerados. Fim!

O link no programa leva a uma página onde os programas podem ser obtidos