Anterior

 

ARQUIVO. PT

"ARQUIVO.PT" tem como missão registar endereços de sites portugueses, arquivar e disponibilizar a informação para consulta ou investigação. Começou a funcionar em Janeiro de 2008 e desde então têm vindo a recolher e arquivar todos os websites que desde 1996, uma recolha na qual tem colaborado muitas entidades. Está instalado no "Campus do LNEC" em Alvalade. Em 2022 tinha arquivado 27 milhões de sites portugueses, registando mais de 140 mil utilizadores.

É dificil imaginarmos o funcionamento das nossas sociedades sem a Internet, o mesmo é dizer sem a informação que nela existe. A sua perda total, o "apagão", implicaria enormes consequências em multiplos sectores da nossa vida, não apenas cientificos, económicos ou organizacionais. A nossa vida quotidiana tem sido moldada em função da informação existente na Internet. Embora tudo isto seja verdade, também não deixa de o ser preocupante pensarmos o carácter volátil desta informação.

Em Portugal, um estudo datado de 2006, revelou que 50% das páginas web portuguesas são alteradas ou desapareciam após cerca de ano e meio (Gomes..., 2006). Desde então o ritmo da mudança foi acelerado, embora de forma muito desigual em função da natureza e objectivos dos sites. A colocação e eliminação dos "post" no "twitter" ou o "Facebook" é incomparavelmente mais curta do que a informação que é colocada no site de uma instituição pública. A primeira página de um jornal "em-linha", por exemplo, pode mudar várias vezes ao dia, mas o seu "interior" manter-se praticamente idêntico no mesmo período.

A verdade é que grande parte desta informação acaba "irremediavelmente" perdida, reciclicada ou apropriada para dar origem a "novos" conteúdos em outros sites. Um processo foi acelerado quando muitas publicações abandonaram a versão em papel e passaram a ser digitais, e com o aumento exponêncial de edições pensadas exclusivamente para a web. Ao contrário dos livros e jornais, não existe qualquer sistema que permitam garantir o registo e persistência desta informação, como refere Daniel Gomes. Uma infinidade de problemas tem sido colocados por a emergência deste novo meio de produção e difusão de informação, nomeadamente no campo dos direitos de autor.

É nesta complexa dinâmica de produção, comunicação e conhecimento que se insere ARQUIVO.PT . Estamos longe de uma instituição que se reduza a arquivar websites. Para saberemos como tudo começou e compreendermos o seu alcance, fomos falar com Daniel Gomes, gestor deste serviço público.

TUMBA !

A história de ARQUIVO.PT remonta a 2001, o ano em que surgiu o Jornal da Praceta. Um grupo de investigadores do Departamento de Informática da Faculdade de Ciências da Universidade de Lisboa, desenvolveu um novo "apontador" (motor de busca) de sites: "Tumba!". O grupo liderado pelo prof. Mário Gaspar Silva (chefe da equipa) era formado por Daniel Gomes, Miguel Costa, Bruno Martins e Norma Noronha. Este apontador manteve-se operativo até 2009. O grupo rapidamente se deu conta que havia uma enorme falha no sistema. Um motor de busca tinha e tem por objectivo disponibilizar a informação mais actualizada possivel, no entanto ao fazê-lo vai "eliminando" as referências anteriores, mesmo que sejam extremamente relevantes. O que é mais recente tem a prioridade. Era pois fundamental preservar a informação em sites que haviam saído dos radares dos motores de busca. Neste sentido, a ideia da constituição de um arquivo de sites acabou por impôr-se. Dentro dos recursos limitados que dispunham, iniciaram o arquivamento de sites potrugueses.

A função do Arquivo era no fundo, garantir que nunca ocorreria o "apagão" dos sites na Internet. Hoje é fácil imaginar a perda que significaria para o nosso conhecimento, a destruição da informação contida em milhões de sites. A consciencialização desta possibilidade foi mais lento do que parece.

No princípio do século XXI, a Internet em Portugal já tinha registado enormes avanços, de que é justo recordar a criação do "apontador" Sapo (1995), a criação do "Terràvista (23/03/1997), que disponibilizou alojamentos gratuitos de sites (5 Mb) até 2001, uma função que foi assumida pelas "Homepeges do Sapo" (2001-2016). Em termos internacionais, para além dos muitos servidores de alojamento gratuitos, surgiram dois poderosos motores de busca: a Yahoo (1994) e Google (1998).

AWP

A partir de 2002, devido à utilização da tecnologia ADSL, aumentou a popularidade da internet em Portugal. Aumentou também a consciência que a perda desta informação disponibilizada na Internet podia tornar-se num sério problema para o conhecimento.

Aresposta ao "apagão" surgiu naturalmente nos EUA, onde a internet estava mais difundida. Em 1996, na Califórnia, foi criado o "Internet Archive", a primeira instituição a abraçar em termos internacionais a constituição de um arquivo de sites. Embora preservasse milhares de sites em português, o seu número era muito limitado e não sistemático. A experiência adquirida pelo grupo do projecto "Tumba !", revelou-se uma importante para a criação em Portugal de um arquivo destinado à preservação de sites na web em português.

Em 2006, um pequeno grupo de investigadores, sob a liderança de Daniel Gomes, desenvolveu um protótipo para a criação do almejado arquivo. Um ano depois, a Fundação para a Computação Científica Nacional (FCCN) assumiu este projecto estratégico nacional. Em Janeiro de 2008, sob a designação de "Arquivo da Web Portuguesa" (AWP) começou a fase de concepção de códigos, experiências, testes e divulgação da informação que era recolhida. A questão do "apagão" foi desde logo considerada. Não bastava salvar os sites, havia que considerar a eventualidade de um acidente, um desastre que destruisse o arquivo físico onde os mesmos estavam gravados. O processo encontrado foi uma combinação entre redundância (duplicação) e criação de níveis de informação. Toda a informação está duplicada em suportes físicos distintos em Lisboa, um cópia está no Porto e uma outra no Internet Archivo na Califórnia.

Em 2012, com outra maturidade, passou a ARQUIVO.PT. A divulgação tem sido gradual acompanhando o crescimento da informação que vai disponibilizando.

Projectos

O principal objectivo do ARQUIVO.PT, nas palavras de Daniel Gomes é manter a qualidade que é lhe reconhecida mundialmente. Entre os vários projectos que tem em curso, e que nos foram referidos, destacamos três que nos parecem de grande relevância para a nossa freguesia.

- Protocolos com as instituições públicas. É prática corrente em Portugal, por exemplo, quando muda um executivo nas câmaras ou nas juntas de freguesia, o site é renovado e a informação que era disponibilizada apagada. Para evitar esta situação ARQUIVO.TP pretende estabelecer protocolos com todas as instituições públicas para guardar a informação na web que for descontinuada.

- Prémios. Desde 2018 que todos os anos são abertos concursos para atribuição de prémios a trabalhos de investigação com base na informação arquivada.

 

- Visitas Guidas. Estas "bases de dados" a alimentam a imaginação das novas gerações, e muitos são os que pretendem seguir àreas relacionadas com a informática. ARQUIVO. PT todos os anos organizam visitas guiadas às suas instalações, precedidas de uma sessão onde são abordados estas temáticas.

Quantos elementos constituem a equipa fixa do ARQUIVO. PT ? A resposta não deixa de ser surpreendente, se tivermos em conta a complexidade e sofisticação tecnológica deste arquivo. Pois bem, a equipa fixa é constituida por apenas quatro elementos (Daniel Gomes, Vitor Gouveia, Vasco Rato, Pedro Gomes) a que acresce o curador Ricardo Basilio. É sobre eles que repousa a garantia que não haverá um "pagão" da informação dos sites portugueses, mesmo que os mesmos tenham sido descontinuados.