GitHub Arctic Code Vault

O “cofre de códigos no Ártico” do GitHub pode ter aparecido como uma conquista (Achievements) em sua página de perfil nessa plataforma de hospedagem de códigos-fonte – aparece uma janela com “contributed code to x repository(ies) in the 2020 GitHub Archive Program” passando o mouse em cima do selo. Anunciado pela primeira vez em novembro de 2019, o GitHub Arctic Code Vault é um repositório de dados preservado no Arctic World Archive (AWA), uma instalação de arquivamento de muito longo prazo a 250 metros de profundidade no permafrost de uma montanha ártica – bem próximo ao Silo Global de Sementes.

O arquivo está localizado em uma mina de carvão desativada no arquipélago de Svalbard, Noruega – mais próximo do Pólo Norte do que do Círculo Polar Ártico. Como o armazenamento refrigerado vai durar 1.000 anos, Svalbard foi regulamentada pelo Tratado internacional de Svalbard como uma zona desmilitarizada. Lar da cidade mais ao norte do mundo, é uma das habitações humanas mais remotas e geopoliticamente estáveis ​​da Terra.

O gitHub fez um snapshot incluindo todos os repositórios com quaisquer commits entre o anúncio no GitHub Universe em 13 de novembro e 2 de fevereiro de 2020, todo repo com pelo menos 1 estrela e quaisquer commits do ano anterior ao snapshot (02/03/2019 a 02/02/2020), e cada repo com pelo menos 250 estrelas. O instantâneo consiste no HEAD do branch padrão de cada repositório, menos quaisquer binários maiores que 100 KB de tamanho – dependendo do espaço disponível, repositórios com mais estrelas podem reter binários maiores. Cada repositório foi empacotado como um único arquivo TAR. Para maior densidade e integridade de dados, a maioria dos dados foi armazenada com codificação QR e compactada. Um índice legível e um guia irão relacionar a localização de cada repositório e explicação de como recuperar os dados.

Exemplo de rolo de piqlFilm. Fonte: GitHub
Exemplo de rolo de piqlFilm. Fonte: GitHub

A empresa trabalhou com seus parceiros de arquivo Piql para gravar os dados do repositório GitHub de 21 TB em 186 rolos de piqlFilm (filme de arquivo fotossensível digital). É imune a campos eletromagnéticos gerados naturalmente ou artificialmente, com durabilidade estimada em 500 a 1000 anos. As bobinas de filme serão armazenadas em um contêiner com parede de aço dentro de uma câmara selada dentro de uma mina de carvão desativada. Os códigos foram depositados no local definitivo em 8 de julho de 2020, em parceria com a mineradora estatal norueguesa Store Norske Spitsbergen Kulkompani (SNSK).

Cada rolo do arquivo inclui uma cópia do “Guia para o Cofre do Código GitHub” em cinco idiomas, escrito com a entrada da comunidade do GitHub e disponível no repositório GitHub do próprio Programa de Arquivo. O arquivo também inclui uma bobina legível que documenta a história técnica e o contexto cultural do conteúdo do arquivo, que a empresa chama de Árvore Tecnológica. Consiste principalmente nos trabalhos existentes, selecionados para fornecer uma compreensão detalhada da computação moderna, código-fonte aberto e seus aplicativos, desenvolvimento de software moderno, linguagens de programação populares, etc.

Container com códigos do GitHub e de outras instituições. Fonte: GitHub
Container com códigos do GitHub e de outras instituições. Fonte: GitHub

A diretora de software estratégico do GitHub, Julia Metcalf, afirmou que “nossa missão é preservar o software de código aberto para as gerações futuras, armazenando seu código em um arquivo construído para durar mil anos”. O Arctic Code Vault é apenas uma pequena parte do GitHub Archive Program, que vê a empresa como parceira da Long Now Foundation, Internet Archive, Software Heritage Foundation, Microsoft Research e outros. A mesma estrutura também hospeda dados do Unicef, Arquivo Nacional, Archivo General de la Nación (México), da emissora norueguesa KDRS e da Biblioteca Apostólica do Vaticano.

Atualização: em 20/09/2022, o GitHub anunciou que fez a última adição ao Arctic Code Vault com um compilado “Tech Tree” finalizado – essencialmente um manual de início rápido sobre desenvolvimento de software e computação, incluindo 140 trabalhos descrevendo softwares modernos e tecnologias de computação, bem como capturas de tela completas da Wikipedia e Stack Overflow. Essas obras recém-adicionadas preservarão um registro de tudo o que aconteceu desde a adição feita no início de 2020 (pandemia global, efeitos crescentes das mudanças climáticas, etc.).

Caixa de Arquivos Open Source do GitHub, criada pelo artista Alex Maki-Jokela. Créditos: Divulgação
Caixa de Arquivos Open Source do GitHub, criada pelo artista Alex Maki-Jokela. Créditos: Divulgação

Fontes

Leave a Reply

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Esse site utiliza o Akismet para reduzir spam. Aprenda como seus dados de comentários são processados.