Satellogic Inc. a annoncé la publication d'un vaste ensemble de données ouvertes d'images à haute résolution, issues des archives de l'entreprise, afin de faciliter l'entraînement des modèles de base. L'ensemble de données contient environ 3 millions d'images Satellogic de lieux uniques - 6 millions d'images, y compris les revisites de lieux - provenant du monde entier. Chaque image a une taille de 384 par 384 pixels, soit un total de 900 gigapixels couvrant différents types d'utilisation des sols, d'objets, de géographies et de saisons.

L'ensemble des données est accessible sur Hugging Face. Les données de Satellogic sont publiées sous une licence Creative Commons CC-BY 4.0, permettant une utilisation commerciale des données avec mention de la source. Un article présentant l'ensemble de données sera publié en même temps qu'un modèle de base, un autoencodeur masqué (apprenants auto-supervisés évolutifs pour la vision par ordinateur), construit à partir de ce modèle.

L'article décrit la construction de l'ensemble de données, l'architecture du modèle et la configuration expérimentale. Ce travail est le résultat de la collaboration de Satellogic avec une équipe exceptionnelle de chercheurs dirigée par Alexandre Lacoste à ServiceNow sous la direction de Yoshua Bengio.