Mises à jour en 2021, les Recommandation du Conseil concernant l'accès aux données de recherche provenant de financements publics de l'OCDE définissent les données de recherche provenant de fonds publics [comme des] :
"documents factuels (tels que des notes numériques, des documents textuels, des images et des sons) résultant d'une recherche partiellement ou totalement financée par des fonds publics, utilisés comme sources primaires pour la recherche scientifique et communément acceptés dans la communauté scientifique comme nécessaires pour valider les résultats de la recherche. Ce terme ne couvre pas les carnets de laboratoire, les analyses préliminaires ou les ébauches d'articles scientifiques, les plans de recherches futures, les examens par les pairs, les communications personnelles avec des collègues ou les objets physiques, (par exemple, les échantillons de laboratoire, les souches de bactéries ou les animaux de laboratoire)."
Par extension, cette définition peut inclure "d'autres objets numériques pertinents pour la recherche provenant de fonds publics : métadonnées, algorithmes, flux de travail, modèles et logiciels (y compris le code) résultant d'une recherche financée partiellement ou entièrement par des fonds publics, qui sont utilisés dans un contexte de recherche et de développement.
À l'UNIL, selon la directive 4.5 de la Direction, les données de recherche sont des enregistrements utilisés comme sources principales pour la recherche scientifique.
Elles comprennent en particulier, mais pas exclusivement :
Ne sont pas considérés comme données de recherche :
Afin de favoriser leur publication et/ou leur partage en accès ouvert éventuel, les données de recherche sont organisées et gérées selon les standards internationaux spécifiques à chaque domaine en vue du respect des principes FAIR (Findable, Accessible, Interoperable, Re-usable) soutenus notamment par le Fonds National Suisse.
Les données de recherche ont une longue durée de vie, souvent plus longue que la période comprise entre leur création et la rédaction de la publication scientifique pour laquelle elles ont été créées. La fonction et la valeur des données changent d'une phase à l'autre du cycle. La notion de cycle de vie des données de recherche est un outil qui peut être utilisé pour cartographier différentes phases et voir comment elles se connectent l'une à l'autre. L'utilisation d'un cycle de vie permet de passer d'une perspective à court terme à une perspective à long terme dans la gestion des données.
Élaboré par UK Data Archive, le modèle de référence du cycle de vie des données de recherche "Research Data Lifecycle" définit 6 principales étapes : Création des données ; Traitement des données ; Analyse des données ; Préparer les données pour la préservation ; Accès aux données ; Réutilisation des données.
Chacune de ces étapes est composée de plusieurs actions à réaliser pour assurer une gestion adéquate des données de recherche.
Uniris a développé une vision similaire basée également sur 6 phases :
La prise en compte de ces 6 phases permet la réalisation des aspects suivants :
Un distinction s'opère entre les données actives de recherche, la préservation d’une partie de ces données (conservation à long terme) et l'archivage/partage pérenne des données.
Les données de recherche sont nombreuses, variées et très hétérogènes. Elles peuvent être distinguées en cinq catégories (André, 2014) :
Selon leur contexte de création (capture ou production), leur exploitation, leur analyse et les traitements qu’elles subissent, les données de recherche peuvent être de différente nature :
Contenues dans divers supports :
De tous types :