arkhe
Manipulation et nettoyage de données
arkhe est un package R offrant une collection de fonctions simples permettant de nettoyer des données rectangulaires. Elle permet de détecter, compter et remplacer des valeurs ou supprimer des lignes/colonnes. Elle fournit également des outils permettant de vérifier des conditions et de renvoyer des messages d’erreur informatifs.
Ce package fait partie du projet tesselle.
Installation
Vous pouvez installer la dernière version depuis le CRAN avec :
install.packages("arkhe")
Et la version de développement depuis Codeberg avec :
# install.packages("remotes")
remotes::install_git("https://codeberg.org/tesselle/arkhe")
Utilisation
## Charger le package
library(arkhe)
## Reproductibilité
set.seed(12345)
## Créer une matrice
X <- matrix(sample(1:10, 25, TRUE), nrow = 5, ncol = 5)
## Ajouter des valeurs manquantes
k <- sample(1:25, 3, FALSE)
X[k] <- NA
X
## Compter les NA par lignes
count(X, f = is.na, margin = 1)
## Compter les non-NA par colonnes
count(X, f = is.na, margin = 2, negate = TRUE)
## Trouver les lignes avec des NA
detect(X, f = is.na, margin = 1)
## Trouver les colonnes sans NA
detect(X, f = is.na, margin = 2, negate = TRUE, all = TRUE)
## Supprimer les lignes avec des NA
discard(X, f = is.na, margin = 1, all = FALSE)
## Supprimer les colonnes avec des NA
discard(X, f = is.na, margin = 2, all = FALSE)
## Remplacer les NA par des zéros
replace_NA(X, value = 0)
Voir en ligne :
Documentation.
Publié le 18 décembre 2019 , mis à jour le 12 janvier 2026.