Commencer avec R | part 1

Lorsque j'ai commencé à toucher un peu à R, je me suis intéressé à plein de docs différents dont des articles de blog. Et étant un ancien consultant SEO, j'ai bien sûr cherché des applications pour le SEO ... ou sur le blog de certains SEO.

Pour les curieux, l'article complet est ici : http://gameofseo.fr/2017/10/apprendre-r-commandes-a-connaitre/ ; ce que je retiens dans cet article est ce dont je me sers ou me suis servi ;-)

Lire un fichier read.csv

df=read.csv(file = "monfichier.csv",header=T, sep=";",encoding = "UTF-8")

Personnellement je préfère toujours <- à = ; mais ça revient - presque - au même. Ca donne donc :

df <- read.csv(file = "monfichier.csv",header=T, sep=";",encoding = "UTF-8")

Avec read.csv la fonction, sep pour le séparateur du csv et encoding pour l'encodage à utiliser. De base je pense que vous utiliserez plus sep selon votre csv et un skip si votre fichier possède des lignes que vous ne souhaitez pas importer (je pense par exemple aux fichiers exportés de Screaming Frog).

Quant à la gestion des espaces, vous faites ce que vous voulez, j'ai tendance à laisser des espaces entre df, <- et la formule.

Pour toutes les infos sur le package read.csv : https://stat.ethz.ch/R-manual/R-devel/library/utils/html/read.table.html

Enregistrer/sauvegarder un fichier/votre datafram

write.table(df, file = "/fichier.csv", sep = ";", quote = FALSE)

Avec toujours sep pour indique le séparateur, ici un ; et quote pour spécifier si le texte doit être mis entre guillements.

Renommer les colonnes d'un dataframe (df)

colnames(df) <- c("colonne 1","colonne 2","colonne 3")

Joindre deux dataframe ensemble

Ici cela nécessite d'avoir préalablement chargé deux fichiers en deux dataframe. Et d'avoir installé le package dplyr

df_final <- inner_join(x=df1=df2, by = c("colonne commune 1" = "colonne commune 2"))

L'utilisation est faite ici de inner_join, mais vous trouverez aussi du left_join ; sans oublier qu'il y a la fonction merge qui permet par exemple de faire merge(df1, df2, by=”colonne commune”) qui revient à la même chose que inner_join(x=df1=df2, by = c("colonne commune 1" = "colonne commune 2"))

Toutes les informations complètes se retrouvent sur https://www.rdocumentation.org/packages/plyr/versions/1.8.4/topics/join et https://stat545.com/bit001_dplyr-cheatsheet.html

THEME_QUARK.BLOG.ITEM.PREV_POST THEME_QUARK.BLOG.ITEM.NEXT_POST