Démarrage

Pour démarrer :

Etudes de cas

Ces liens conduisent à nos travaux pratiques, ils ne sont ni achevés ( en terme de rédaction), ni optimisés (on est preneur de code plus simple et plus fluide), mais parfaitement fonctionnels (reproductibles) ils servent de support de cours, et fournissent si on les lit dans le détail, de nombreuses astuces.

On espère que nos étudiants vont y contribuer largement, c’est aussi la matière de leurs exercices pratiques, on leur demande d’améliorer et de commenter les solutions “brutales”" qui y sont proposés.

ressources pratiques

Dataviz

*ggplot2 est devenu la norme donnant naissance à une multitude de packages dérivés : gridextra pour assembler les graphiques en une image, ggreppel, pour affiner le labelling, geom_sp pour la cartographie, ggworcloud pour le texte. Il s’appuit sur une grammaire des graphiques. On jetera un coup d’oeil à la rgallery et des ressources qui s’accroissent chaque jour : ie [ggforce] (https://cran.r-project.org/web/packages/ggforce/vignettes/Visual_Guide.html)

Textmining

  • l’ancêtre c’est tm et r.temis en est un des enfants qui exploitent le vieil héritage de l’AFC. Mais désormais il y a plus moderne
  • r for Textmining introduit aux méthodes de Tidytext
  • quanteda a de bonne chance de venir un standard
  • cleanNLP propose des fonctions " part of speech" (POS) particulierement utiles
  • keras pour se mettre au “word embeddings” et se mettre au deep learning avec l’interface r pour keras

Machine learning

Analyse spatiale

Analyse de réseaux

Psychométrie

  • psych est un monument pour l’analyse factorielle et la psychométrie.
  • lavaan est indispensable pour les amateurs de CFA et autres SEM.

Econométrie

  • ts
  • var
  • panelvar

Blogs

Les belles ressources sont de plusieurs espèces. Il y a d’abord des génies laborieux qui depuis des années partagent leurs cours, leurs recherches, et documentent précisément les codes. Ils sont des grands frères c’est sur leurs épaules qu’on a appris. On les mettra au premier rang. Il y en a de nouveaux qui viennent les épauler.

  • r-blogger : il fédère près de 750 blogs, et délivre chaque jour un ou deux posts, une source de trouvailles qui coule comme la source au pied de la montagne.
  • A Charpentier le blog d’un actuaire curieux et généreux. Des cours, du code, des textes plus théoriques une mine d’or.
  • BCoulmont offre regulièrement des ressources précieuse souvent cartographiques.

Si on ne sait pas et qu’on veut trouver une solution en quelque mots clés, il y a …. Google qui reste le meilleur point d’entrée en ajoutant systématiquement la lettre r aux requêtes. github, stalkoverflow, rpub,. twitter est une source utile où quelques comptes à suivre : datacentral,

Data Sets :

Les data sets sont desormais nombreux, il y a ceux proposés par les plateformes de concours telles que Kaggle, mais l’open source encourage à publier. En voici de manière non ehaustive et très personnelle, quelques sources que nous avons exploitées ou que nous avons très envie d’explorer ;)