Formation à destination des doctorants du site d’Aix-Marseille
Le CEDRE propose une offre de formation dédiée à l’ensemble des doctorants du site d’Aix-Marseille, en lien avec les Écoles doctorales d’Aix-Marseille Université. Ces formations ont pour objectif de leur permettre de développer leurs compétences et d’acquérir les outils ainsi que le niveau d’experti
...Le CEDRE propose une offre de formation dédiée à l’ensemble des doctorants du site d’Aix-Marseille, en lien avec les Écoles doctorales d’Aix-Marseille Université. Ces formations ont pour objectif de leur permettre de développer leurs compétences et d’acquérir les outils ainsi que le niveau d’expertise nécessaires au traitement, à l’analyse et à la gestion de leurs données de recherche.
Elles apportent les bases indispensables pour maîtriser les outils adaptés aux exigences du monde de la recherche scientifique et favoriser de bonnes pratiques de gestion des données.
Parmi les formations proposées figure également une initiation à Jupyter Notebook, environnement incontournable pour l’analyse de données, la programmation scientifique et la reproductibilité des travaux de recherche.
Parcours CEDRE 1
Objectifs :
- Définir l’algorithmie et la programmation orientée objet - POO.
• Recapituler sur les compétences pour créer, exécuter et déboguer un programme en langage Python.
• Comprendre le vocabulaire technique lie à la POO : classe, instance, méthode, interface, attribut, construct
Objectifs :
- Définir l’algorithmie et la programmation orientée objet - POO.
• Recapituler sur les compétences pour créer, exécuter et déboguer un programme en langage Python.
• Comprendre le vocabulaire technique lie à la POO : classe, instance, méthode, interface, attribut, constructeur, encapsulation, polymorphisme, héritage.
• Concevoir des programmes flexibles, maintenables et évolutifs.
• Démarrer avec l’utilisation des programmes pour le chargement et analyses de données.
Programme :
- Rappel sur les concepts clés de la programmation orientée objet : objets, classes, abstraction, encapsulation, héritage et polymorphisme.
- Rappel sur les concepts de la manipulation efficace des données avec Python : syntaxe, structures (chaînes de caractères, listes, dictionnaires), opérateurs, fonctions, boucles, conditionnels et récursivité.
- Création des libraires Python : instances, méthodes, attributs.
- Emploi des librairies scientifiques : NumPy, math, etc.
Parcours CEDRE 2 - Prétraitement des données de la recherche : techniques pratiques pour la gestion efficace des données
Objectifs :
- Introduire le prétraitement et la préparation des données de recherche pour une analyse avancée.
- Collection et extraction d’informations pertinentes provenant des différentes sources/bases de données.
- Intégration, traitement et exploitation des bases de données à travers l
Objectifs :
- Introduire le prétraitement et la préparation des données de recherche pour une analyse avancée.
- Collection et extraction d’informations pertinentes provenant des différentes sources/bases de données.
- Intégration, traitement et exploitation des bases de données à travers langage SQL.
- Introduction à l’utilisation de librairies Python.
- Rappel des concepts statistiques fondamentaux.
- Création des visualisations avec l’objectif d’une publication scientifique.
- Automatisation des processus répétitifs.
Programme :
- Introduction au prétraitement des données dans la recherche.
- Présentation des étapes du prétraitement des données.
- Modélisation des bases de données. Types de Bases de Données : Systèmes de gestion. Modèle conceptuel des données.
- Bases de données relationnelles. Introduction au langage SQL. Fondamentaux des requêtes SQL. Opérations CRUD (anglicisme pour Create, Read, Update and Delete) et jointures.
- Librairies Python pour le prétraitement des données (pandas et numpy). Récupération et lecture des fichiers. Manipulation de Data-frame. Indexation, sélection et assignation.
- Les outils pour la statistique descriptive
- Outils/librairies Python pour la visualisation des données.
- Réduction de dimensionnalité P1: transformation des caractéristiques.
Parcours CEDRE 3 - Analyse des données de la recherche : introduction à l’Intelligence Artificielle par Apprentissage Automatique (Machine Learning)
Objectifs :
- Relier les concepts d’analyse de données, Intelligence Artificielle -IA- et Apprentissage Automatique (Machine Learning-ML-).
- Identifier les types d’apprentissage (supervisé, non supervisé et par renforcement) et leurs algorithmes associés.
- Introduction à l’utilisation des
Objectifs :
- Relier les concepts d’analyse de données, Intelligence Artificielle -IA- et Apprentissage Automatique (Machine Learning-ML-).
- Identifier les types d’apprentissage (supervisé, non supervisé et par renforcement) et leurs algorithmes associés.
- Introduction à l’utilisation des librairies spécialisées de Python : Scikit-Learn.
- Identifier et mettre en œuvre les étapes de l’Apprentissage Automatique.
- Conduire un projet d’Apprentissage Automatique dans son intégralité.
- Construire une compréhension de l’analyse avancée de données à travers une technique de l’Intelligence Artificielle.
Programme :
- L’Intelligence Artificielle : les concepts.
- Rappel de prétraitement de données et réduction de dimensionalité P2: sélection des caractéristiques.
- Processus du ML : collecte de données, nettoyage et analyse de données, mélange et séparation de données, apprentissage, modèles et hyperparamètres, entraînement d’un modèle, validation, exploitation, optimisation d’un modèle.
- Concepts de ML, algorithmes supervisés et non supervisés. Mesures de la qualité : accuracy, precision, recall, F1 score, R2, MSE. Sur-apprentissage et Sous-apprentissage.
- Régression linéaire et algorithmes de la librairie Scikit Learn
- Classification et algorithmes de la librairie Scikit Learn : k-NN pour classification, machine à vecteurs supports, classification Bayésienne naïve, régression logistique, etc.
- Clustering et Scikit Learn: k means, hiérarchique.
Parcours CEDRE 4 - Analyse des données de recherche : introduction à l’Intelligence Artificielle par Apprentissage Profond (Deep Learning)
Objectifs :
- Connaître le process d’ingestion des données.
- Maîtriser les outils d’aide à l’implémentation des réseaux de neurones.
- Construire une solide compréhension du vocabulaire entourant les réseaux de neurones.
- Décrire le perceptron comme base de réseaux de neurones.
- Dé
Objectifs :
- Connaître le process d’ingestion des données.
- Maîtriser les outils d’aide à l’implémentation des réseaux de neurones.
- Construire une solide compréhension du vocabulaire entourant les réseaux de neurones.
- Décrire le perceptron comme base de réseaux de neurones.
- Décrire l’architecture des réseaux de neurones.
- Décrire l’utilisation des outils dédiés à l’Apprentissage profond.
Programme :
- Neurone biologique et perceptron (neurone artificiel), notations, fonctions d’activation, fonction de coût, programmation et test d’un perceptron.
- Généralités sur les réseaux de neurones, rétro-propagation et descente de gradient, outils (Tensorflow et keras), premier réseau de neurones.
- Optimisation des réseaux de neurones, architecture, régularisation.
- Réseaux de neurones avancés : réseaux convolutifs, réseaux récurrents.
- Hyperparamètres : noyau de convolution, pooling, padding et augmentation des données.
- Apprentissage par transfert, architectures connues, algorithmes pré-entrainés, adaptation des algorithmes, réglage fin et rappels (Call-backs).
- Réseaux de neurones récurrent.