Présentation détaillée de Génération

Mis en ligne le

Génération, informations techniques

Le dispositif Génération propose un questionnement, une méthodologie et un cadre d'analyse homogène pour tous les jeunes interrogés, quels que soient le parcours scolaire, les diplômes obtenus, les domaines et voies de formation, contrairement à d'autres enquêtes d'insertion qui visent des publics segmentés. Grâce à un questionnaire détaillé et un échantillon important, il permet de décrire le parcours d’insertion en fonction des caractéristiques de la formation initiale et d’autres données individuelles.

Organisme producteur, maitrise d’œuvre et maitrise d’ouvrage

  • Le Céreq assure la maîtrise d’ouvrage des enquêtes Génération. Cette maîtrise d’ouvrage lui a été confiée par ses ministères de tutelle (ministères en charge de l’éducation et du travail). Elle s’inscrit dans l’un de ses grands axes d’étude sur les conditions de passage de la formation à l’emploi, selon les types et les niveaux de formation. Cet axe correspond à la mission inscrite au 1° de l’article R313-38 du Code de l’éducation.
  • Le Céreq (DEEVA) réalise également une partie de la maîtrise d’œuvre de l’enquête. Il organise la collecte de la base de sondage et la constitue par divers traitements, il définit et met en œuvre le protocole d’échantillonnage, il élabore le questionnaire, suit la collecte effectuée par le prestataire choisi et réalise les traitements post-enquête.
  • Le Céreq fait appel à des sous-traitants (choisis selon la procédure officielle des marchés publics) concernant certaines phases de la réalisation de l’enquête : collecte des fichiers constituant la base de sondage ; développement du questionnaire CATI-CAWI et réalisation de la collecte multimode.

Champ des enquêtes

Pour une Génération « n », les individus interrogés sont les individus « primo-sortants » de formation initiale au cours de l’année scolaire (n-1)/n.

Dans « primo-sortants » sont inclus les individus ayant interrompu momentanément leurs études par le passé. Tous les niveaux et domaines de formations de sortie sont concernés et les individus sont interrogés qu’ils en sortent diplômés ou non.

De façon plus précise, les critères d’éligibilité pour être dans le champ de l’enquête sont les suivants :
-    Avoir été inscrit dans un établissement de formation en France durant l’année scolaire (n-1)/n
-    Ne pas avoir interrompu ses études, sauf momentanément, avant l’année scolaire (n-1)/n
-    Ne pas avoir repris ses études dans les mois qui ont suivi l’entrée sur le marché du travail
-    Avoir 35 ans ou moins l’année de l’enquête
Ces conditions sont cumulatives.

D’une enquête à l’autre, certains critères ont pu légèrement évoluer :
-    La durée de césure prise en compte pour être considéré comme primo-sortants et rester dans le champ a augmenté (de 12 à 16 mois)
-    Symétriquement, le nombre de mois en-deçà duquel une reprise d’études classe les individus hors champ a été augmenté (de 12 à 16 mois)
-    Les individus dont la formation initiale s’est achevée en contrat de professionnalisation ont été intégrés dans le champ
-    Les sortants des établissements de formations situés dans les DROM ont été intégrés
-    Les personnes résidant à l’étranger ou dans les DROM au moment de l’enquête sont désormais interrogées.

Base de sondage

Il n’existe pas de base nationale d’élèves nominative couvrant l’ensemble des sortants du système éducatif une année donnée. Le Céreq constitue donc cette base de sondage pour chaque Génération, à partir de différentes sources et en opérant divers retraitements.

Pour cela, deux principales opérations de collecte ont lieu pour récupérer des listes nominatives d’élèves ou d’étudiants inscrits dans les établissements français, incluant quand c’est possible les coordonnées postales, téléphoniques et électroniques :
1.    Une collecte de fichiers de données nominatifs centralisés au niveau national sur un champ spécifique est réalisée. Plus précisément, sont mobilisées les données du ministère en charge de l’Education avec, d’une part les élèves du second degré à l’aide du Système d’Information Statistique Consolidé Académique (SYSCA) et d’autre part les apprentis à partir du Système d’Information de la Formation des Apprentis (SIFA) ; les données du ministère en charge de la Culture sur les étudiants des écoles d’architecture et d’arts uniquement à partir de la plateforme TAIGA ; les données du ministère de l’Agriculture sur les élèves inscrits dans les lycées agricoles ou équivalents ; les données de la Direction des Sports sur les diplômés jeunesse et sport à partir de l’outils de gestion FORmations et diplÔMES de l’animation et du sport (FORÔMES), les données sur les contrats de professionnalisation de la base Extrapro de la direction de l’Animation de la recherche, des Études et des Statistiques (DARES).
2.    Une collecte complémentaire auprès de tous les autres établissements de formation (universités, écoles d’ingénieurs, diplômés d’écoles de la santé et du social, etc.) est réalisée spécifiquement pour le Céreq avec l’aide d’un sous-traitant externe pour le contact des différents établissements. La liste des établissements à enquêter est issue de la BCE (Base centrale des établissements du ministère en charge de l’Education).

Une fois cette collecte réalisée, un travail d’appariement de fichiers est effectué pour éliminer les élèves ayant poursuivi leurs études au cours de l’année suivant celle concernant la Génération interrogée : pour une Génération « n », il s’agit de repérer parmi les élèves inscrits en (n-1)/n ceux également inscrits dans un établissement en n/(n+1), afin de les éliminer de la base de sondage. Cette base comporte un défaut de sous-couverture (environ 90% des élèves identifiés dans le champ figurent dans la base), ainsi qu’un défaut de sur-couverture (de nombreux individus hors champ demeurent et sont repérés au moment de la collecte).
Les bases de sondage des enquêtes Génération comportent environ 1,2 millions d’individus. La DEPP estime le nombre de sortants annuel, à partir de l’enquête emploi, à environ 750 000 individus. La présence de ces individus hors champ dans la base de sondage, et par conséquent dans l’échantillon, exige d’intégrer dans le questionnaire une première partie « filtre », afin de sélectionner les individus du champ.

Protocole de collecte

Jusqu’à la Génération 2013, le protocole était un protocole monomode téléphonique, avec envoi de courriers/mails avis au démarrage de l’enquête.
A partir de la Génération 2017, le protocole de collecte évolue vers du multimode internet – téléphone, séquentiel et concurrentiel. Après envoi des courriers/mails avis au démarrage de l’enquête :
-    Une première phase d’un mois consiste à privilégier la collecte internet en ne contactant par téléphone que les individus n’ayant pas pu recevoir la « lettre avis »
-    Une seconde phase, d’environ un mois et demi, consiste à appeler l’ensemble de l’échantillon non répondant, y compris ceux ayant démarré leur questionnaire sans le terminer. Dans cette phase, il est proposé aux individus joints par téléphone de poursuivre le remplissage par internet ou par téléphone
-    La troisième phase, dite de rattrapage, consiste à contacter les individus n’ayant pas commencé ou terminé leur questionnaire dans le but de compléter l’enquête uniquement par téléphone. Le Cawi reste ouvert, mais les enquêteurs ne proposent plus ce choix en première intention.

Echantillonnage et pondération

L’enquête Génération est ouverte à des partenariats, avec des acteurs intervenant dans le domaine de l’emploi et de la formation, pour répondre à des besoins de connaissance spécifiques. Elle offre la possibilité d’extensions d’échantillons (pour disposer d’un nombre conséquent de répondants).
Pour chaque Génération, un échantillon est construit de manière à être représentatif du champ Céreq et afin de satisfaire les demandes en nombre de questionnaires des partenaires d’extensions. Il répond également au besoin d’assurer un nombre suffisant de répondants pour la ré-interrogation à 6 ans, en anticipant la non-réponse et l’attrition. Les échantillons du tronc commun (échantillon Céreq) et des extensions ont été tirés indépendamment par tirage stratifié à probabilité inégale, puis combinés en post-collecte par un partage des poids.
Le redressement de l’enquête consiste à corriger la non-réponse par la méthode des groupes de réponse homogène. Un coefficient de correction du taux de couverture est ensuite appliqué. Il permet de pallier les défauts d’exhaustivité de la base de sondage. Enfin, un calage est réalisé à partir d’effectifs de sortants par genre et plus haut niveau de diplôme (PHD). Les données d’effectifs utilisées sont publiées par la Direction de l'évaluation, de la prospective et de la performance (DEPP) qui mobilise l’enquête emploi et le recensement de la population de l’Insee.

Pour en savoir plus :

- Génération, historique et spécificités de l'enquête

- Retrouvez les publications méthodologiques issues des enquêtes Génération :
•  Note sur l’attrition et la déformation de l’échantillon des enquêtes - Enquête Génération 2010, Céreq Etudes n°28, 2019.

•   Bilan méthodologique- Enquête Génération 2010, Interrogation 2013, Céreq Etudes n° 25, 2019.

•    L’apport des enquêtes générations à l’étude de l’insertion professionnelle des étudiants. Calmand Julien et Ménard Boris, in Philippe Cordazzo (dir) : Parcours d’étudiants : Sources, enjeux et perspectives de recherche, Paris : Ined, coll. Grandes enquêtes, 2019.

•    Enquête "Génération 2004" : méthodologie et bilan, 1ère interrogation - printemps 2007, Net.Doc n° 63, 2010

•    Les enquêtes "Génération" du Céreq. Eléments de bilan, Nef n° 28, 2008.

- Les enquêtes Génération : 2017, 2013, 2010, 2007, 2004, 2001, 1998, 1992.

Citer cet article

Présentation détaillée de Génération, https://www.cereq.fr/presentation-detaillee-de-generation