Guide du Recensement de la population, 2016
Chapitre 10 – Évaluation de la qualité des données

Introduction

L'évaluation de la qualité des données permet d'évaluer tous les aspects de la qualité des données du recensement. Les résultats de ces évaluations servent à informer les utilisateurs de la fiabilité des données, à apporter des améliorations au prochain recensement, à ajuster les chiffres du recensement pour la non-réponse et, dans le cas de deux études sur la couverture (Contre-vérification des dossiers et Étude sur le surdénombrement du recensement), à produire les estimations démographiques officielles. Des activités d'évaluation de la qualité sont mises en œuvre tout au long du processus du recensement, lesquelles commencent avant la collecte des données et se terminent après la diffusion.

Sources des erreurs

Quel que soit le soin apporté à la conception du recensement, les données recueillies comporteront inévitablement des erreurs. Ces erreurs peuvent survenir pratiquement à tout moment du processus, depuis la préparation du matériel jusqu'à l'établissement de la liste des logements et de la collecte des données, tout comme elles peuvent se produire lors du traitement de celles-ci. Les utilisateurs de données du recensement doivent être conscients de l'existence des types d'erreurs qui peuvent survenir afin de pouvoir évaluer la pertinence des données, à savoir si elles répondent à leurs besoins.

Principaux types d'erreurs :

Les erreurs de couverture se produisent lorsque des logements et/ou des personnes sont omis, incorrectement dénombrés ou dénombrés plus d'une fois.

Les erreurs dues à la non-réponse surviennent lorsqu'une partie des renseignements ou tous les renseignements concernant des personnes, des ménages ou des logements n'ont pas été fournis.

Les erreurs de réponse se produisent lorsqu'une question est mal comprise ou lorsqu'une caractéristique est mal déclarée par le répondant, par l'agent recenseur ou par le téléphoniste de l'Assistance téléphonique du recensement.

Les erreurs de traitement peuvent se manifester à diverses étapes du traitement. Les erreurs de traitement comprennent des erreurs lors de la saisie des données pendant les opérations de codage, lorsque les réponses en toutes lettres sont converties en codes numériques et à l'imputation, lorsqu'une réponse valide (pas nécessairement exacte) est insérée dans un enregistrement pour remplacer une réponse manquante ou invalide.

Les erreurs d'échantillonnage s'appliquent uniquement lorsque les réponses aux questions sont obtenues à partir d'un échantillon. Ce type d'erreur ne s'applique qu'au questionnaire détaillé du Recensement de 2016.

Mesure de la qualité des données

Un bon nombre d'études sur la qualité des données ont été effectuées lors de recensements récents afin de permettre aux utilisateurs d'évaluer les répercussions des erreurs et d'améliorer leur propre compréhension de la façon dont les erreurs surviennent. Dans le cadre du Recensement de 2016, des études spéciales ont pour but d'examiner les erreurs de couverture et la qualité des données, c'est-à-dire la non-réponse, la réponse et le traitement.

Trois études sont menées pour évaluer les erreurs de couverture :

  1. Enquête sur la classification des logements – La classification erronée des logements constitue l'une des sources des erreurs de couverture le jour du recensement. Cette erreur peut se produire lorsqu'un logement occupé est classé dans la catégorie des logements inoccupés, ou lorsqu'un logement inoccupé est classé comme un logement occupé. L'Enquête sur la classification des logements vise à étudier ces types d'erreurs de classification et de rectifier le dénombrement, si nécessaire. On communique avec un échantillon de logements pour lesquels un questionnaire de recensement n'a pas été retourné, on détermine si le logement est occupé ou non et, s'il l'est, on recueille des renseignements sur le nombre de résidents habituels.
  2. Ces renseignements servent à ajuster les données du recensement relatives aux logements, aux ménages et aux personnes. Ceci est fait en corrigeant les erreurs de classification et en ajustant la répartition de la taille des ménages au moyen de l'imputation des données pour les logements sans questionnaire retourné. Toutes ces opérations sont effectuées à temps pour la diffusion initiale des chiffres de population.
  1. Contre-vérification des dossiers – Cette étude permet d'estimer le nombre de personnes omises dans le cadre du recensement (une fois pris en compte les ajustements décrits dans l'Enquête sur la classification des logements, ci-dessus). Des estimations sont élaborées pour chaque province et territoire ainsi que pour divers sous-groupes de la population (p. ex., les groupes définis selon l'âge et le sexe, et l'état matrimonial).
  1. Étude sur le surdénombrement du recensement – Dans le cadre des recensements de 2016 et de 2011, le dénombrement en double des personnes est détecté en cherchant des enregistrements couplés qui possèdent un haut degré de concordance quant au sexe, à la date de naissance et au nom. Les enregistrements couplés sont échantillonnés et vérifiés manuellement; les résultats sont utilisés pour estimer le surdénombrement (ou nombre de personnes en double) du recensement.

Certification

La certification consiste en plusieurs activités servant à évaluer rigoureusement la qualité des données du recensement à des niveaux géographiques précis afin d'assurer que les normes de qualité pour la diffusion au grand public soient respectées. Cette évaluation comprend la certification des chiffres de population et des logements ainsi que la certification des variables liées aux caractéristiques des logements et de la population.

Pendant la certification, les taux de réponse, les réponses invalides, les taux de rejet au contrôle ainsi que la comparaison des données avant et après l'imputation sont parmi les mesures utilisées. Les totalisations du Recensement de 2016 sont produites et comparées aux données correspondantes des recensements antérieurs, d'autres enquêtes et de sources administratives. Les tableaux croisés détaillés sont aussi vérifiés pour en assurer la cohérence et la précision.

Selon les résultats de la certification, les données du recensement peuvent être diffusées de trois façons.

Pour de plus amples détails sur les indicateurs de qualité et les résultats de la certification, se reporter aux guides de référence associés à chaque domaine d'intérêt.

Taux de réponse au Recensement de la population de 2016

Le taux de réponse est l'une des principales mesures de la qualité du Recensement de la population. Le tableau 10.1 présente les taux de réponse du Recensement de la population de 2016 à l'échelle nationale et pour chaque province et territoire. Les taux sont présentés pour l'ensemble des logements privés occupés pour lesquels on devait obtenir un questionnaire abrégé ou un questionnaire détaillé et pour le sous-ensemble des logements privés occupés pour lesquels on devait obtenir un questionnaire détaillé. Pour le questionnaire détaillé, le taux de réponse non pondéré et le taux de réponse pondéré sont présentés.

Les taux du tableau 10.1 ont été obtenus suite au traitement des données et à la vérification de la qualité des données. Ils sont calculés de la façon suivante : le nombre de logements privés pour lesquels un questionnaire a été rempli divisé par le nombre de logements privés classés comme occupés selon la base de données du recensement. La classification finale du statut d'occupation des logements est fondée sur l'analyse des données recueillies par le personnel sur le terrain, les données fournies par les répondants et les résultats d'une étude de la qualité concernant le statut d'occupation d'un échantillon de logements. Les taux de réponse du tableau 10.1 se distinguent des taux de réponse de collecte auparavant publiés en ce qu'ils tiennent compte du traitement des données et de la vérification du statut d'occupation des logements. Ces taux de réponse sont ainsi considérés comme finaux. Quant aux taux de réponse pondérés, ils sont basés sur les poids d'échantillonnage finaux du questionnaire détaillé. Les taux de réponse pondérés sont alors calculés de la façon suivante : le nombre pondéré de logements privés échantillonnés pour lesquels un questionnaire a été rempli divisé par le nombre pondéré de logements privés échantillonnés classés comme occupés.

Tableau 10.1 Recensement de la population de 2016 : taux de réponse
Sommaire du tableau
Le tableau montre les résultats de Recensement de la population de 2016 : taux de réponse. Les données sont présentées selon Province/territoire (titres de rangée) et Taux de réponse du questionnaire abrégé et questionnaire détaillé, Taux de réponse non pondéré du questionnaire détaillé seulement et Taux de réponse pondéré du questionnaire détaillé seulement, calculées selon pourcent unités de mesure (figurant comme en-tête de colonne).
Province/territoire Taux de réponse du questionnaire abrégé et questionnaire détaillé Taux de réponse non pondéré du questionnaire détaillé seulement Taux de réponse pondéré du questionnaire détaillé seulement
(%)
Canada 97,4 96,7 96,9
Terre-Neuve-et-Labrador 97,4 96,6 96,8
Île-du-Prince-Édouard 97,5 96,9 97,0
Nouvelle-Écosse 97,6 97,1 97,2
Nouveau-Brunswick 97,6 97,1 97,2
Québec 97,6 97,2 97,3
Ontario 97,6 97,0 97,2
Manitoba 97,4 96,3 96,9
Saskatchewan 96,7 96,2 96,3
Alberta 97,0 96,3 96,4
Colombie-Britannique 96,5 95,7 96,0
Yukon 95,8 93,5 95,2
Territoires du Nord-Ouest 93,9 92,8 93,1
Nunavut 92,7 92,7 92,7
Date de modification :