Base de données complètes sur les exploitations agricoles : manuel de référence

Avertissement Consulter la version la plus récente.

Information archivée dans le Web

L’information dont il est indiqué qu’elle est archivée est fournie à des fins de référence, de recherche ou de tenue de documents. Elle n’est pas assujettie aux normes Web du gouvernement du Canada et elle n’a pas été modifiée ou mise à jour depuis son archivage. Pour obtenir cette information dans un autre format, veuillez communiquer avec nous.

À propos de la Base de données complètes sur les exploitations agricoles

Passer au texte

Introduction
Contexte
Structure de la base de données
Critères de sélection
Présentation normalisée
Qualité des données
Confidentialité

Début du texte

Introduction

Répondre aux besoins des utilisateurs

La Base de données complètes sur les exploitations agricoles (BDCEA) est le résultat d'un projet mené conjointement par Agriculture et Agroalimentaire Canada et Statistique Canada. La base a été conçue pour répondre à un besoin accru de données plus désagrégées au niveau de l'exploitation agricole. Parmi les utilisateurs éventuels de la base de données, citons les responsables de l'élaboration des politiques du secteur public, les analystes du secteur agricole et les décideurs du secteur privé. La base de données fournit aux utilisateurs l'outil dont ils ont besoin pour évaluer les politiques et programmes agricoles de même que la viabilité, la stabilité et la compétitivité de différents types d'exploitations agricoles.

Intégration de toutes les données dans une seule base

La BDCEA intégre en une seule base les résultats de diverses enquêtes et les données provenant de dossiers administratifs. Tout en permettant de réduire le fardeau de réponse, d'éliminer les doubles emplois et de tirer le maximum des ressources existantes, la BDCEA peut fournir aux utilisateurs un éventail plus vaste que jamais de données désagrégées de nature physique et financière à l'égard des exploitations agricoles.

Un guide pour la Base de données complètes sur les exploitations agricoles

Ce manuel vise à familiariser les utilisateurs éventuels de la BDCEA avec la structure de la base et les normes de qualité des données qu'elle renferme, ainsi qu'avec les autres produits et services offerts par la BDCEA.

Contexte

Depuis le milieu des années 1920, la Division de l'agriculture de Statistique Canada publie des séries de données qui illustrent les tendances du secteur agricole par province. Bien que ces séries soient actuelles et fiables, elles ne permettent pas toujours de répondre à la demande accrue de données plus désagrégées sur les exploitations agricoles.

En 1991, Agriculture et Agroalimentaire Canada a obtenu des fonds pour mettre sur pied le Projet de données au niveau des exploitations agricoles (PDNEA). Ce projet a pour objectif de suivre la situation financière des entreprises agricoles, d'évaluer l'incidence sur celles-ci de tout changement en matière de politiques, de programmes ou dans les conditions économiques et aussi de gérer et d'évaluer les programmes agricoles.

Pour atteindre un tel objectif, Agriculture et Agroalimentaire Canada et la Division de l'agriculture de Statistique Canada ont lancé une composante essentielle du PDNEA, soit la Base de données complètes sur les exploitations agricoles (BDCEA). Cette base a pour but de fournir aux utilisateurs des données aussi complètes que possible sur les caractéristiques physiques et les finances des exploitations agricoles1. À cette fin, les résultats de diverses enquêtes et des données provenant de dossiers administratifs ont été intégrés dans la BDCEA. C'est d'ailleurs à partir de cet ensemble de données que sont produites les statistiques désagrégées selon le type d'exploitation, la catégorie de revenu et la région géographique infraprovinciale.

Structure de la base de données

La BDCEA offre actuellement plusieurs grandes sources de données qui permettent de tirer des estimations annuelles sur les exploitations agricoles. Il s'agit du Programme des données fiscales (PDF), de l'Enquête nationale sur les fermes (ENF), de l'Enquête de juin sur les cultures (EJC), de l'Enquête de juillet sur le bétail (EJB) et de l'Enquête financière sur les fermes (EFF). La BDCEA nous permet de produire des estimations sur différentes caractéristiques des exploitations agricoles ayant un revenu annuel de 10 000 $ et plus.

Chacune des sources a été choisie pour fournir des données relatives aux composantes et aux années de référence suivantes :

  • Programme des données fiscales 2 — de 1987 à 2009
    • données détaillées sur les revenus et les dépenses
    • acquisition et cession d'éléments d'actif3
    • revenus hors ferme des exploitants agricoles (secteur non constitué en société seulement)4
    • revenus hors ferme des exploitants agricoles (secteurs constitué en société et non constitué en société)5
    • revenus hors ferme des familles agricoles6
  • Enquête nationale sur les fermes 7 , 8 — de 1988 à 1992
    • superficies cultivées
    • stocks de bétail
    • certains éléments financiers9
  • Enquête de juin sur les cultures 10 — de 1993 à 2009
    • cultures - superficie cultivée
  • Enquête de juillet sur le bétail 10 — de 1993 à 2009
    • stocks de bétail
  • Enquête financière sur les fermes 11 — de 1987 à 2009 12
    • achats et ventes de biens en immobilisation13
    • actif et passif
    • capitaux empruntés à long terme14

L'annexe C contient un résumé sur la méthodologie et la procédure d'échantillonnage utilisées pour chacune des sources de données.

Critères de sélection

La BDCEA permet de produire des tableaux en utilisant, comme critère de sélection, chacune des variables examinées dans les sources de données. Toutefois, la production de tableaux croisés à partir de ces sources n'est possible que pour un ensemble de variables descriptives (appelées variables de base). Les renseignements financiers tirés du Programme des données fiscales, par exemple, ne peuvent être totalisés selon le nombre d'animaux sur la ferme puisque cette source de données ne contient pas de variables sur les stocks de bétail.

Les variables de base se divisent en trois catégories : variables géographiques, variables sur les activités des exploitations agricoles et variables sur les exploitants agricoles. Ces variables de base forment la structure de la BDCEA à partir de laquelle sont produites les statistiques désagrégées. Par ailleurs, parce que la BDCEA contient des variables de base communes à la plupart des sources de données, il est possible de produire des tableaux en utilisant les mêmes critères de sélection (p. ex., des tableaux sur les revenus et dépenses [composante PDF], sur les stocks de bétail [composante EJB] et sur l'actif et le passif [composante EFF] pour une même division de recensement, un même type d'exploitation et une même catégorie de revenu). Bien que presque toutes les variables de base soient disponibles pour chaque enregistrement, le niveau de désagrégation possible est limité par la qualité des données obtenues et le nombre de répondants pour une variable quelconque (p. ex., il est impossible de produire des données désagrégées pour un seul code postal, mais comme les codes postaux figurent dans chaque enregistrement, l'utilisateur peut sélectionner un groupe de codes pour obtenir des données sur une petite région qu'il aura lui-même définie).

Les variables de base sont définies à l'annexe A.

Présentation normalisée

La BDCEA permet de produire des estimations pour chacune des variables recueillies de toutes les sources de données. Pour assurer à la fois la qualité et la cohérence des données, une série précise de variables agricoles a été élaborée pour chacune des sources de données. Les présentations normalisées correspondantes permettent de produire des chiffres plus complets et plus représentatifs du secteur agricole sur une base annuelle (voir les tableaux 1 à 5).

La plupart des variables utilisées correspondant aux sources de données de l'ENF, de l'EJC, de l'EJB et de l'EFF ont été tirées directement des questionnaires d'enquête pertinents. On trouvera dans ces questionnaires (voir l'annexe F) et dans les manuels de formation des intervieweurs une définition plus précise des variables. Ces documents sont disponibles en communiquant avec la Division de l'agriculture. Par contre, les variables du PDF utilisées pour les présentations normalisées sont constituées de combinaisons de données relatives aux déclarations de revenus des contribuables (voir l'annexe B pour les descriptions).

Qualité des données

Erreurs d'échantillonnage

Toutes les estimations produites à partir de la BDCEA sont établies à l'aide d'un échantillon, ce qui peut donner lieu à des erreurs d'échantillonnage. De telles erreurs sont attribuables au fait que les observations portent sur un échantillon et non sur la population totale. La taille de l'échantillon, la variabilité des caractéristiques étudiées, le plan d'échantillonnage et la méthode d'estimation sont des facteurs qui vont influer sur la qualité des estimations. Étant donné que dans une enquête-échantillon on fait des inférences sur l'ensemble d'une population en se fondant sur des renseignements recueillis auprès d'une fraction seulement de cette dernière, les résultats sont susceptibles de différer de ce que l'on obtiendrait en effectuant un recensement complet, dans les mêmes conditions que dans l'enquête-échantillon. La principale caractéristique des sondages probabilistes est que l'erreur d'échantillonnage peut être directement mesurée à partir de l'échantillon.

Pour toutes les estimations produites au moyen de la BDCEA, nous avons attribué un coefficient de variation (c.v.) pour indiquer la qualité des estimations. Étant une mesure statistique objective de l'écart entre l'estimation d'une caractéristique donnée produite à partir d'un échantillon aléatoire et la valeur « vraie » de cette caractéristique, le c.v. fournit une indication du niveau de confiance de l'estimation en question. Il revient à l'utilisateur de décider s'il doit ou non se servir d'une estimation assortie d'un c.v. élevé.

Nous proposons le système de cotation suivant pour les différents intervalles de c.v. possibles.

Système de cotation des coefficients de variation
Signe Intervalle du coefficient de variation Signification
A 0,00 % à 4,99 %  excellent
B 5,00 % à 9,99 % très bon
C 10,00 % à 14,99 %  bon
D 15,00 % à 24,99 % acceptable
E 25,00 % à 34,99 %  à utiliser avec prudence
F >=35,00 % trop peu fiable pour être publié

Le c.v. — défini comme étant l'erreur-type divisée par l'estimation — n'est pas toujours un bon indicateur de la précision des données pour certains types de variables. Cette situation se produit particulièrement quand les valeurs d'une variable sont positives et négatives. Dans ce cas, l'erreur-type tend à être grande tandis que l'estimation tend à être petite ou à se rapprocher de zéro, ce qui résulte en une valeur de c.v. élevée. Or, il est possible que l'estimation soit près de la valeur exacte, et qu'en même temps, elle soit qualifiée comme étant non fiable. Les variables du bénéfice net d'exploitation, du bénéfice net d'exploitation rajusté pour la déduction pour amortissement (DPA), du revenu net du marché et du revenu net du marché rajusté pour la DPA sont des exemples où cette situation peut se produire et par conséquent, les c.v. calculés pour ces variables ne sont pas utilisés. Afin de donner une indication de leur précision, un signe qualitatif est attribué à ces variables en utilisant le c.v. des variables à partir desquelles elles sont dérivées.

Par exemple, les valeurs du bénéfice net d'exploitation, qui peuvent fluctuer autour de zéro, sont dérivées à partir de deux composantes (revenus d'exploitation totaux et dépenses d'exploitation totales) pour lesquelles il est possible de calculer les c.v. Les signes qualitatifs des données sont attribués de la manière suivante : 1) Lorsque le c.v. des deux composantes est inférieur à 35,00 % et que le c.v. d'au moins une des composantes se situe entre 25,00 % et 34,99 %, le signe « E » est attribué. Ce signe signifie que l'estimation doit être utilisée avec prudence. 2) Le signe « F » est attribué lorsque le c.v. d'au moins une des composantes est égal ou supérieur à 35,00 %. Ce signe signifie que l'estimation est trop peu fiable pour être publiée. 3) Aucun signe n'est attribué lorsque le c.v. des deux composantes est inférieur à 25,00 %. La qualité est dite « acceptable ou supérieure » quand les estimations ne sont pas suivies d'un signe qualitatif.

Les variables pour lesquelles un c.v. ne peut être calculé ont été traitées d'une manière analogue à celle décrite ci-dessus. Le c.v. du revenu total (incluant ou excluant les gains en capital imposables) et du revenu total rajusté pour la déduction pour amortissement (incluant ou excluant les gains en capital imposables) ne peut être évalué. Le revenu total est la somme du revenu hors ferme et du bénéfice net d'exploitation et on le calcule en deux étapes.

Erreurs non liées à l'échantillonnage

Les erreurs non liées à l'échantillonnage se produisent aussi bien dans les enquêtes-échantillons que dans les recensements. Elles peuvent survenir aux différentes étapes du traitement (par exemple au moment du codage, de l'entrée des données, de la vérification, de la pondération ou de la totalisation). Ces types d'erreurs peuvent avoir lieu lorsqu'un répondant fournit involontairement de l'information incorrecte. Les vérifications exhaustives et l'analyse des données permettent de réduire ces erreurs, mais on ne peut pas toutes les supprimer. Par exemple, pour la Saskatchewan, il est impossible de déterminer avec certitude les régions agricoles de recensement (RAR) à cause du manque de fiabilité des ventilations pour les subdivisions de recensement (SDR) du PDF. En outre, jusqu'à l'année d'imposition 1992, les données provenant du PDF ne permettaient pas, pour certaines fermes du Québec, de déterminer le genre de cultures pratiquées. Ces fermes étaient donc classées dans la catégorie « cultures non précisées ». Cette restriction a été revue par les spécialistes. Depuis l'année d'imposition 1993, les revenus au titre des « cultures non précisées » sont alloués selon le type de culture. Enfin, les données du PDF ne permettent pas de calculer des estimations pour la région de la rivière de la Paix (Colombie-Britannique) pour les années 1988 et 1989.

Confidentialité

Statistique Canada reconnaît l'importance que revêt la protection du caractère confidentiel des renseignements recueillis. Avant d'être diffusées, toutes les données totalisées doivent satisfaire aux exigences établies en matière de confidentialité. C'est en raison de ces exigences que chaque cellule d'un tableau fait l'objet d'un certain nombre de contrôles informatiques visant à empêcher la publication ou la divulgation de tout renseignement jugé confidentiel.

Dans chacun des tableaux produits, le nombre estimatif de fermes est arrondi au multiple de 5, puis les estimations des autres variables sont ajustées en fonction d'un facteur variable. Le nombre estimé de familles agricoles est arrondi au multiple de 10. En ce qui a trait au nombre estimé d'exploitants agricoles, il est arrondi au multiple de 5 dans la série sur les exploitants agricoles qui exploitent une seule entreprise agricole non constituée en société et au multiple de 10 dans la série sur les exploitants agricoles qui exploitent des entreprises agricoles constituées en société ou non constituées en société. Lorsqu'un utilisateur demande des données dont le niveau de détail s'avère incompatible avec les exigences de confidentialité des renseignements, le système supprime automatiquement, selon le cas, les données en question ou le tableau au complet.

Cette méthode permet d'assurer la confidentialité des données sans compromettre la qualité des estimations.


Notes

  1. Pour plus de renseignements, voir : Mario MÉNARD, Denis CHARTRAND et Dave CULVER.  Janvier 1992Rapport sur la consultation des utilisateurs et sur les tableaux proposés à l'égard des données complètes sur les exploitations agricoles. Ce document est produit par la Division de l'agriculture de Statistique Canada.
  2. De 1987 à 1989, le PDF ne comprenait pas les provinces des Prairies. De plus, les données relatives à la région de la rivière de la Paix (Colombie-Britannique) pour les années 1988 et 1989 ne sont pas disponibles.
  3. De 1996 à 1999, la série statistique sur l'acquisition et la cession d'éléments d'actif ne comprend pas le secteur non constitué en société. Interruption de la série après les données de 1999.
  4. Secteur non constitué en société seulement. Exploitants agricoles d'une exploitation unique.
  5. Exploitants agricoles qui exploitent une ou plusieurs fermes constituées ou non constituées en société. Données disponibles depuis 1993.
  6. Secteur non constitué en société seulement. Familles agricoles exploitant une exploitation unique, pour les années de 1989 à 2008 seulement.
  7. Depuis l'année de référence 1993, l'ENF a été remplacée par l'Enquête de juin sur les cultures et l'Enquête de juillet sur le bétail.
  8. L'ENF ne comprend pas Terre-Neuve-et-Labrador pour l'année 1992.
  9. Provinces des Prairies seulement. Ces données ne sont pas disponibles pour 1992.
  10. L 'EJC ne comprend pas Terre-Neuve-et-Labrador pour les années 1993 à 1997. Cette province est exclue de l'EJB de 1993 et 1994.
  11. L'EFF était à l'origine menée par Financement agricole Canada (antérieurement Société du crédit agricole) et s'appelait « Enquête agricole ». Les années correspondent aux années de référence. Les données sont disponibles à tous les deux ans de 1987 à 2001. Depuis 2002, les données sont disponibles à tous les ans.
  12. L'EFF menée en 1992 comprenait seulement les provinces des Prairies et la Colombie-Britannique.
  13. Les données sur les achats et les ventes de biens en immobilisation sont recueillies tous les deux ans depuis la période de référence 2005.
  14. Interruption de la série après les données de 2006.