Matches in SemOpenAlex for { <https://semopenalex.org/work/W2094252110> ?p ?o ?g. }
- W2094252110 endingPage "102" @default.
- W2094252110 startingPage "73" @default.
- W2094252110 abstract "Statistical offices are responsible for publishing accurate statistical information about many different aspects of society. This task is complicated considerably by the fact that data collected by statistical offices generally contain errors. These errors have to be corrected before reliable statistical information can be published. This correction process is referred to as statistical data editing. Traditionally, data editing was mainly an interactive activity with the aim to correct all data in every detail. For that reason the data editing process was both expensive and time-consuming. To improve the efficiency of the editing process it can be partly automated. One often divides the statistical data editing process into the error localisation step and the imputation step. In this article we restrict ourselves to discussing the former step, and provide an assessment, based on personal experience, of several selected algorithms for automatically solving the error localisation problem for numerical (continuous) data. Our article can be seen as an extension of the overview article by Liepins, Garfinkel & Kunnathur (1982). All algorithms we discuss are based on the (generalised) Fellegi–Holt paradigm that says that the data of a record should be made to satisfy all edits by changing the fewest possible (weighted) number of fields. The error localisation problem may have several optimal solutions for a record. In contrast to what is common in the literature, most of the algorithms we describe aim to find all optimal solutions rather than just one. As numerical data mostly occur in business surveys, the described algorithms are mainly suitable for business surveys and less so for social surveys. For four algorithms we compare the computing times on six realistic data sets as well as their complexity. Bureaux de la statistique ont pour tâche de publier information statistique consciencieuse en fait de beaucoup d'aspects de société. Cette tâche est compliqué considérablement puisque données collecté par bureaux de la statistique en règle générale comportent des erreurs. Ces erreurs doiventêtre corrigé par le bureau de la statistique avant qu'une information crédible puisse être publié. Ce processus de correction c'est appelé la vérification de données statistiques. Traditionnellement, la vérification de données statistiques était essentiellement un processus interactif avec l'objectif de corriger toutes les données en détail. C'est pour cette raison que la vérification de données statistiques était un processus cher qui prenait du temps. Pour améliorer l'efficience de processus de vérification de données statistiques, on peut automatiser ce processus partiellement. On souvent subdivise la vérification de données statistiques en le problème de localisation des erreurs et le problème d'imputation. Nous examinons ici seulement le problème de localisation des erreurs et nous donnons une appréciation, fondé sur notre expérience personnellement, de quelques algorithmes sélectionnés pour résoudre cet problème pour des données numériques (continues) automatiquement. On peut considéré notre article comme une mise à jour de l'aperçu de Garfinkel, Kunnathur & Liepins (1986). Tous les algorithmes nous discutons sont fondé sur la paradigme (généralisé) de Fellegi et Holt. Ce paradigme dit: on devrait, pour que les données d'un enregistrement satisfassent à toutes les règles de vérification, modifier un minimum nombre (pesé) des valeurs. Il peut exister plusieurs des solutions optimales du problème de localisation des erreurs pour un enregistrement. Au contraire de comme il est d'usage en litérature spécialisée, la plupart d'algorithmes que nous décrivons avoir pour but de déterminer tous les solutions optimales au lieu de seulement une solution optimale. Les algorithmes criés sont principalement appropriés aux statistiques sur les entreprises et moins aux statistiques sociales, parce que données numériques surtout se rencontrent dans des statistiques sur les entreprises. Pour quatre algorithmes nous présentons les temps de calcul pour six ensembles des données réalistes. Nous comparons les algorithmes présentés en fait de temps de calcul aussi bien la complexité des algorithmes." @default.
- W2094252110 created "2016-06-24" @default.
- W2094252110 creator A5034634285 @default.
- W2094252110 creator A5082274735 @default.
- W2094252110 date "2007-01-15" @default.
- W2094252110 modified "2023-09-23" @default.
- W2094252110 title "Automatic Editing for Business Surveys: An Assessment of Selected Algorithms" @default.
- W2094252110 cites W150927061 @default.
- W2094252110 cites W1558597256 @default.
- W2094252110 cites W1580433007 @default.
- W2094252110 cites W1984036613 @default.
- W2094252110 cites W1988177629 @default.
- W2094252110 cites W1996533950 @default.
- W2094252110 cites W1998274367 @default.
- W2094252110 cites W2008332864 @default.
- W2094252110 cites W2019395846 @default.
- W2094252110 cites W2021132048 @default.
- W2094252110 cites W2021971311 @default.
- W2094252110 cites W2026001361 @default.
- W2094252110 cites W2035780691 @default.
- W2094252110 cites W2040426136 @default.
- W2094252110 cites W2041273463 @default.
- W2094252110 cites W2044022210 @default.
- W2094252110 cites W2054256426 @default.
- W2094252110 cites W2069723216 @default.
- W2094252110 cites W2071567505 @default.
- W2094252110 cites W2079959171 @default.
- W2094252110 cites W2081041113 @default.
- W2094252110 cites W2081438120 @default.
- W2094252110 cites W2090768248 @default.
- W2094252110 cites W2094213299 @default.
- W2094252110 cites W2094949033 @default.
- W2094252110 cites W2151882889 @default.
- W2094252110 cites W2480680997 @default.
- W2094252110 cites W2498631646 @default.
- W2094252110 cites W2505968561 @default.
- W2094252110 cites W3022177319 @default.
- W2094252110 cites W4300187280 @default.
- W2094252110 cites W27269047 @default.
- W2094252110 doi "https://doi.org/10.1111/j.1751-5823.2005.tb00252.x" @default.
- W2094252110 hasPublicationYear "2007" @default.
- W2094252110 type Work @default.
- W2094252110 sameAs 2094252110 @default.
- W2094252110 citedByCount "17" @default.
- W2094252110 countsByYear W20942521102012 @default.
- W2094252110 countsByYear W20942521102013 @default.
- W2094252110 countsByYear W20942521102014 @default.
- W2094252110 countsByYear W20942521102015 @default.
- W2094252110 countsByYear W20942521102018 @default.
- W2094252110 countsByYear W20942521102019 @default.
- W2094252110 crossrefType "journal-article" @default.
- W2094252110 hasAuthorship W2094252110A5034634285 @default.
- W2094252110 hasAuthorship W2094252110A5082274735 @default.
- W2094252110 hasConcept C11413529 @default.
- W2094252110 hasConcept C124101348 @default.
- W2094252110 hasConcept C144133560 @default.
- W2094252110 hasConcept C162324750 @default.
- W2094252110 hasConcept C162853370 @default.
- W2094252110 hasConcept C174998907 @default.
- W2094252110 hasConcept C187736073 @default.
- W2094252110 hasConcept C199360897 @default.
- W2094252110 hasConcept C23123220 @default.
- W2094252110 hasConcept C2522767166 @default.
- W2094252110 hasConcept C2778029271 @default.
- W2094252110 hasConcept C2780451532 @default.
- W2094252110 hasConcept C41008148 @default.
- W2094252110 hasConcept C85345410 @default.
- W2094252110 hasConcept C98045186 @default.
- W2094252110 hasConceptScore W2094252110C11413529 @default.
- W2094252110 hasConceptScore W2094252110C124101348 @default.
- W2094252110 hasConceptScore W2094252110C144133560 @default.
- W2094252110 hasConceptScore W2094252110C162324750 @default.
- W2094252110 hasConceptScore W2094252110C162853370 @default.
- W2094252110 hasConceptScore W2094252110C174998907 @default.
- W2094252110 hasConceptScore W2094252110C187736073 @default.
- W2094252110 hasConceptScore W2094252110C199360897 @default.
- W2094252110 hasConceptScore W2094252110C23123220 @default.
- W2094252110 hasConceptScore W2094252110C2522767166 @default.
- W2094252110 hasConceptScore W2094252110C2778029271 @default.
- W2094252110 hasConceptScore W2094252110C2780451532 @default.
- W2094252110 hasConceptScore W2094252110C41008148 @default.
- W2094252110 hasConceptScore W2094252110C85345410 @default.
- W2094252110 hasConceptScore W2094252110C98045186 @default.
- W2094252110 hasIssue "1" @default.
- W2094252110 hasLocation W20942521101 @default.
- W2094252110 hasOpenAccess W2094252110 @default.
- W2094252110 hasPrimaryLocation W20942521101 @default.
- W2094252110 hasRelatedWork W1824754501 @default.
- W2094252110 hasRelatedWork W2081647779 @default.
- W2094252110 hasRelatedWork W2086064646 @default.
- W2094252110 hasRelatedWork W2115485936 @default.
- W2094252110 hasRelatedWork W2119135658 @default.
- W2094252110 hasRelatedWork W2352495365 @default.
- W2094252110 hasRelatedWork W2357241418 @default.
- W2094252110 hasRelatedWork W3175930837 @default.
- W2094252110 hasRelatedWork W632952682 @default.
- W2094252110 hasRelatedWork W790934358 @default.
- W2094252110 hasVolume "73" @default.