
The impact of censored data on determining the number of soil samples required in site characterization

Niloofar Shoari, Jean-Sébastien Dubé

In the proceedings of: GeoMontréal 2013: 66th Canadian Geotechnical Conference; 11th joint with IAH-CNC

Session: Contaminated Sites and Remediation I

ABSTRACT: A challenge in statistical analysis of concentration data is the handling of left-censored data containing concentrations reported below an analytical reporting limit (RL). The common practice for handling such data has been to substitute the censored values with a constant (e.g., 0.5*RL), ignoring the fact that the true concentration is unknown. A simulation study was carried out to assess the performance of maximum likelihood estimation (MLE), regression on order statistics (ROS), and Kaplan-Meier methods in estimating the mean and standard deviation. Results showed that the ROS-based method performs well for estimating the mean and the MLE-based method had a better performance in estimating the standard deviation. Moreover, the degree of censoring and the original shape of distribution influenced the accuracy and precision of estimates. However the number of observations had a limited effect.

RÉSUMÉ: Un défi dans l'analyse statistique des données de concentration est le traitement des données tronquées à gauche contenant des concentrations rapportées sous la limite de détection analytique (RL). La pratique courante pour traiter ces données a été remplaçant les valeurs tronquées par une constante (par exemple, 0.5*RL), ignorant le fait que la concentration réelle est inconnue. Une étude de simulation a été effectuée pour évaluer la performance des méthodes du maximum de vraisemblance, de la régression sur les statistiques d'ordre, et la méthode de Kaplan-Meier pour estimer la moyenne et l'écart type. Les résultats ont montré que la méthode basée sur la régression sur les statistiques d'ordre performe bien pour estimer la moyenne et la méthode basée sur le maximum de vraisemblance a eu une meilleure performance pour l'estimation de l'écart type. Par ailleurs, le pourcentage de données tronquées et la forme originale de la distribution de données ont influencés et la précision des estimations mais le nombre d'observations a montré avoir un impact limité.

Access this article:
Canadian Geotechnical Society members can access to this article, along with all other Canadian Geotechnical Conference proceedings, in the Member Area. Conference proceedings are also available in many libraries.

Cite this article:
Niloofar Shoari; Jean-Sébastien Dubé (2013) The impact of censored data on determining the number of soil samples required in site characterization in GEO2013. Ottawa, Ontario: Canadian Geotechnical Society.

@article{GeoMon2013Paper468,author = Niloofar Shoari; Jean-Sébastien Dubé,title = The impact of censored data on determining the number of soil samples required in site characterization ,year = 2013}