敏感性问题调查中有关两总体比较的研究.docx

上传人:h**** 文档编号:1385404 上传时间:2019-02-23 格式:DOCX 页数:3 大小:17.39KB
下载 相关 举报
敏感性问题调查中有关两总体比较的研究.docx_第1页
第1页 / 共3页
敏感性问题调查中有关两总体比较的研究.docx_第2页
第2页 / 共3页
敏感性问题调查中有关两总体比较的研究.docx_第3页
第3页 / 共3页
亲,该文档总共3页,全部预览完了,如果喜欢就下载吧!
资源描述

1、敏感性问题调查中有关两总体比较的研究摘 要 本文对 NNRT 中的两个主要模型进行了介绍,并对敏感性问题中有关两个总体比较的方法进行了初步的探索。通过假设检验的方法结合之前有关 NNRT 中平行模型的结论,进行了基于平行模型的两总体比较,计算出了置信区间和拒绝域。 下载 关键词 敏感性问题调查 非随机化回答技术 三角模型 平行模型 假设检验 中图分类号:O221 文献标识码:A 一、引言 在社会中进行统计调查研究的时候经常会涉及到一些隐私或者不便公开的问题的调查,例如是否有过偷税漏税的行为、是否有过吸毒经历、是否有过受贿行贿行为、是否有过作弊行为等等,我们称这些问题为敏感性问题。对于这些敏感性

2、问题的调查,如果采用直接调查法会让被调查者感到难堪并产生抵触心理,从而不配合调查或者给出与实际不符的错误答案。无法获得真实有效的统计数据,对这些社会问题进行分析研究就无从提起。因此很多学者开展了对于敏感性问题调查方法的研究,并提出了一些有效的调查方法来提高对被调查者的保护性,从而提高统计数据的真实性。 当前对于敏感性问题的调查技术大致有三类:随机化回答技术(Randomized Response Technique-RRT)、非匹配计数技术(UnmatchedCount Technique-UCT)和非随机化回答技术(Non-Randomized ResponseTechnique-NRRT)

3、。其中最著名的当属 1965 年Warner 提出的随机化回答模型,该模型中通过随机化装置保护了被调查者的隐私,后来随机化回答技术中的很多模型都是以此为基础提出改进的。由田国梁等学者于 2007 年提出的 NRRT 是一种较新的方法,该方法摆脱了随机化装置,从而可以通过问卷形式获得调查数据,方便快捷。同时该方法具有可重复性,便于对调查过程进行反向检验。对于被调查者而言,这种方法更直观,也能让其心理上获得更高的安全感,促使他们给出最真实的答案。 本文的主要研究内容是基于非随机化回答模型的对于敏感性问题调查中有关两总体比较的研究。以往对于敏感性问题调查的研究大部分是集中于调查方法的设计,以及对于一

4、个总体的研究,很少对两个总体进行比较研究。对于一个敏感性问题,我们有时需要进行多个总体的比较,比如对比两个不同时期有吸毒行为的人群比例,通过比较得出吸毒人群比例的变化从而方便相关部门了解情况制定计划。 二、模型介绍 (一)三角模型。 为了估计对于敏感性问题具有敏感性特征的个体比重 ,在三角模型中引入了两个不相关的问题。一个是敏感性问题 Y,比如是否有过吸毒行为,当有过吸毒行为时 Y=1,反之 Y=0,此时 =PY=1。另一个是非敏感性问题W,比如生日是否在 1-3 月之间,当生日在 1-3 月之间时 W=1,反之 W=0。对于非敏感性问题我们要求符合两个假设条件:(1)非敏感性问题与敏感性问题

5、之间彼此独立,(2)对于非敏感性问题具有非敏感性特征的个体比重 p 已知,即 p=PW=1 已知。在三角模型中被调查者要求回答以下表格的左部分: 被调查者在回答问卷时,如果既没有敏感性特征,也没有非敏感性特征,比如既没有吸毒行为,生日也不在 1-3 月之间,则被调查者选择“”,反之选择“.”。当被调查者选择“”时,表明他不具有敏感性特征。相对的,即使他选择了“.”,由于“.”代表了三种情况,因而也无法以此判断被调查者是否具有敏感性特征,从而达到了保护隐私的作用,促使他们给出真实答案。 在表 1 中的右部分给出了发生每种情况所对应的概率,据此通过概率论与数理统计的知识就可以得到对于敏感性问题具有

6、敏感性特征的个体比重。设 表示所有被调查者选择“.”的概率,则 的无偏估计量=nN,其中 N 表示所有被调查者总体数,n 表示其中选择“.”的个体数,显然, (二)平行模型。 在三角模型中,对于敏感性问题 Y,当 Y 取 0 或 1 不同的两个值时,对于被调查者而言具有不同的敏感性。比如当 Y=0 时表明无吸毒行为,即无敏感性特征,反之当 Y=1 时表明有过吸毒行为,即有敏感性特征。然而,在某些敏感性问题调查中,当 Y 取 0 或 1 不同的两个值时,对于被调查者而言均为敏感性的,差异仅在于敏感度的大小,比如当 Y=0 时表明有过 0到 1 次吸毒行为,Y=1 时表示有过 1 次以上吸毒行为。

7、显然,对于被调查者而言,敏感性问题 Y 的两个不同的答案均具有一定的敏感性,为了保护他们的隐私,田国梁于 2011 年针对这种情况提出了平行模型。 平行模型在三角模型的基础上又加入了另外一个非敏感性问题 U,对于这个问题要求满足与三角模型中一样的两个假设,即:(1)该非敏感性问题与另外两个问题之间彼此独立,(2)对于该非敏感性问题具有非敏感性特征的个体比重 q 已知,即 q=PU=1 已知。在平行模型中被调查者要求回答以下表格的左部分: 调查者根据自己的实际情况来选择“”或者“.”,这两种不同的选择都分别包含两种情况,“”所代表的两种情况均为非敏感性特征,“.”所代表的两种情况既包含了敏感性特

8、征也包含了非敏感型特征,所以同样对被调查者起到了保护隐私的作用。对于表 2 中标记的这四种情况,必有一种是符合被调查者情况的,且每种情况所对应的概率如表二右部分所示,显然, 三、基于平行模型的两总体假设检验 在此将进行基于平行模型的两总体假设检验,检验两总体中具有较高敏感性特征的个体比重是否相等。 四、小结 本文对 NNRT 中的两个主要模型进行了介绍,并对敏感性问题中有关两个总体比较的方法进行了初步探索。通过假设检验的方法结合之前有关NNRT 中平行模型的结论,进行了基于平行模型的两总体比较,计算出了置信区间和拒绝域。 (作者:首都经济贸易大学统计学院研究生,研究方向:应用数理统计)参考文献: Tian, G.L., Yu, J.W., Tang, M.L., and Geng,Z. (2007). A new non-randomized model for analyzing sensitive questions with binaryoutcoL. (2011). A new non-randomized response model: the parallel moctuarial Science, The University of Hong K 盛骤,谢世千,潘承毅.概率论与数理统计(第三版).高等教育出版社,2001.

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 学术论文资料库 >

Copyright © 2018-2021 Wenke99.com All rights reserved

工信部备案号浙ICP备20026746号-2  

公安局备案号:浙公网安备33038302330469号

本站为C2C交文档易平台,即用户上传的文档直接卖给下载用户,本站只是网络服务中间平台,所有原创文档下载所得归上传人所有,若您发现上传作品侵犯了您的权利,请立刻联系网站客服并提供证据,平台将在3个工作日内予以改正。