연구대상
∙연구대상 선정 : 연구결과의 타당성을 결정짓는 요인
∙조사연구 : 표본이 모집단을 대표하는지 여부 -> 외적타당도 결정
∙실험연구 : 처치 전, 실험집단과 통제집단의 동일성 여부 –> 내적타당도 결정
모집단과 모집단분포
∙모집단 : 연구의 대상이 되는 전체
- 모집단의 속성변화와 현실적인 문제 등으로 표본을 추출하여 연구를 실시하게 됨.
∙모집단분포 : 모집단의 모든 구성원의 속성
- 평균𝜇(분포의 중심), 표준편차𝜎(흩어진 정도)로 표기 => 모수
표본과 표본분포
∙표본 : 모집단을 대표하여 추출된 일군의 대상(예. 견본, 샘플)
∙표본분포 : 모집단을 대표하는 표본을 추출하여 표본의 특성을 그린 그래프
- 평균Ŷ, 표준편차s => 추정치/통계치(표본 특성을 가지고 모집단의 특성을 유추하기 때문)
전수조사와 표본조사
1) 전수조사 : 모집단을 구성하는 모든 사람을 조사하여 자료 획득하는 방법
- 이론상 가장 이상적인 방법
- 실현가능성 : 전수조사를 실행할 수 있을 정도로 모집단의 수가 적은 경우
- 필요성 : 모집단 특성이 다양하여 표본 이용시 다양성을 파악하기 어려운 경우
- 모집단이 표본에 포함되지 않음으로써 발생할 수 있는 표집오차에 의한 비용이 클 경우
- 연구결과의 왜곡이 클 것이라 예상되는 경우
2) 표본조사
- 자료수집과정에서 발생할 수 있는 비표집오차에 의한 비용이 클 경우
비표집오차 : 조사자 경험부족, 응답자 실수, 자료 오기입 등 자료수집과정 중 생기는 오차
- 정확성을 요구하는 조사, 연구과정 중 제품이 손실되는 경우
- 연구대상에 대한 자세한 관찰을 필요로 하는 경우
구분 | 전수조사 | 표본조사 |
예산 | 많은 경우 | 적은 경우 |
허용시간 | 긴 경우 | 짧은 경우 |
모집단의 수 | 작은 경우 | 큰 경우 |
특성에 대한 분포 | 분산이 큰 경우 | 분산이 작은 경우 |
표집오차로 인한 비용 | 많은 경우 | 적은 경우 |
비표집오차로 인한 비용 | 적은 경우 | 많은 경우 |
연구대상의 손실 | 제품이 손실되지 않는 경우 | 제품이 손실되는 경우 |
연구대상에 대한 관찰 | 자세한 관찰 불필요 | 자세한 관찰 필요 |
표집과 표집분포
∙표집 : 모집단으로부터 표본을 추출하는 과정
∙표집단위 : 모집단으로부터 추출되는 표본의 단위
∙표집목록 : 표집단위의 목록, 표집틀
∙표집비율 : 모집단에서 표집된 비율, 모집단의 얼마만큼이 표집되었는가
∙표본크기 : 표본의 사례수
∙표집오차 : 표집하는 과정에서 발생하는 오차, 표본평균과 모집단 평균의 차이
(표본평균=모집단 평균 : 표집이 완벽하게 이루어짐 / 차이가 크면, 표집이 잘못됨)
∙표집분포 : 추리통계의 의사결정을 위한 이론적, 가상적 분포.
- 기각역과 채택역을 가지며, 중심극한정리의 특징을 가짐
(중심극한정리 : 표본의 수가 많으면 모집단의 실제분포와는 관계없이 표본평균의 분포가
정규분포를 따른다)
표집방법
1) 확률적 표집방법
모집단에 속하는 모든 사례들이 표본으로 뽑힐 확률을 객관적으로 파악할 수 있도록 설계
(1) 단순무선표집
① 정의
- 모집단의 모든 구성원들이 표본으로 추출될 확률이 같고, 하나의 구성원이 추출되는
사건이 다른 구성원이 추출되는데 영향을 주지 않는 독립적인 표집방법=단순무작위표집
- 특징 : 표본추출확률의 동일성, 독립성
② 복원추출과 비복원추출
- 복원추출 : 모집단으로부터 연구대상이 추출되더라도 다음 연구대상을 추출할 때 추출된 연구대상을 모집단에 포함시켜 다음 연구대상을 추출하는 방법, 추출될 확률 동일
- 비복원추출: 추출된 연구대상을 모집단에 돌려놓지 않고 연구대상을 표집하는 방법, 추출될 확률이 점차 증가
③ 방법 : 난수표, 제비뽑기
ⅰ) 모집단 선정, 모집단 전체의 수와 표본의 크기 선정
ⅱ) 모집단 구성원에 1번부터 N번까지 번호부여
ⅲ) 난수표의 한 지점 연구자 임의 선정
ⅳ) 그 지점에서 표집을 위한 난수를 추출
ⅴ) 다음 난수를 추출하기 위하여 이동한 방향 선정, 방향 상관없으나 일관성 유지
④ 장단점
- 장점 : 모집단에 대한 사전지식이 없을 때 간단히 사용
모집단의 층화에서 발생하는 오차 없음. 표집오차 계산이 용이
- 단점 : 표집틀이 없으면 표집이 불가능. 모집단이 층화되어 있을 시, 표집오차 발생
(2) 체계적 표집
① 정의
- 모집단의 표집목록에서 일정한 간격을 두고 연구대상을 추출하는 표집방법. k번째 1
- 표집목록에 일련번호 부여한 다음 한 번호를 선정하고 k번째를 뛰어넘어 표집하는 방법
② 방법 : k번째 1의 법칙이 적용
- 모집단에서 표본을 추출할 때 표본의 크기를 고려하여 모집단의 전체 대상이 표본에
추출될 수 있도록 k 설정한 후, 특정 일련번호를 추출하고 k번째마다 대상추출
③ 장단점
- 장점 : 쉽고 빠름
- 단점 : 모집단의 표집틀이 무선적으로 배열되어 있지 않을 경우 특정집단이 상대적으로 많이 추출되어 모집단을 대표하지 못함. 첫 번째 추출된 연구 대상으로부터 k번째 대상이 계속 표집되므로 표본추출이 비독립적
(3) 충화표집
① 정의
- 모집단 안에 이질성을 갖는 여러 개의 하부집단이 있다고 연구자가 가정할 때 모집단을 속성에 따라 계층으로 구분하고 각 계층에서 단순무선표집을 하는 방법
② 방법
- 정확한 자료에 의하여 모집단을 계층으로 분류하고 각 계층에서 필요한 표본수만큼의 표본을 추출
- 비율표집 : 모집단의 크기를 고려하여 모집단 일정 비율을 표본으로 표집하는 방법
- 비비율표집 : 각 하위집단에서 동일한 수로 표집을 하거나 임의적인 비율로 표본을 추출하는 방법. 모집단을 구성하고 있는 특정 하위집단의 구성비율이 너무 작거나 각 집단의 분포에 있어 차이가 심할 경우
③ 장단점
- 장점 : 층화에 대한 정보가 확실, 표집 정확하면 표본추정치의 정확성을 높일 수 있음
모집단의 모수치를 잘 대표할 수 있음.
계층으로 분류된 하부집단의 특성을 알 수 있음(계층간 집단비교가 가능
각 계층별 자료를 수집하는 것이 용이(각 계층에 표집틀이 있으면 표집 용이)
- 단점 : 계층 분류 정보 확실치 않으면 표집의 오류 때문에 표본의 속성이 모집단의 속성을 대표하지 못함
계층 간 표집틀이 정리되어 있지 않으면 많은 시간이 표집에 소모
☞ 계층간 정보가 확실하면 계층간 표집틀 만드는데 시간이 소모되더라도 층화표집이 모집단 속성을 대표할 수 있음(단, 계층에 대한 정보가 확실하지 않을 경우, 단순무선표집, 군집표집이 적당
(4) 군집표집(=집락표집, 덩어리표집)
① 정의
- 표집의 단위가 개인이나 개체가 아니라 집단(집단을 추출단위로 함)
- 군집 : 상호 이질적인 계층과는 달리 군집 간에는 동질성이 있음
② 방법
- 모집단을 군집으로 구분한 다음 무선표집에 의해 군집을 추출
- 표집틀 사용이 어려울 경우 연구대상이 되는 개체들로 구성된 집단을 표집단위로 추출
- 2단계 군집표집, 다단계 군집표집
③ 장단점
- 장점 : 표집목록 사용이 원활하지 않을 경우에도 실시 용이
표집단위가 집단이므로 쉽게 표본을 만들 수 있어서 시간과 경비 절감
모집단의 특성에 대한 사전지식이 없을 때에도 사용 가능
표집오차 계산이 용이
- 단점 : 군집표집에서 소수의 군집을 추출할 경우 표집오차가 클 수 있음
☞ 군집표집을 실시할 경우, 모집단을 대표하는 표본을 얻으려면, 정해진 표본사례 수에서 가급적 군집 크기를 줄이고, 군집 수를 늘리거나 다단계군집표집을 하는 것이 바람직
(5) 층화군집표집
층화표집 | 군집표집 | |
집단간(between) | 이질적 | 동질적 |
집단내(within) | 동질적 | 이질적 |
① 정의
- 모집단을 어떤 속성에 의하여 계층으로 구분한 후, 각 계층 내에서의 표집단위를 개인이 아니라 집단으로 표집하는 방법. 층화와 군집이 복합적으로 사용된 표집
② 방법
- 계층으로 분류, 모집단 속성에 따라 다단계로 층화 > 계층에 있는 집단을 군집으로 분류 > 각 계층으로부터 필요한 표본의 크기를 충족시킬 수 있는 만큼의 군집 추출
③ 장단점
- 장점 : 모집단을 대표하는 효율적인 표본추출 가능(모집단의 속성을 잘 알 때 실시)
- 단점 : 계층의 정보가 정확하지 않으면 표집오차가 크게 발생
표집에 드는 시간과 경비가 늘어남. 표집과정이 복잡함
(6) 행렬표집
- 피험자와 문항을 동시에 표집할 수 있는 표본추출방법, 교육평가에서 유용 활용
- 검사의 목적이 개인의 능력보다 특정 집단의 능력을 측정하고자 할 때 적합한 방법
- 가로축 : 문항, 세로축 : 피험자 행렬로 표현. 이분적(정오답)/다분적 형태 자료에도 활용
- 일부의 피험자에게 일부의 문제만을 풀게 하는 방법, 많은 문항으로 이뤄진 검사에 유용
- 장점 : 피험자의 심리적 부담 감소, 시간, 비용 절약, 표본오차가 작음
- 단점 : 개인성적 산출에는 부적절(대체값 사용), 관리, 시행, 자료처리과정 복잡,
시간과 노력이 많이 듦.
2) 비확률적 표집방법 : 확률을 고려하지 않고, 연구자 주관적 판단으로 표본 추출하는 방법
(1) 목적표집(=유의표집, 판단표집, 의도적 표집)
- 연구의 목적을 위하여 연구자가 의도적으로 표집하는 것
- 연구문제나 연구목적 그리고 연구대상에 대한 정보에 기초하여 연구대상을 선정하는 방법
- 질적연구에서 많이 사용(역사연구, 인류학) : 고유한 연구목적○, 연구결과 일반화 ×므로
- 표집대상에 대해 구체적으로 알고 있어야, 논리적 사고 통한 연구대상 표집, 연구결과의
한계인식 연구결과의 적용범위 제한
(2) 편의표집 : 연구진행에 편리하게 표본을 선택하는 방법
① 지원자 표집
- 지원자 표본 : 연구의 목적에 동의하는 연구대상 집단
- 제한점 : 연구결과의 일반화 어려움
- 의학, 생리학, 약학, 체육학 등
- 표집오차 : 연구대상 중 지원자의 비율로 표기
연구 본래 목적이 지원자에 의해 연구실시-지원자 표본이 높을수록 표준오차 줄어듦
② 우연적 표집
- 어떤 특별한 표집계획, 목적없이 조사자 임의대로 손쉽게 구할 수 있는 대상들 중 표집
- 모집단에 대한 대표성을 고려하지 않아 가급적 사용 지양
(3) 할당표집
- 비화률적 표집 중 가장 정교한 표집. 사회과학에서 많이 사용
- 선택하고자 하는 표본의 집단별 분포를 미리 알고, 그에 맞추어 각 집단 내에서 할당된 수만큼의 표본을 추출하는 방법
- 각 집단의 상대적 중요도, 집단에 속하는 구성원들의 다양성, 각 집단의 규모 등 고려
- 각 집단의 표본 수는 30이상이 바람직
- 모집단을 여러 개의 하위집단으로 구분하여 표집 : 층화표집과 유사
연구자의 주관적인 판단으로 표본을 구성 : 편의표집, 목적표집과 유사
- 절차
① 연구주제와 관련된 통제변수의 특성에 따라 모집단을 몇 개의 하위집단으로 나눔
② 각 하위집단에 대한 표본의 수를 나타내는 할당량을 연구자의 판단하에 결정
③ 결정된 만큼의 할당량을 채우되, 각 하위집단에 대한 표집방법을 자유롭게 선택
- 장점 : 적용이 쉽고, (편의표집, 목적표집보다) 모집단의 대표성이 좋음(하위집단의 정의와 비율에 대한 명확한 자료를 기초로 적절한 표본 수를 할당한다면)
- 단점 : 너무 많은 하위집단으로 구성될 경우, 편의성을 잃음
모집단 특성을 나타내는 변수를 통제변수로 하위집단으로 구분하지 못하는 경우, 편향된 표본집단의 문제 초래
(4) 스노우볼표집(=연쇄표집, 누증표집)
- 눈덩이를 굴리는 것과 같이 최초의 작은 표본을 선택한 후 소개의 소개를 받아 원하는 표본 수를 얻을 때까지 계속적으로 표본을 확대해 가는 방법
- 장점 : 목표집단 해당하는 연구대상을 찾기 어려울 때 원하는 모집단 쉽게 찾을 수 있음
- 단점 : 표본의 추출을 통제할 수 없음. 추천에 의해 선정된 표본이 편향될 가능성 있음
※ 비확률적 표집방법
- 장점 : 연구자가 표집과정에서 자유로움과 유연성을 가질 수 있음
- 단점 : 연구자의 주관적 판단 하에 표본 선택 > 편향된 표본 선정
통계적 추정 통하여 얻은 결과의 정확성이 떨어지므로, 연구결과의 일반화 주의필요
3) 무선할당
(1) 정의
- 모집단 전체에서 연구대상을 추출하기가 어려운 경우 모집단의 일부를 추출하여 대상설정
>> 확률화
- 기존집단 : 모집단에서 연구대상 전체를 무선으로 표집하는 것이 붋가능하므로 모집단의 일부를 선택한 집단
(2) 방법 : 연구대상의 모집단 설정 > 모집단을 대표하는 기존집단 선정
① 단순무선표집
- 기존집단의 구성원들에 대한 표집틀 작성
> 피험자들을 통제집단과 실험집단에 단순무선표집으로 할당
>> 확률적으로 집단 간의 유사성이 보장된다고 가정하기 때문
② 대응집단
- 모집단으로부터 선정된 기존집단 구성원들의 특성을 분석하여 각 집단 균등히 할당
> 어떤 속성을 측정하는 검사 실시, 주어진 사전정보에 의해 피험자들에게 서열부여하고
지그재그로 피험자들을 각 집단에 할당
>> 동일한 피험자들이 각 집단에 고르게 할당되어 각 집단의 동일성 보장
③ 균형집단
- 모집단으로부터 선정된 기존집단을 구성원의 특성에 따라 각 집단에 할당하는 것이
아니라 유사집단들을 실험연구의 각 집단에 배정하는 방법
▶ 무선할당방법을 구체화(대응집단, 균형집단)하는 이유
- 실험 전 각 집단의 초기단계를 같게 하기 위해
- 초기단계가 같아야 연구결과 사후비교의 타당성이 보장되기 때문
▶ 처치변수 이외의 변수 통제방법(실험설계에 의한 매개변수 통제) : 대응집단, 균형집단
▶ 매개변수의 영향을 제거하기 위한 통계적 방법 : 공분산분석
표본의 크기
연구에 소요되는 경비, 시간, 노력 등의 현실적 요인과 변수 측정의 신뢰도, 자료분석 방법, 모집단의 분산, 허용오차 범위 등의 통계적 요인을 종합적으로 고려하여 표본 크기 결정
* 대규모 표본이 요구되는 경우
① 연구결과에 영향을 미칠 수 있는 주요 매개변수들을 모두 통제하지 못할 경우
② 효과크기가 작을 것으로 예상되지만 가급저거 그 효과를 검증하고자 할 때
③ 연구대상을 여러 개의 하위집단으로 분류하여 하위집단들을 서로 비교하고자 할 경우
④ 중도탈락률이 높을 것으로 예상될 때
⑤ 높은 수준의 통계적 유의성과 통계적 검증력이 요구될 때
⑥ 모집단을 구성하고 있는 사례들이 매우 이질적일 때
⑦ 측정도구의 신뢰도가 낮을 경우
∙ 신뢰수준 : 표본에서 구한 통계치를 가지고 모수치가 존재할 범위, 즉 신뢰구간을 추정할 때 해당 추정값이 실제 모집단의 모수를 포함하고 있을 가능성. 모수추정의 정확성을 확률로 표현한 개념
∙ 최대허용오차 : 연구자가 허용할 수 있는 오차의 한계
< 적절한 표본크기를 결정하는 방법 >
1) 모집단 평균 추정시
(1) 유한모집단일 경우
(2) 무한모집단일 경우
- Z값 : 99%신뢰수준 ±2.58 / 95%신뢰수준 ±1.96(사회과학) / 90%신뢰수준 ±1.645
- σ = (최대값-최소값)/6
2) 모집단 비율 추정시
- 기존연구 조사 > 모집단 비율에 대한 표준편차 추측, 사전조사 > 표준편차 추정값 계산
(1) 유한모집단일 경우
(2) 무한모집단일 경우
- 단점
① 한 개의 변수만을 고려한 방법이므로 그 이상의 변수들이 연구의 관심이 될 경우
적용하는데 어려움
>> 가장 중요한 변수 선정 or 표준편차가 클 것으로 예상되는 변수선정하여 표본 수 결정
② 모집단이 특정 집단으로 제한되어 있을 경우 적용하기 어려움
>> 교정표본크기 n/I을 사용(n은 계획된 표본수, I는 해당집단의 모집단에 대한 구성비율)
확률적표집방법 | 단순무선 표집 |
모집단 내의 모든 사람들이 동등하고 독립적인 선발기회를 가짐. 표본은 우연적으로, 즉 난수표, 컴퓨터를 통해 생성된 난수를 활용하여 추출됨. |
체계적 표집 |
표본의 수에 따라, 모집단 내의 k번째 사람을 표본으로 선정. 무선적으로 나열된 모집단 목록이 있을 때만 가능. | |
층화표집 | 모집단 내의 하위집단(층)을 알 수 있을 때 사용. 선발은 일반적으로 각 층 내에서 무선적으로 이루어짐. | |
군집표집 | 모집단 내에 있는 기존의 집단이 표집단위로 선정된 경우. 집단이 표집단위이기 때문에 비교적 많은 집단이 표집되어야 함. | |
층화군집 표집 |
층화표집방법과 군집표집방법을 통합한 것. 성별이나 학교유형 등으로 계층으로 구분한 다음 학교 혹은 학급을 무선으로 표집하는 방법 | |
비율표집 | 표본 내의 각 하위집단별 비율이 모집단 내의 하위집단별 비율과 동일하도록 표집하는 방법 | |
비비율 표집 |
모집단 내의 비율에 상관없이, 표본에 각 하위집단별로 동수의 사람들이 포함된 경우. 결과는 모집단 전체보다는 하위모집단에 일반화될 수 있음. 주로 소수집단의 비율이 단순무선표집을 적용할 경우 대표적 표본을 얻을 수 있을 정도로 충분히 크지 않을 때 활용 | |
비확률적표집방법 | 목적표집 | 무선표집 대신에 구체적인 연구문제, 연구목적, 연구대상에 대한 가용한 정보에 기초하여 표집하는 방법 |
편의표집 | 연구목적, 연구문제에 대한 적합성보다는 자료수집의 가용성과 용이성에 기초하여 표집이 이루어지는 방법 전속표본(학급 내의 학생처럼 연구자가 쉽게 접근 가능한 표본), 지원자표본, 우연적 표본 포함 |
|
할당표집 층화비무선 |
층화표집과 유사하지만, 비무선적이면서도 의도적인 편의표집의 방식을 취함. 모집단의 하위집단별로 비무선적인 방법을 사용하여 표본(자원자, 가용한 사람)이 선정. = 할당표집 | |
스노우볼 연쇄표집 |
선발된 표본의 구성원이나 개개인으로부터 획득한 정보에 기초하여 표본을 추가해 가는 방법, 새로 선발된 각 개인이 다른 하나 이상의 사례에 대하나 정보를 제공하는 잠재력을 갖고 있기 때문에, 연구가 진행됨에 따라 표본도 계속 커짐. |