1
BIOSTATIC &
EPIDEMIOLOGY
2
By M.H.DAVARI M.D
Surveillance
Health care
providers
Investigation
Feedback
3
‫‪ ‬امروزه برای مطالعه پژوهشهایی که در زمینه پزشکی انجام می شوند‪،‬‬
‫دانستن اطالعات آماری و اپیدمیولوژیک ضروری است‪.‬‬
‫‪ ‬به خصوص در حیطه طب کار و بیماری های شغلی که بسیاری از یافته‬
‫ها بر اساس بررسی های اپیدمیولوژیک بر روی افراد دارای مواجهات‬
‫بسیار اندک با مواد خاص‪ ،‬بدست می آید‪.‬‬
‫‪4‬‬
(DATA ,VARIABLE)‫متغیر‬
‫ مشخصه یک فرد و یا پدیده ای که قابل اندازه گیری است و می تواند‬
.‫مقادیر مختلفی را بپذیرد‬
:Quantitative ‫ کمی‬.1
Discrete
Continuous
Interval 
Ratio 
:Qualitative ‫کیفی‬
Nominal
Ordinal
.2


5
‫‪ QUANTITATIVE‬کمی‪:‬‬
‫‪‬‬
‫فاصله ای ‪:Interval‬‬
‫مثال درجه حرارت ‪ ،‬تاریخ تقویمی‬
‫مبدا قراردادی است‬
‫صفر به معنی نبودن خاصیت مورد نظر نیست و با عوض شدن مقیاس‬
‫اندازه صفر دیگر برابر صفر نیست‬
‫‪ ‬نسبی ‪:Ratio‬‬
‫‪ ‬مثال‪ :‬وزن ‪ ،‬سرعت‪ ،‬میزان ‪FVC‬‬
‫صفر به معنی نبودن است‬
‫‪6‬‬
‫‪ QUANTITATIVE‬کمی‪:‬‬
‫گسسته )‪:(Discrete‬‬
‫تعداد کارگران‪ ،‬تعداد مشاغل موجود در یک کارخانه‬
‫پیوسته )‪:(Continuous‬‬
‫قد‪ ،‬وزن‪ ،‬سطح سرب خون‪ ،‬میزان ‪ ،FEV1‬سابقه کار‬
‫‪7‬‬
‫‪ QUALITATIVE‬کیفی‪:‬‬
‫‪:Nominal ‬‬
‫برتری در کار نیست‬
‫مثال‪ :‬سن‪ ،‬جنس‪ ،‬نژاد‪ ،‬گروه خونی‪ ،‬شغل‬
‫‪:Ordinal ‬‬
‫بین گروهها از نظر متغیر مورد نظر برتری وجود دارد‬
‫مثال‪ :‬شدت بیماری )‪ ، (NIHL‬نمرات علمی دستیاران‪ILO ،‬‬
‫‪ ،Socioeconomic status ،classification‬شدت‬
‫‪ obstruction‬در اسپیرومتری‬
‫‪8‬‬
‫‪ ‬برای آنالیز اطالعات ‪ 2‬مرحله باید طی شود‪:‬‬
‫‪ ‬مرحله اول‪ :‬توصیف و خالصه سازی اطالعات بوسیله آمار توصیفی‬
‫(میانگین‪ ،‬میانه‪ ،‬واریانس و انحراف معیار)‬
‫‪ ‬مرحله دوم‪ :‬آزمایش فرضیه های خاصی که قبل از اجرای پژوهش تعیین‬
‫شده اند‬
‫‪9‬‬
‫خالصه سازی اطالعات بوسیله آمار توصیفی‬
‫‪.1‬‬
‫‪10‬‬
‫شاخص های مرکزی‪:‬‬
‫‪(Mean ‬میانگین)‪:‬‬
‫میانگین حسابی کل داده ها است‬
‫به شدت تحت تاثیر ‪ extreme data‬قرار میگیرند‬
‫‪(Median ‬میانه)‪:‬‬
‫داده میانی اطالعات است به طوری که نیمی از داده ها در باالی آن و نیمی دیگر در‬
‫زیر آن قرار دارند‬
‫در صورت وجود ‪ extreme data‬میانه نسبت به میانگین شاخص مرکزی بهتری‬
‫است‬
‫‪:Mode ‬‬
‫پر تکرار ترین داده در میان کل داده ها‬
‫در پزشکی کاربرد چندانی ندارد‬
7 7
7 77
7
8
7 77
6
7
3
2
7 8
13
9
Mean = 7
SD=0
Mean = 7
SD=0.63
Mean = 7
SD=4.04
11
‫شاخص های پراکندگی‪:‬‬
‫‪.2‬‬
‫‪(Range‬دامنه)‬
‫‪‬‬
‫‪‬‬
‫‪(Variance‬پراش)‬
‫‪‬‬
‫‪‬‬
‫نشان دهنده پراکندگی داده ها نسبت به میانگین‬
‫‪‬‬
‫‪(Standard deviation‬انحراف معیار)‬
‫‪‬‬
‫‪( (Coefficient of Variations)CV‬ضریب تغییرات)‬
‫‪‬‬
‫‪12‬‬
‫اختالف بین بیشترین و کمترین داده‬
‫برای مقایسه پراکندگی ‪ 2‬صفت و یا یک صفت با ‪ 2‬واحد متفاوت‬
‫توزیع نرمال‬
‫‪ ‬منحنی پراکندگی بیشتر صفات در جمعیت عمومی تقریبا ً مشابه یک دیگر‬
‫است‬
‫‪ ‬زنگوله ای شکل و قرینه‬
‫‪ ‬نقش اصلی در آزمودن فرضیات‬
‫‪ ‬میانگین=میانه‬
‫‪ ‬میانگین و انحراف معیار‬
‫‪13‬‬
Frequency
95%
‫• میانگین‬
‫• انحراف معیار‬
69%
μ-2SD
μ-SD
μ
μ+SD
μ+2SD
14

B
A

B
A
Two normal
distributions with
identical means but
different standard
deviations
Two normal
distributions with
different means but
identical standard
deviations
15
‫آزمون فرضیه‬
‫‪‬‬
‫‪‬‬
‫تعیین نوع آزمون برای سنجش فرضیه باید قبل از جمع آوری داده ها صورت گیرد‪.‬‬
‫‪ Null hypothesis‬فرضیه خنثی)‪:(H0‬‬
‫هیچ اختالفی در پارامتر های ‪ PFT‬بین کارگران معادن زیر زمینی و کارگران معادن‬
‫روباز وجود ندارد‪( .‬اختالف دیده شده در نتایج به علت تفاوت های فردی طبیعی در‬
‫بین افراد جامعه است ونه به علت عامل خاص مد نظر ما)‬
‫‪‬‬
‫‪ Alternative hypothesis‬فرضیه مخالف )‪:(H1 or HA‬‬
‫پارامترهای ‪ PFT‬بین کارگران معادن زیر زمینی و کارگران معادن روبازمتفاوت‬
‫‪16‬‬
‫است‪.‬‬
17
‫‪P-VALUES‬‬
‫• احتمال اینکه رخ دادن واقعه فقط در اثر شانس باشد‬
‫• در مطالعات پزشکی معموالً سطح معناداری را ‪ %5‬در نظر می‬
‫گیریم وباید اختالف دیده شده از نظر آماری زیر ‪ %5‬یا ‪ 0/05‬باشد‬
‫• اگر ‪ P-Value‬بزرگتر و یا مساوی نقطه بحرانی ‪(cut-off‬‬
‫)‪ point‬باشد فرضیه صفر مورد قبول واقع می شود‪.‬‬
‫‪18‬‬
‫انواع خطا ها در آزمون‬
‫‪ ‬خطای نوع اول (‪:)α‬‬
‫غلط دانستن فرضیه ‪H0‬در حالی که درست است‪.‬‬
‫‪ ‬خطای نوع دوم (‪:)β‬‬
‫قبول فرضیه ‪H0‬در صورتی که این فرضیه غلط است‪.‬‬
‫‪1-Β‬یا توان آزمون‪ :‬احتمال رد شدن فرضیه صفر در حالی که غلط است‪.‬‬
‫‪19‬‬
‫‪ STANDARD ERROR‬خطای معیار‪:‬‬
‫‪ ‬برای آنکه مشخص کنیم میانگین بدست آمده از نمونه تا چه اندازه به‬
‫میانگین واقعی جامعه نزدیک است‬
‫‪=SE ‬جذر تعداد نمونه ها ‪ /‬انحراف معیار جامعه‬
‫‪ ‬مثال‪:‬‬
‫در یک مطالعه میانگین ‪FVC‬در‪ 100‬فرد عادی ‪ 4‬لیتر بدست آمده‪.‬با‬
‫فرض توزیع نرمال این پارامتردر سطح جامعه با انحراف معیار‪،1‬با‬
‫فاصله اطمینان ‪،%95‬حدود میانگین جامعه برابر؟؟؟؟؟؟؟؟؟؟‬
‫‪20‬‬
‫‪4+,-(2)0.1 = 4/2-3/8‬‬
‫‪SE = 1/√100 = 0.1‬‬
‫تحلیل بین ‪2‬‬
‫یا چند متغیر‬
‫دو یا چند‬
‫متغیر کیفی‬
‫‪Chi‬‬
‫‪Square‬‬
‫‪21‬‬
‫دو متغیر کمی‬
‫اختالف‪:‬‬
‫‪T test‬‬
‫ارتباط‪:‬‬
‫‪Pearson‬‬
‫چند گروه‬
‫متغیر کمی‬
‫‪ANOVA‬‬
‫‪1. CHI SQUARE‬‬
‫‪ ‬تعیین ارتباط بین ‪ 2‬یا چند متغیر کیفی در ‪ 2‬یا چند گروه‬
‫‪ ‬مثال‪:‬‬
‫‪ ‬تعیین ارتباط بین مواجهه با سیلیس (مواجهه دارد یا ندارد) و ابتال به‬
‫برونشیت مزمن (بیماری دارد و یا ندارد)‬
‫‪ ‬مواجهه با فلزات سنگین و ابتالء به کاهش شنوایی‬
‫‪ ‬مواجهه با ونیل کلراید و ابتال به آکرواستئولیزیس‬
‫در این موارد فرضیه صفر این است که هیچ رابطه ای بین متغییر های واقع‬
‫در ستون با متغییر های واقع در سطر وجود ندارد‬
‫‪22‬‬
‫‪2. PEARSON CORRELATION :‬‬
‫‪‬‬
‫تعیین ارتباط بین ‪ 2‬متغیر کمی‬
‫تعیین ارتباط بین سطح کادمیوم شیر‬
‫مادر و کادمیوم سرم نوزاد‬
‫تعیین ارتباط بین میزان سرب موجود‬
‫در هوا و سطح سرب خون کارگر‬
‫‪‬‬
‫ضریب‪:1+‬نشاندهنده همبستگی کامل‬
‫و مستقیم‬
‫ضریب‪:1-‬نشاندهنده همبستگی کامل‬
‫و معکوس‬
‫‪ :0‬ناهمبسته بودن دو صفت (از نظر‬
‫خطی)‬
‫‪:-1_+1‬همبستگی ناقص‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪‬‬
‫‪23‬‬
‫‪‬‬
‫‪T-TEST‬‬
‫‪3.‬‬
‫‪ ‬مقایسه ‪ 2‬میانگین وقتی که انحراف معیار جامعه مشخص نباشد‬
‫‪ ‬مقایسه میانگین در ‪ 2‬گروه از داده های کمی ‪continuous‬‬
‫‪ ‬مثال‪:‬‬
‫‪ ‬تعیین تاثیر مواجهه با حالل های ارگانیک بر زمان واکنش‬
‫دهی )‪ (reaction time‬در افراد مواجهه یافته و مواجهه نیافته‬
‫‪ ‬تعیین تاثیر مواجهه با دی ایزوسیانات ها وتغییرات ‪FEV1‬در افراد‬
‫مواجهه یافته و نیافته‬
‫‪24‬‬
‫‪4. PAIRED T-TEST‬‬
‫‪ ‬مقایسه میانگین ‪2‬جامعه‬
‫‪ ‬مقایسه میانگین در ‪ 2‬گروه از داده های ‪continuous‬‬
‫‪ ‬مثال‪:‬‬
‫‪ ‬اندازه گیری ‪ FEV1‬قبل و بعد از نوبت کاری‬
‫‪ ‬اندازه گیری فشار خون قبل و بعد از نوبت کاری‬
‫‪ ‬اندازه گیری فشار خون قبل و بعد از مصرف دارو‬
‫‪25‬‬
‫‪ ‬اندازه گیری فشار خون قبل و بعد از مواجهه با صوت‬
‫‪5.ANALYSIS OF VARIANCE‬‬
‫)‪(ANOVA‬‬
‫‪ ‬مقایسه میانگین بیش از ‪ 2‬گروه‬
‫‪ ‬مقایسه میانگین درگروههای از داده های ‪continuous‬‬
‫‪ ‬مقایسه میانگین ‪ FEV1‬در کارگران مواجهه یافته با ‪ 3‬نوع گاز مختلف‬
‫‪ ‬مقایسه آستانه شنوایی در ‪ 3‬روش ‪PTA, High tone PTA,‬‬
‫‪DPOAE‬‬
‫‪26‬‬
27
‫انواع مطالعات اپیدمیولوژیک‬
Observational
Descriptive

Analytic
Experimental
Clinical trial
Field trial
Descriptive study: The First step in epidemiologic
studies
28
Descriptive
study
Analytic
study
Cross
sectional
Case-control
Ecologic
Cohort
29
CROSS SECTIONAL STUDIES
Example
Advantages:

Hypothesis generation

Estimate overall and specific disease prevalence

Estimate exposure proportions in the population

Easy, Quick and Inexpensive

Best suited to studying permanent factors (race, sex,
blood-type, number of workers)
30
Disadvantages:
 Impractical
 Not
for rare diseases
a useful type of study for establishing
causal relationships
 Confounding
is difficult to control
31
COHORT STUDIES

In a cohort study, subjects with an exposure to a
causal factor are identified and the incidence of a
disease over time (or prospectively) is compared
with that of controls (persons who do not have
the exposure) to determine whether disease
occurs at a rate different from that in a cohort
without the exposure.
32
33
34
35
MEASURES OF ASSOCIATION IN A
COHORT STUDY

1.Relative risk:
+ ‫بیماری در افراد با مواجهه‬
----------------------------+‫خطر بیماری در مواجهه‬
+ ‫کل افراد مواجهه‬
------------------------ = ------------------------------------------- ‫خطر بیماری در مواجهه‬
- ‫بیماری در افراد مواجهه‬
---------------------------- ‫کل افراد مواجهه‬

An RR greater than 1 implies a positive
association of the disease with the exposure of
36
2.Attributable risk (fraction):

is the rate in the exposed population minus the
rate in the non exposed population

it helps give an idea about the amount of disease
that could be avoided by reducing risk factors in
individuals
37

3. Population attributable risk percentage:

is the proportion of a disease in a population
related to (or "attributable to") a given exposure.

important for public health policy and
planning, that is, in estimating what percent of
cases in a population could be eliminated by
removing an exposure
38

Advantages:

Allows study of rare exposures (In radiation
related cancers(

Lower potential for bias than a case-control
study - no recall and selection bias

Results are considered more conclusive than
results from case-control studies
39

Disadvantage

Larger sample size than case-control

Impractical for rare diseases - even if risk is
high, no cases may occur or results

Data collection is usually very expensive

Long time commitment for follow-up
40
CASE CONTROL STUDY

The case-control study is always retrospective.
The investigator starts by identifying diseased
and non diseased individuals and looks backward
for the presence or absence of exposures in these
individuals

In occupational epidemiology : to evaluate
multiple exposures associated with a single
outcome
41
42

For example, to study the relationship between
asbestos exposure and mesothelioma, a case-control
study would compare the history of asbestos
exposure in a group of mesothelioma patients with
the history of asbestos exposure in a group of
subjects who do not have mesothelioma.
43

Advantage:

Good for rare disease

Inexpensive

Possibility of exploring of multiple exposures

Requires relatively little time to conduct
44
Disadvantage:
 Bias (recall, selection)
 Temporary can be difficult to establish
 Can’t calculate incidence, relative risk or
attributable risk

45
ANALYSIS OF CASE-CONTROL STUDIES

Odd ratio:
An estimate of Relative Risk
(a)Number of Patients in exposure+
---------------------------------------------(b)Number of Patients in exposure------------------------------------------------------------- = ad / bc = Odd Ratio
(c)Number of Not patients in exposure+
--------------------------------------------------(d) Number of Not Patients in exposure-
46
CLINICAL TRIAL

The experimental study is the type of design most
familiar to clinical investigators, but it is rarely
encountered in occupational epidemiology.

Same disease and different treatment

Example:

men with asbestos exposure, who are at increased risk of
lung cancer, were randomly assigned to receive beta-
carotene or a placebo. The study was undertaken to
determine whether beta-carotene decreases the risk of
developing lung cancer
47

Men aged 45 years and older with a history of
heavy cigarette smoking were assigned to a
dual-screened group receiving chest radiographs
and sputum cytologic testing or to a group
receiving only chest radiographs. The objective
was to determine whether the addition of sputum
cytologic testing to regular chest radiography
resulted in earlier detection and improved lung
cancer survival
48
49
50
WHAT TYPE OF STUDY TO CHOSE DEPENDS
ON:

what is the research question

Time available for study

Resources available for the study

Common/rare disease or production problem

Type of outcome of interest
51
SELECTION OF CASES
Sampling
Simple
Random
Systematic
Random
Paired
52

In random sampling, each
member of the source group has
an equal chance of being
represented in the control group.

For example, all individuals
might be assigned a number, and
the sample would be selected
using a table of random
numbers
53

In systematic sampling, the source group for
controls is assumed to have an ordered sequence,
and every nth individual is selected. As long as
the sequence of the source group is not related to
an important study variable (e.g., age), the
resulting characteristics of a systematic sample
are similar to those of a random sample

In paired sampling, one or several controls are
selected for each case based on a predefined
relationship to the case
54
Errors
Systematic
(bias)
Random
Selection
Information
Confounding
B.
B.
B.
55

Selection Bias:
case group: in patient population
control patient: out patient population


Information Bias:
1.
Recall Bias
2.
Interviewer Bias
3.
Misclassification
Confounding bias:
cigarette smoking in a study of an occupational
exposure (asbestose) and lung cancer
56
57
58