Uploaded by sarah20042

Chapter4

advertisement
STATISTICAL METHODS IN
EXPOSURE ASSESSMENT
魏君軒、吳欣謙、吳培瑜
4.1
Introduction
1
4.1 Introduction
Selection of study design.
Determination of the amount and form of data to collect.
Basic characteristics of exposure and its determinants.
Selected applications of descriptive.
Inferential statistics in exposure assessment studies.
Malta and Mexico (WHO, 1985): Illustrate some key statistical
concepts and methods; Blood lead concentrations were
considered to be an indicator of lead uptake from all exposure
routes, whereas faeces lead concentrations were considered to
represent exposure via ingestion.
2
3
4.2
Descriptive
statistics
4
5
4.2 Descriptive
statistics
6
7
8
9
4.2.2 Graphical summaries
4.2.2 Graphical
summaries
10
11
12
13
14
15
4.3
Probability
distributions
16
▪Most exposure measurements can be
considered random variables. (Ott, 1995)
▪Statistics allows for analysis of random
variables by incorporation of variation
through probability.
17
概率密度函數
▪probability density function (PDF):
provides the probability of an outcome
taking values in a small interval.
累積分布函數
▪cumulative distribution function (CDF):
describes the probability of an outcome
being less than a particular value.
18
4.3.1Normal distribution
1.常態分布(高斯分布),是最重要的統計分布之一。
2.特徵為:對稱的鐘形頻率分布
3.此曲線的形狀完全由資料的μ、σ2決定
19
20
4.3.1Normal distribution
4.標準常態分布:平均數為0,變異數為1的常態分布。
5.不同型態的常態分布,皆可以轉換成標準常態分布,
轉換方法為透過此公式:
6.函數變成:
21
對數常態分布
4.3.2Lognormal distribution
1.暴露測量結果為右傾時(skew to the right)(即不對稱),便可
能為對數常態分布。
2.對數常態分布:
如果Y是常態分布的隨機變量,則ey為對數常態分布;
若X是對數常態分布,則lnX即為隨機變量。
對數常態分布
4.3.2Lognormal distribution
3.對數常態分布、幾何平均數(GM)與幾何標準差(GSD)是相互
關聯的。在這種情況下,幾何平均值等於 ey,幾何平均
差等於eσ。
4.GM和GSD也可以用來定義對數分布的暴露測量。
22
二項分布
4.3.3 Binomial distribution
1.分析暴露的結果頻率(例如:是/否;真假)。
2.對結果的特定數量(n),重複獨立試驗的成功數(k),和失敗數(n-k)。
3.假設某事件的發生率為 p,而試驗做了 n 次。則 n 次中,某事
件發生 k次的機率為 
23
假設臭氧空氣質量標準的每日超標是1年和3年時間段的研究中的獨立事件。
令k為隨機變量,描述在1年期間(n = 365天)遇到的超量總數?
從歷史數據可以假定,每年的預期超過天數為1,因此p = 1/365 = 0.00274。
圖片顯示,每年超過k天的機率
24
4.3.4 Poisson distribution
泊松分布
1.泊松分佈用於描述在固定期間發生的事件時間(即速率),其中各個
事件獨立於一個和另一個。
2.測量暴露事件離散事件的速率,即每單位時間發生事件的次數。
例如:人每周吃入含有甲基汞>5.0ppm海洋魚類的次數。
3. λ(lambda),用於表示每單位時間的平均或預期計數。
計算在固定時間間隔內觀察到特定數量的計數的機率:
25
4.3.4 Poisson distribution
泊松分布
4.泊松分布可以用來測量人與污染物接觸的頻率,
例如人接觸到 苯 的次數。
依據現有數據,人預計接觸到的次數為2次。
使用公式計算 λ=2,則某天有個人碰到4次的(n = 4)的機率為9%。
26
Parametric
inferential
statistics
4.4
參數推論統計
27
4.4.1 Estimation
1.暴露測量數據可以用於估計模型的參數(例如:機率分佈),
特別是那些描述變量的平均值和變異數的數據。
2.兩種類型的常見估計值是點估計值和區間估計值。
點估計值(1)最大似然估计法(2)最小二乘估计法
區間估計值區間估計根據給定的條件不同,有兩種估計方法:
①給定極限誤差,要求對總體指標做出區間估計;
②給定概率保證程度,要求對總體指標做出區間估計。
95%
28
4.4.2 Measurement error and reliability
1.測量誤差是指給定樣品收集和分析方法的準確性和精密度。
2.準確度描述了測量沒有偏差的程度。
測量可靠性
精密度是指特定測量系統的重複性。
3.例子:
考慮對室外空氣中的可吸入顆粒物(RSP)的假設研究,
其中進行了20對重複的24小時平均測量。
假設40個測量中平均24小時平均濃度為5μg/ m3。
進一步假設20對重複樣本之間的差異分佈,
平均值和標準偏差為5和1μg/ m3。
那麼平均來說,單次測量可以預計在5μg/ m3的實際濃度範圍內。利用第4.4.1節提
出的概念,單次測量可以預計在95%的時間內真實濃度的大約3-7μg/ m3,即平均
差異的±2標準偏差。
29
30
31
32
33
34
35
36
Non-parametric
inferential
statistics
4.5
37
38
4.6
Other topics
39
40
4.7
Summary
41
42
Thanks!
43
Download