南台科技大學 研究報告 語音隱藏技術應用在 G.723.1 編解碼器

advertisement
南台科技大學
研究報告
語音隱藏技術應用在 G.723.1 編解碼器
Audio Steganography Applications in G.723.1
Codes
姓名:許仕衡
學號:MA0G0102
指導教授:林榮三副教授
研究計畫中英文摘要:請就本計畫要點作一概述,並依本計畫性質自訂關鍵詞。
(一)計畫中文摘要。(五百字以內)
(二)計畫英文摘要。(五百字以內)
(一)
計畫中文摘要。
由於網際網路通訊的發達且語音壓縮的技術越來越先進,數位錄音設備也越
來越普及,有許多重要的語音訊息也會使用網路來傳輸。然而語音編解碼器上的
資料格式已廣為人知,在網路傳輸的過程中,只要被駭客竊取,資料容易外流,
在傳統的保密方法上,都是使用密碼來保護資料,只需要花時間便會遭到破解,
故本文提出了一種簡單而有效的隱寫術(Steganography)方法,來增強資料的安
全性,適用於 5.3kbps 的 G.723.1 的低位元語音編碼,基於分析冗餘的編碼參數。
在語音訊息加密後,使用隱寫術把秘密語音訊息隱藏在另一個語音訊息裡,他的
資訊嵌入率為 133.33bps,使用語音質量度量標準所得的結果為 4.102,混合的
語音在人類耳朵主觀的聽覺上,品質並沒有太多的下降。
關鍵詞:資訊隱藏(IH) ,隱寫術, G.723.1,增強身份矩陣
(二)
計畫英文摘要。
Because Internet communications developed and speech codec technology
becomes more advanced, multimedia recording devices becoming more and more
popular, there are many important speech messages will use the Internet to
transmit. However, the data format on the speech codec is well known, in the process
of network transmission, as long as hackers to steal data , the data is easy to drain, in
the traditional security methods, are used password to protect information, it just
spend time would have been cracked, so proposed a simple and effective
steganography method, to enhance data security for the G.723.1 5.3kbps low-rate
speech code, based on redundant coding parameters to analysis. After the speech
message is encrypted, using steganography to hide secret messages in the speech
message to cover speech, his information embedding rate is 133.33bps, the results of
4.102 by MOS, the mixed speech quality did not decline too much in the human ear
hearing.
Keywords: information hiding, speech steganography, G.723.1, augmented
identity matrix
目錄
(一)研究計畫之背景及目的............................................ 5
1 研究計畫之背景及目的 ........................................... 5
2 參考文獻 ........................................................ 8
(二)研究方法、進行步驟及執行進度 ................................. 10
1. ....................................... 本計畫採用之研究方法與原因
(三)預期完成之工作項目及成果....................................... 12
1. 預期完成之工作項目 ............................................ 12
圖目錄
圖一、G.711 編碼示意圖 ............................................... 6
圖二、G.711 解碼示意圖 ............................................... 7
圖三、PESQ 的信賴區間 ................................................ 7
圖四、G.723.1 編碼方塊圖
10
(一)
1
研究計畫之背景及目的
研究計畫之背景及目的
最近因為網際網路的發達,所要面臨資訊安全上的問題也越來越多,在
過去資訊不發達的時代,都是使用密語、暗號、密碼本等等的方式來將要隱
藏的資訊加密。有許多資訊都使用網路傳輸。但在現在資訊發達的時代,這
些方法已經不足以保護資料的安全,所以就將之前的方法再加上一種方法來
增加它的安全性,其中一種技術,就是訊息隱藏(Information Hiding),訊
息隱藏是一個訊息安全的熱門研究,其廣泛應用程式擴展,從數位多媒體的
版權保護和通信內容隱私和安全認證保護。不同於傳統的訊息安全加密技術
的保密方法,訊息隱藏試圖隱藏重要的資料,而不是僅僅加密其資料的內容
[1]。而訊息隱藏法是在訊息交流中,扮演著保護訊息安全的重要領域之一,
包括各種加密、訊息隱藏法和編碼。訊息隱藏法的方法在近幾年吸引了很多
人的注意,因為訊息隱藏法把所要隱藏的資訊隱藏在覆蓋向量裡,使的其他
人不去注意那些資料。訊息隱藏法和其他的方法主要的區別在於隱藏的資
料。例如:再加密法裡面,注意到編碼數據的存在,但是無法理解他。然而,
在訊息隱藏法裡,你不會去注意到這些數據的存在。[2]
隱寫術(Steganography)主要用於訊息隱藏,他英文的來源是從特裡特
米烏斯的一本講述密碼學與隱寫術的著作 Steganographia,該書書名源於希
臘語,意為「隱秘書寫」。隱寫術在資訊安全方面是很重要的技術,語音加
密在近年來十分受到重視而且也提出了許多不同的方法[3][4][5][6]。然而
大部份都是基於無壓縮的語音採樣 8kHz 或更高的採樣頻率和 16 量化位元
在每個樣本。裡面只有少數強大的 IH 方法或基本的參數和語音編碼技術。
這是因為在語音編碼後,大部分用於隱藏訊息的語音採樣間的冗餘已經被消
除了,這使得 IH 在這類語音編碼變得十分困難。目前,存在的語音隱藏方
法在壓縮領域裡包括:[7][8][9]基於 8Kbps 的 G.729 語音編碼和[10] [11]
基於 13Kbps 的 RPE-LTP 編碼/解碼器[11]。
隱寫術在許多不同的地方,都有用到隱寫術這個技術,例如:用在
G.711 上的 Semi-Lossless 隱寫術[12],G.711 使用 64KHz 的速率採樣,
可將 14bits 轉成 8bits。圖一、為 G.711 編碼示意圖,圖二、為 G.711
解碼示意圖[13]。所做結果 PESQ[14]的信賴區間為 95%[12],如圖三、,
圖一、G.711 編碼示意圖
圖二、 G.711 解碼示意圖
圖三、PESQ 的信賴區間
隱寫術除了能使用在 G.711 上,也可以用在 MP3 檔裡[15]、用在 Voice
over IP(VOIP)[16]裡、用在影像裡[17][18]還有多媒體訊息服務[19]。
2
[1]
參考文獻
Fabien A.P.Petitcolas, Ross J.Anderson, and Markus G.Kuhn, “Information
Hiding-A Survey,” Proceedings of IEEE, special issue on protection of
multimedia content, vol87(7) 1999, pp.1062–1078.
[2]
JUDGE J.C.: ’Steganography: past, present, future’, SANS White Paper, 30
November 2001, http://www.sans.org/rr/papers/index.php?id?552, accessed
August 2009
[3]
M. Cooperman, S. Moskowitz, “Steganographic method and device [P],”
USA: Patent: 5687236, 11, 1997.
[4]
W. Bender, D. Gruhl, N. Morimoto, et al. Techniques for data hiding [J].
IBM System Journal, 1996, 35(3&4), pp.313-336.
[5]
C. Lee, K. Moalllemi, R. Warren. Method and apparatus for transporting
auxilary data in audio signals [P]. USA Patent: 5822360, 1998.
[6]
D. Gruhl, W. Bender, A. Lu. Echo hiding [A]. First International Workshop
on Information Hiding, Cambridge, England [C]. Springer:Lecture Notes in
Computer Science, 1996. pp.295-315.
[7]
L. Liu, M. Li, Q. Li, and L. Yan, “Perceptually transparent information
hidng in G.729 bitstream”, International Conference on Intelligent
Information Hiding and Multimedia Signal Processing, 2008, pp. 406- 409.
[8]
Z. Wu, W. Yang, “Speech information hiding in G.729,” Chinese Journal of
Electronics, vol. 15, Jul 2006, pp. 545–549.
[9]
P. Chang, H. Yu, “Dither-like data hiding in multistage vector quantization
of MELP and G.729 speech coding”, Conference Record of the
Thirty-Sixth Asilomar Conference on Signals, Systems and Computers,
2002, pp:1199 – 1203.
[10] J. Bai, X. Jing, Y. Yang, Y. Xu, X. Niu and Y. Yang, “AERA algorith, on
speech hiding system” , Chinese Journal of Electronics, vol.33, No.9, 2005,
pp.1541-1544.
[11] I. McLoughlin, Z.Q. Ding,” Mandarin Speech Coding Using A Modified
WE-LTP
Technique” , The 2000 IEEE Asia-Pacific Conference on
Circuits and Systems, 2000, pp. 748 – 751
[12] N. Aoki, ” A Semi-Lossless Steganography Technique for G.711 Telephony
Speech” , Sixth International Conference on Intelligent Information Hiding
and Multimedia Signal Processing (IIH-MSP), 2010, pp. 534 – 537.
[13] N. Aoki, “Lossless Steganography Techniques for IP Telephony Speech
Taking Account of the Redundancy of Folded Binary Code” , Fifth
International Joint Conference on INC, IMS and IDC, 2009, pp. 1689 –
1692.
[14] ITU-T P.862, Perceptual evaluation of speech quality (PESQ), an objective
method for end-to-end speech quality assessment of narrow-band telephone
networks and speech codecs, 2001.
[15] M.H. Shirali-Shahreza, S. Shirali-Shahreza, “Real-time and MPEG-1 layer
III compression resistant steganography in speech”, IET Information
Security, pp. 1 – 7
[16] M. Hamdaqa, L. Tahvildari, “ReLACK: A Reliable VoIP Steganography
Approach” , Fifth International Conference on Secure Software Integration
and Reliability Improvement (SSIRI), 2011, pp. 189 –197
[17] P. Marwaha, P. Marwaha, “Visual cryptographic steganography in images” ,
International Conference on Computing Communication and Networking
Technologies (ICCCNT), 2010, pp. 1 – 6
[18] M.C. Chen, S.S. Agaian, and C.L.P. Chen, “Generalized collage
steganography on images” , IEEE International Conference on Systems,
Man and Cybernetics, 2008, pp.1043 – 1047
[19] M. Shirali-Shahreza, “Steganography in MMS”, IEEE International
Multitopic Conference, 2007, pp.1-4
[20] http://www.itu.int/itudoc/itu/aap/sg12aap/history/p862
[21] S.K. Jung, K.T. Kim, Y.C. Park, and H.G. Kang, “A fast adaptive-codebook
search algorithm for G.723.1 speech coder”, IEEE Signal processing letters,
2005, Vol. 12, No.1, pp. 75-78.
[22] C. Zhang, K. Tang, H. Cui, W. Du, and J. Li, “Efficient pitch predictor
algorithm in ITU-T G.723.1”, IEEE Conf. Communication Technology
Proceedings, 2003, Vol. 02, pp. 1727-1729.
(二)
研究方法、進行步驟及執行進度
1、 本計畫採用之研究方法與原因
I T U -
T 所 制 訂 的 語 音 壓 縮 標 準 有 6.3、5.3 kbps
G723.1 及 8 kbps 的 G.729,6.4 kbps
的
的 G.729D 這些都是使用碼 激 式
線 性 預 測( C E L P )編 解 碼 方 式 。G.723.1 是混合語音編碼方法的
主流,圖四、,是 G.723.1 編解碼器的方塊圖,他主要是使用非常低的位元
率來壓縮語音或多媒體服務的音訊訊號元件[20],這個編碼器主要是以 8KHZ
的速率採樣每秒可以對 5.3kbps 或 6.3kbps 的數據進行壓縮,此編碼器以
30ms 的音框為單位。6.3kbps 的位元率,是用 Multi-Pulse Maximum
Likelihood Quantization (MP-MLQ) Excitation 編碼,編碼出來的音訊擁
有比較好的質量,而 5.3kbps 的位元率,則是用經由代數碼激式線性編碼
(Algebraic Coded Excited LPC)簡稱 ACELP,編碼出來的質量較 6.3kbps
的差,但是在通訊中仍可以接受,因為 5.3kbps 的位元率較低,所以提供了
程式設計師在設計上較多的靈活性,G.723.1 主要應用在 VOIP 上。ITU-T
G.723.1 語音編碼所使用的 AbS 架構演算法,其結果有高語音品質與低位元
率,但 AbS 架構的計算複雜度很高[21][22],
本篇主要使用 G.723.1 編解碼器來實現隱寫術,來隱藏秘密資料,預計的步
驟為:
第一步:把秘密資訊使用 MELP 作編碼、載體使用 G.723.1 來做編碼。
第二步:把秘密資訊給一個 key 做加密動作,丟到嵌入的程式裡。
第三步:把載體取出要用來隱藏秘密資訊的載體向量,並丟到嵌入程式裡做
運算。
第四步:運算完後得到混合起來的位元串流(bitstream),再利用提取程式把
秘密資訊取出來。
第五步:把得到的混合位元串流使用 G.723.1 做解碼得到混合語音。
圖四、 G.723.1 編碼方塊圖
(三)預期完成之工作項目及成果。
1 預期完成之工作項目
Download