樣品年份、化學值分布參數對近紅外檢測結果的影響
摘要:以云南優(yōu)質烤熠為實驗材輯。在國產光柵漫反射型近紅外儀器上,比較研究了不同年份樣品建模、不同化學值分布建模對近紅外檢測結果的影響。結果表明:總糖、尼古丁組分模型偏差受年份影響較大,總氮組分模型偏差與樣品年份關系不明顯?緹熃M分的不同化學值分布建模結果表明:用化學值按自然正態(tài)分布的樣品建立模型的結果優(yōu)于按均勻分布建模的結果。該研究對從大量天然產物樣品中挑選代表性樣品時所采用的挑選方法和原則具有指導性的參考價值。
關鍵詞:近紅外 烤煙 樣品年份;化學值分布
引言
近紅外譜區(qū)包含了生物樣品各種組分的物理、化學信息。近紅外分析可概述為樣品化學組分與物理信息間的數學表達,而該數學表達即近紅外數學模型的優(yōu)劣在很大程度上取決于建立該數學表達時所采用樣品的代表性[1鉑。特別是建立天然產物近紅外數學模型時,建模樣品的年份、品種、產地以及組分模型的化學值分布等情況都會影響建模樣品的代表性和所建模型的性能口]。
c00per等研究了年份變化對關系模型的影響及處理辦法,結果表明,使用早年煙葉建立尼古丁關系模型后.直接測試新年份煙葉時,準確度會有所降低,但模型中適當加入新年份煙葉標樣后,檢測準確度即可得到保證,但該研究結論未進行公開發(fā)表,其他烤煙組分模型與年份關系也未見報道。煙草吉氮量的研究結果表明,不同煙草的總氮變化量隨種類有較大的變化,一般烤煙的總氮變化不大,白肋煙的總氟變化最高【5]。本文中主要以尼古丁和總氮組分含量為例研究了年份變化對烤煙模型的影響及處理辦法。
建立天然產物近紅外數學模型時為保證建模樣品的代表性,一般要求其建模組分的化學值范圍(或動態(tài)范圍)應盡可能大,即盡量收集到含量較低和較高的樣品類型。但對其化學值分布情況的要求在近紅外分析界存在一定的爭議,是均勻分布好還是正態(tài)分布好并無定論,也未有明確結論的文獻報道。本文通過模擬設計多組均勻及正態(tài)分布建模結果的比較,對該問題進行了初步的探索研究。
1、實驗材料與方法
1.1實驗材料
2004年云南各地優(yōu)質烤煙樣品122份,2005年云南各地優(yōu)質烤煙樣品100份,樣品由云南煙草科學研究所應用流動注射自動分析僅測定其總糖、尼古丁含量,應用國標凱氏定氮法測定其總氯含量。
1.2實驗儀器
實驗所用儀器為鼬oo型光柵積分球漫反射近紅外光譜儀(上海棱光公司、中國農業(yè)大學合作開發(fā)研制),信噪比(s/^D≥1 000;波長準確度≤1 nm}光譜掃描區(qū)間為1 300~2 100啪,分辨率為16 nm;S400型儀器上配備近紅外煙草品質定量分析專用軟件。
2、結果與分析
2.1樣品年份差異
對近紅外檢測結果的影響將2005年云南各地優(yōu)質烤煙樣品100份隨機分為兩組,每組各50份,其中第l組樣品用于和2004年樣品一起建立包含不同年份樣品的模型,第2組樣品用于分析檢驗。用不同年份樣品所建模型對第2組2005年50份樣品的分析預測結果情況見表1,其中“模型1”指全部為2004年樣品建立的數學模型,。模型2”指2004年樣品加2005年第1組50個樣品共同建立的數學模型。
總糖和尼古丁組分模型在加人2005年第1組樣品后預測2005年第2組樣品的準確度,要明顯好于全為2004年樣品的模型,因此這兩個組分模型與樣品年份差異存在一定的`關系,在建立該兩組分近紅外品質分析實用模型時應包含樣品年份差異的信息,而尼古丁組分模型的性能與樣品年份差異之間的關系卻并不明顯。其原因可能與云南地區(qū)煙草品質特點和質量控制措施有關。
2.2樣品化學值分布
對近紅外檢測結果的影響2004年從云南各地收集的122份烤煙樣品總糖化學值含量的分布情況見圖1,從圖1中可以看出其總糖化學值含量的分布為近似的正態(tài)分布。在分析儀器中建立單白變量的標準曲線(即為定標方程或簡單敷學模型)時一般要求所建定標方程樣品的化學值含量為均勻分布,建立近紅外數學模型時,樣品化學值含量分布的要求還沒有確定的結論,是遵循均勻分布還是正態(tài)分布好,不同的學者有不同的觀點[1]。
對于一般天然產物各組分的化學值詈量一般是自然正態(tài)分布的口],如果建模時遵循均勻分布必須進行刻意的樣品挑選,奉研究分別設計了55,40,25個樣品總糖化學值按均勻分布的原則和正態(tài)分布原則建立了6個不同的數學模型,以及用04年所有樣品建立的數學模型.此7個數學模型內部交叉驗證的結果情況見表2。其中按正態(tài)分布設計的55,40,25個樣品總糖化學值分布情況分男U見圖2~圖4,按均勻分布設計的55,40,25個樣品總糖化學值分布情況見表3。
刻意的進行樣品挑選使建模樣品的化學值分布滿足均勻分布的方法,并不一定能取得較好差,因此按其樣品組分化學值的自然正態(tài)分布建模是可行的建模效果,相反比按自然正態(tài)分布所建模型的效果還要的,建模時模型內部交叉結果顯著較差時(譬如兩個不同分布的25個樣品所建模型結果),該模型一定不是性能好的模型,但反之卻不一定成立,從表2中25個樣品建模的內部交叉平均誤差可以看出,比122個樣品建模的平均誤差要小,這并不能說明25個樣品所建模型比122個樣品所建模型的效果還要好,因為建模樣品數目的減少會降低模樣品的代表性,同時降低所建模型的穩(wěn)定性,要建立穩(wěn)定性好的數學模型必須使用大的建模樣品集或從大量樣品中挑選有代表性樣品建模型才可以實現伽。刻意追求化學值的均勻分布建模并不一定能取得較好的結果這一研究結論,對從大量樣品中挑選代表性樣品建模時所使用的挑選方法和原則具有重要的參考價值,即按樣品的光譜或光譜主成分特征進行代表性樣品挑選時,在不同特征區(qū)間范圍內可不刻意遵循均勻分布的原則去挑選。
3、結論與討論
通過以上研究,總結如下:
(1)烤煙中總糖、尼古丁組分模型的預測準確度與建模樣品的年份差異存在一定關系,當模型中包含被預測樣品的年份信息時其預測準確度會有所提高}總氮組分模型的預測準確度與樣品年份信息的關系不大,因此對一些受氣候、栽培措施等影響較大的天然產物組分建立模型時應考慮年份不同產生的影響。
(2)建立天然產物近紅外定標方程模型時,按其樣品組分化學值的自然正態(tài)分布建模是可行的,而刻意追求化學值的均勻分布建模并不一定能取得較好的結果。
(3)按樣品的光譜或光譜主成分特征進行代表性樣品挑選時,在不同特征區(qū)間范圍內遵循均勻分布的原則去挑選.結果未必最優(yōu)。
(4)云南地區(qū)煙草生產進行“控氮降堿”的質量控制措施,是否與總氮組分模型的預測準確度與樣品年份信息的關系不大有關,還有待進一步研究,模型中樣品產地等差異對近紅外檢測結果的影響程度還有待進一步研究。
致謝:本論文承蒙得到陸婉珍院士、嚴衍祿教授,蔣士強教授等的悉心審閱和指導,在此表示衷心的感謝和敬意。
【樣品年份、化學值分布參數對近紅外檢測結果的影響】相關文章: