近红外(Near Infrared,简称NIR)光是指介于可见光与中红外之间的电磁波,谱区范围是780~2526nm (12820~3959cm-1),通常又将此波长范围划分为近红外短波区(780~1100 nm)和近红外长波区(1100~2526 nm)。与中红外相比,该区域主要是O-H,N-H,C-H,S-H等含氢基团振动光谱的倍频及合频吸收,谱带宽,重叠较严重,而且吸收信号弱,信息解析复杂,所以尽管该谱区被发现较早,但分析价值一直未能得到足够的重视。近年来,由于计算机与化学统计学软件的发展,特别是化学计量学的深入研究和广发应用,使近红外成为发展最快、最引人注目的光谱技术。与传统的分析方法比较,近红外光谱分析技术拥有许多独到之处。但和其它析方法一样,近红外分析方法也存在不足之处。首先,它是一种间接的分析技术,需要通过收集大量具有代表性的标准样品,通过严格细致的化学分析测出必要的数据,再通过计算机建立数学模型,才能预测未知样品的结果。而模型的建立需耗用大量的人力、物力和财力;其次,由于NIR谱区为分子倍频与合频的振动光谱,信号弱,谱峰重叠严重,所以目前还仅能用于常量分析,被测定组分的量一般应大于样品重量的0.1%;此外,在进行近红外光谱分析时,应考虑样品的特征、分析实验的设计及数据处理等多方面的问题,才能取得正确的分析结果,建立可靠的校正模型是利用近红外实现成功分析的关键。
二、原理及分析方法
由于一张近红外光谱既可以给出活性成分、辅料的化学结构信息、还可以给出活性成分的工艺信息(如晶型、旋光度、密度等)以及制剂的工艺特征信息(如制粒的大小、硬度等)和部分包装材料的结构信息,所以利用近红外光谱,我们既可以做定性分析也可以做定量分析,但与常规的分析方法不同,近红外光谱技术不是通过观察供试品或测量供试品谱图参数直接进行定性或定量分析,而是首先通过测定样品校正集的光谱、组成或性质数据(组成或性质数据需通过其他认可的标准方法测定),采用合适的化学计量学方法建立校正模型,再利用建立的校正模型与未知样品进行比较,从而实现定性或定量分析。
1.定性分析
近红外光谱谱带较宽,特征性不强,因此很少像其他光谱(如紫外和红外光谱)那样用于化合物基团的识别及结构的鉴定。近红外光谱的定性分析一般是用于被分析样品在已知样品集中的位置。常用的方法包括:
(1)判别分析法:分析是经典的定性识别方法,其基本思路是相同样品在相同波长下具有相近的光谱吸收,这种光谱间的比较可以是原始光谱也可以是经过处理的光谱。
(2)主成分分析(Principal Component Analysis PCA)法:利用PCA方法将多种波长下的光谱数据压缩到有限的几个因子空间内,再通过样品在各个因子空间的得分确定其归属类别,但PCA对样本与校正集间的确切位置缺乏定量的解释。其缺点是当真药与劣药的含量相当接近时此法容易判错。
(3)马氏距离(Mahalanobis Distance MD)法:该方法的核心是通过多波长下的光谱距离定量描述出测量样本离校正集样本的位置,因而在光谱匹配、异常点检测和模型外推方面都很有用。但应用该方法时,波长位置的选择非常重要,波长点过少,光谱得不到合理得描述;波长点过多,计算量大,为此,也有人提出将PCA与马氏距离相结合解决模型得适用性问题,可以充分利用PCA对大量光谱数据进行降维处理,也较好地解决了马氏距离计算时波长点的选择问题,避免了大量光谱数据直接进行马氏距离计算出现的共线性或计算量大等问题,且克服了采用PCA自身进行判断界限不易量化的问题。
2.定量分析
近红外光谱测量时一般不需对样品进行预处理,但测定的光谱可能受到各种干扰因素的影响。利用单一波长下获得的光谱数据很难获得准确的定量分析结果。NIR光谱结构复杂,谱图重叠较多,所以在进行定量分析时,一般采用多波长下获得的数据并进行一定的数据处理才能获得准确可靠的分析结果。常用如下:
(1)主成分回归(Principal Component,PCR);原理与PCR在解释光谱数据时起着重要作用,从主成分权重中能够确定主成分与哪个组份有关,但确切而全面地解释每个主成分代表什么含义迄今仍是最难解决的问题。
(2)偏最小二乘法(Partial Least Square,PLS):该法是一种全光谱分析方法,充分利用多个波长下的有用信息,无需刻意的选择波长,并能滤去原始数据噪音,提高信噪比,解决交互影响的非线性问题,很适合在NIR中使用。实验证明,PLS法同近红外漫反射光谱法结合,直接分析很多固态药品如磺胺甲基异唑、安体舒通、安乃近、磺胺脒等是可行的。
(3)人工神经网络法(Artificial Neural Networks,ANN):近年来兴起的ANN法研究,根据样品各组分的光谱数据建立人工神经网络模型,预测未知样品并讨论影响网络的各参数。采用ANN法的最大优点是其抗干扰、抗噪音及强大的非线性转换能力,对于某些特殊情况ANN会得到更小的校正误差和预测误差,并且它的预测结果要稍优于PLS(t检验无显著差异)。这可能是由于ANN法具有更强的非线性处理能力所致。
此外还有多元线性回归(Multiple Linear Regression,MLR)、拓扑(Topology,TP)等方法也在近红外光谱分析中得到应用。
三、采样原理与技术
近红外光谱分析的采样技术具有相当大的选择弹性,可依不同样品性质或环境而改变。一般近红外光谱仪主要有三种采样方式(图1) 。其中以漫反射式较为常用。
如图2所示,当光束入射到粉末状的晶粒层时,一部分光会在各晶粒面产生镜面反射,另一部分会折射入表层晶粒内部,经部分吸收后射至内部晶粒界面,再发生反射,折射吸收,如此反复多次,最后由粉末表层朝各个方向辐射出来,此辐射光称为漫反射光。
四、应用范围近红外分光光度法具有快速、准确、对样品无破坏的检测特性,不仅可用于对“离线”供试品的检验,还能直接对“在线”样品进行检测,可广泛地应用于药品的理化分析。
(一)化学分析
1.定性分析
可对药品的活性成分、辅料、制剂、中间产物、化学原料以及包装材料进行鉴别。
2.定量分析
可定量测定药品的活性成分和辅料;测定某些脂肪类化合物的化学值,如羟值、碘值和酸值等,水分的测定,羟基化程度测定以及溶剂量的控制。
3.过程控制
(二)物理分析
1.晶型和结晶性、多晶性、假多晶性和粒度测定。
2.溶出行为、崩解模式、硬度测定。
3.薄膜包衣性质检测。
4.制剂过程控制,如对混合和制粒过程的监测。
五、溶剂
除了2.7~3.0μm区域外大多数溶剂都可以在近红外区使用,几种代表性溶剂的光谱区如图6.2所示,同时附有最佳使用光程。因为分子间键合作用存在,近红外光谱带受溶剂影响很大,因此在进行未知物分析时,标准物与样品必须使用同一种溶剂。
六、仪器和仪器性能指标的控制
(一)仪器
近红外分光光度计的记录波长范围为780~2500nm(按波数计算为12800~4000 cm-1)。所有近红外光谱的测定分为透射和反射两种类型。近红外分光光度计由光源、单色器(或干涉仪)、检测器、数据处理和评价系统等组成。常用的单色器有声光可调型、光栅型和棱镜型。高强度的光源石英壳钨灯,如石英卤素钨灯光源较为稳定。检测器常用的材料有硅、硫化铅、砷化铟、铟镓、汞镉碲和氘代硫酸三甘肽。常规的普通样品池、光纤探头,液体透射池、积分球是一些常用的采样装置。需根据供试品的类型选择合适的检测器和采样系统。
(二)仪器性能指标的控制
1.波长使用在780~2500nm (按波数计算为12800~4000 cm-1)范围内具有特征吸收的合适的标准物质(例如含镝、钬、铒等稀土氧化物)进行波长的校验,在校验的波长范围内至少需检查三个波长。对于傅立叶变换型的仪器,可以使用一个已被证明过的标准物质的狭窄谱线进行验证。可接受的波长不确定度为:1200nm±1nm(830 cm-1±8 cm-1),1600 nm±1nm(6250 cm-1±4 cm-1), 2000 nm±1.5nm(5000 cm-1±4 cm-1)。
2.光线度性用一组透光率或反射率已知标准物质检查分光光度计的线性。使用标准物质检查仪器相应值的稳定性。
3.仪器的分辨率近红外光谱仪的分辨率是指仪器对于紧密相邻的峰可以分辨的最小波长间隔,表示仪器实际分开相邻两的能力,它是最重要的仪器指标之一,也是仪器雷竞技百科 的综合反映。
仪器的分辨率主要取决于仪器分光系统的性能,对于色散型仪器而言,其分辨率取决于分光后狭缝截取的波段精度,狭缝越小截取的波段越窄,分辨率越高。但随之而来的是能量急剧下降,灵敏度不断降低,为了兼顾检出灵敏度,就不能让狭缝无限制的缩小来提高分辨率,因此,要让色散型的仪器分辨率达到0.1 cm-1,又能得到一张雷竞技百科 良好的谱图是很困难的事。而对于傅立叶型的近红外光谱仪,有多路通过的特点,无狭缝的限制,仪器的分辨率仅仅取决于干涉采样数据点的多少,即取决去动镜移动的距离,而动静的移动由激光控制,因此可以很轻松的得到一张高雷竞技百科 ,高分辨的谱图。
4.波长准确度
波长的准确度是指仪器所显示的波长值和分光系统实际输出单色光的波长值之间相符的程度。波长准确度可用波长误差,即上述两值之差来表示。保证波长准确度是近红外光谱仪器能够准确测试样品的前提,是保证分析结果准确的前提。近红外分析结果是通过用已知化学值的标准样品的建立的模型来分析待测样品,如果波长准确度不能保证,整组数据就会因波长的移动(即X轴发生了平移)而使每个数据产生偏差,造成分析结果的误差。同时,模型传递也会受到影响。波长准确度主要取决于光学系统的结构,此外还受到温度的影响。傅立叶近红外光谱仪因内部装有波长校正系统,仪器的光学结构简单,干涉仪只有一个动镜是运动部件,且运动速度又受到高稳定的氦-氖干涉系统的监视,加之在傅立叶仪器中使用了单色性能极好的氦-氖干涉系统作为采样标尺,因此测量的重复性和准确度都非常高。而色散型仪器和滤光片型的仪器需要使用已知波长且性质稳定的标准物质经常进行校正,因此波长准确度较低。
5.波长精密度波长精密度又被称为波长重复性,是指对同一样品进行多次扫描,光谱峰位置间的差异程度或重复性,通常用多次测量某一谱峰所得波长的标准差来表示。波长精密度是体现仪器稳定的一个重要指标,取决于光学系统的结构,与波长准确度一样,也会影响分析结果的准确性。仪器的光学系统可动部件越少则仪器的波长精密度越高。
6.信噪比信噪比就是样品吸光度与仪器吸光度噪声的比值。仪器吸光度噪声是指在一定的测试条件下,在确定的波长范围内对样品进行多次测量,得到光谱吸光度的标准差,仪器的噪声只要取决于仪器光源的稳定性、电子系统的噪声、检测器产生的噪音以及环境产生的噪声,比如电子系统设计不良、仪器接地不良、外界电磁干扰等因素都会使仪器的噪声增大。信噪比使近红外光谱仪非常重要的指标之一,直接影响分析结果的准确度和精确度;因为近红外光谱分析是一门弱信号的提取技术,在一个很强的背景信号下提取出相对较弱的有用信息,得到分析结果,所以信噪比显得尤为重要。一般测试信噪比的方法分为两种,一种是峰-峰值,另一种是均方根值(RMS),其中峰-峰值更能客观的反映出信噪比。
7.杂散光强度
杂散光是指分析光以外被检测器接收的光,主要是由于光学期间表面的缺陷、光学系统设计不良以及机械零件表面处理不佳等因素引起的,尤其是色散型近红外光谱仪器的设计中,杂散光的控制非常关键,往往是导致仪器测量出现非线性的主要原因。杂散光对分析测量的影响在分析高吸光度样品时更为明显。抗杂散光能力越强,仪器的灵敏度越高。傅立叶型近红外光谱仪检测器上检测到的信号,不是光的实际信号,而是按照f=2vυ(其中f-调制频率;v-动镜移动速度;υ-波数)调制的声频信号,故外界高杂散光不会干扰检测,可当作直流分量处理。一般情况下,傅立叶型仪器的杂散光信号可以忽略不计,同时其优秀的抗干扰能力也保证了它有良好灵敏度和高的信噪比。只有在考察光栅型仪器时才需要考虑这个指标。
8.软件功能以及数据处理能力
软件是现代近红外光谱仪器的主要组成部分,软件一般有光谱采集软件和化学计量学处理软件两部分组成。不同公司的软件差异较大,光谱化学计量学软件一般由谱图的预处理、定性或定量校正模型的建立和未知样品的预测三大部分组成。有些公司的软件的只能化程度较高,可以推荐最佳主成分维数等指标,适于初学者和经验丰富的科学工作者使用;有些软件的只能化程度则差些,仅仅适合经验丰富的使用者。
七、影响近红外光谱的主要因素
影响近红外光谱的主要因素有样品温度、样品的含水量和残留溶剂、样品厚度、样品的光学性质、多晶型和样品的实际储存时间等。
八、应用近红外分光光度法进行定性、定量分析的基本要求
(一)定性分析
首先建立参考谱库,然后进行数据预处理和数据评估,最后对数据库的专属性和耐用性进行验证。
1.参考谱库的建立
记录适宜数量批数的某物质的谱图,这批物质必须按照建立好的雷竞技百科 标准已进行了全面的测试,并包含了该物质的各种信息(如生产企业、物理形态、粒度等的不同)。该套光谱包含了各种鉴别信息,据此可用该谱库对被测物质进行鉴别。
2.数据预处理
建立一个分类或校正模型前,必须对谱图进行某种数学预处理,典型的方法有多元散射校正、Kubelka-Munk变换,能使噪音降低的谱图压缩技术以及谱图一阶或二阶导数的数学计算法,在某些情况下可采用归一化法。做任何数学转换时必须防止基础信息丢失或人为信息的引入,因此在所有情况下使用数学转换的合理性必须用文件阐明。
3.数据评估
数据评估时将被测物质的谱图在数学相关性或其他向平的算法基础上直接与谱库中单一或平均参考谱图比较,有多种不同的计算方法;主成分分析与聚类分析连用、SIMCA(soft independent modeling by class analogy)及近红外仪器中使用的其他软件。
4.数据库的验证
(1)专属性
专属性的验证系指利用数据库鉴别阳性化合物时能给出正确的结果,并足以区分阴性化合物。应使用一些与谱库中的物质在化学结构上相近的物质进行挑战性验证,验证结果应能将这些物质与谱库中的物质区分。对谱库中有代表性而未用于建库(如不同批次、混合样)的同类样品,进行验证时应能给出阳性结果。
(2)耐用性
在预处理和校正算法的参数没有改变的情况下,考查分析中正常操作条件有微小变化的影响;
①不同操作者、环境条件(如实验室中的温度、湿度)变化的影响。
②样品温度、样品在光学窗口的位置、探头的深度以及被测物质的包装状况的影响。
③仪器部件或进样装置的更换。
(二)定量分析
首先建立一个校正模型的参考谱库,然后进行数据的预处理,最后进行方法学验证。
1.校正模型的参考谱库的建立
首先记录某指标含量已知、适宜数量样品的光谱集,然后建立近红外光谱与样品某指标含量联系起来的数学模型。可以使用任何一个经过校正、能够清楚而确切地由数学表达并给出正确结果的定量校正方法,常用的方法由多元线性回归法、主成分回归法和偏最小二乘法等。
2.数据的预处理
系指近红外谱图数据的数学变换,目的室在建立校正模型前增强光谱特征和(或)去除(或降低)不需要的变异源。根据应用目的可选择适宜的数据预处理和校正算法。
3.方法学验证
近红外定量分析的方法学验证与其它分析方法的要求相似。对于每一个被验证的参数,其可被接受的限度范围必须与该方法应用的目的一致。通常应考虑专属性、线性、范围、准确度、精密度、耐用性和界外点。
九、近红外模型的经常性评价当被测物质物理性质发生改变,或物质的来源改变时均有必要对已建立的定性模型进行再验证。当样品组成发生变化、生产工艺发生改变及原料的来源(或级别)发生改变时,则需要对已建立的定量模型进行再验证。
十、近红外模型的传递
当近红外模型传递到另一台仪器上时,必须考虑仪器型号、数据格式、光谱范围、数据点数量、光谱分辨率等。必须用有代表性的样品(样品数量依据模型确定)在一台仪器上建立模型,这批样品分别在建立模型仪器和另一台仪器扫描光谱,用建立模型仪器上所建立的模型分别预测两台仪器扫描的光谱,对两台仪器测定结果进行统计验证,以确证该模型在另一仪器上是否有效,否则另一台仪器所使用的模型应予重建。