Быстрое обнаружение хрома в капсулах лекарственных средств с использованием гиперспектральной визуализации
Материалы и методы
Образцы
В исследовании использовались обычные капсулы и капсулы с превышением допустимого содержания хрома. Все образцы хранились в герметичной таре. Влияние цвета на спектры не учитывалось, так как текущие данные не показывают связи между цветом и наличием тяжелых металлов.
Гиперспектральная система
Для гиперспектрального анализа использовалась система FS13 от компании Hangzhou Caipu Technology Co., Ltd. Она охватывает спектральный диапазон 400-1000 нм с разрешением лучше 2.5 нм и имеет до 1200 каналов. Скорость сбора данных достигает 128 кадров в секунду, а после выбора полосы - до 3300 Гц. Система была помещена в герметичный шкаф с черной поверхностью для минимизации внешних световых помех.
Анализ главных компонент (PCA) гиперспектральных изображений
Гиперспектральные данные представляют собой набор изображений в различных диапазонах, каждое из которых можно рассматривать как отдельный признак. Прямое снижение размерности может изменить исходные данные, сместив их в новую систему координат, что может повлиять на результаты. В данном исследовании использовался PCA для повышения информативности данных, изоляции шумов и снижения размерности. Первые четыре главные компоненты, полученные после PCA, представлены на рисунке 1.
Анализ показывает, что, хотя первая главная компонента содержит больше всего информации, а вторая - следующей по значимости, контраст между образцами капсул на них не выражен. Третья главная компонента (PC3), напротив, позволяет лучше различить капсулы. Однако, стоит отметить, что характеристики, выделяемые PCA, могут зависеть от цвета капсул, так как на PC3 выделяется только крышечка капсулы. Таким образом, PCA может быть использован в качестве предварительного метода для выявления "токсичных" капсул, но для полного анализа необходимы спектральные данные, которые являются ключевым преимуществом гиперспектральной визуализации.
Спектральный анализ
Преимущества гиперспектральной визуализации: Гиперспектральная визуализация позволяет получить не только изображения образцов, но и информацию об их спектральных характеристиках.
Получение спектральных данных: Для каждого образца были выделены области интереса (ROI), характеризующиеся уникальными спектральными кривыми. Для минимизации влияния цвета, отдельные ROI были выбраны как на крышке, так и на корпусе капсулы. Размер ROI составлял от 2 до 6 пикселей. Спектральные данные усреднялись по всем пикселям ROI.
Анализ спектральных кривых: На Рисунке 2 представлены спектральные кривые, полученные для нормальных и "токсичных" капсул, как для крышек, так и для корпусов. Анализ показал, что спектральные кривые крышек "токсичных" капсул и тел нормальных капсул обладают большей хаотичностью. Спектральные кривые крышек нормальных и "токсичных" капсул значительно отличаются, с пересечением в районе 620 нм. Спектральные кривые тел капсул пересекаются в районе 550 и 700 нм.
Необходимость комплексного анализа: Опираться только на спектральные кривые для дифференциации "токсичных" и нормальных капсул затруднительно. Требуется всесторонний анализ спектрального диапазона для выявления наиболее информативных спектральных признаков и проведения дискриминантного анализа.
Снижение размерности данных с использованием PLS: Из-за большого объема спектральных данных, необходимо применение алгоритмов извлечения признаков. В данном исследовании для снижения размерности данных использовался метод частичных наименьших квадратов (PLS).
Определение оптимального числа латентных переменных (LV): Оптимальное число латентных переменных, также известных как операторы PLS, определялось на основе среднеквадратичной ошибки. Использовались методы перекрестной проверки (RMSECV) и корректировки (RMSEC) среднеквадратичной ошибки. Латентные переменные представляют собой комбинации признаков, полученных после PLS-преобразования. Обычно вклад LV в общую характеристику снижается по мере увеличения их числа. Оптимальное число LV выбиралось на основе баланса между точностью классификации и общей применимостью модели.
Моделирование и выбор оптимального числа LV:
- Данные были разделены на обучающую (60%) и тестовую (40%) выборки.
- Рисунок 3 показывает зависимость значений RMSECV и RMSEC от числа выбранных LV для нормальных и "токсичных" капсул.
- Значения RMSECV и RMSEC существенно снижаются при увеличении числа LV от 1 до 6. При числе LV больше 6, изменения становятся незначительными.
- На основе этих данных был сделан вывод о целесообразности использования 6 LV в качестве входных признаков.
- Дополнительно учитывались точность классификации и коэффициент корреляции (r²) на тестовом наборе.
Выбор 4 LV в качестве оптимального решения:
- При использовании 4 LV коэффициент корреляции между перекрестной проверкой и прогнозом достигает 0,9 и выше, что значительно выше, чем при использовании 3 LV, а частота ошибок классификации равна 0.
- При этом, дальнейшее увеличение числа LV не приводило к существенному улучшению показателей.
- На основании совокупности этих факторов было решено использовать 4 LV в качестве оптимального числа для построения модели.
Выводы и перспективы
Результаты исследования показали, что метод дискриминантного анализа PLS-DA, примененный к гиперспектральным данным в диапазоне 450-900 нм, позволяет безошибочно (чувствительность и специфичность 100%) различать нормальные и "токсичные" капсулы при использовании четырех PLS-операторов в качестве входных признаков. Использование гиперспектральной визуализации для выявления "токсичных" капсул значительно упрощает процесс контроля качества по сравнению с традиционными методами.
Для повышения надежности и точности анализа рекомендуется расширить спектральный диапазон исследования, включив в него области флуоресценции или ультрафиолета. Наряду с качественным анализом необходимы количественные исследования, которые можно реализовать путем создания набора желатиновых шаблонов с разным содержанием хрома. Построение корреляционной модели между содержанием хрома и спектральными характеристиками позволит прогнозировать содержание хрома в неизвестных образцах "токсичных" капсул. Несмотря на трудности с поиском образцов "токсичных" капсул, вызванные последствиями скандала, для повышения эффективности метода целесообразно провести эксперименты с капсулами, содержащими хром в различных концентрациях.