Обнаружение остаточных пестицидов на поверхности апельсинов "Навел" с помощью гиперспектральной визуализации
Данная работа посвящена разработке метода обнаружения пестицидов на апельсинах сорта "Навел" с использованием технологии гиперспектральной визуализации. Для создания модели, позволяющей определять концентрацию остаточных пестицидов, проводится предварительная обработка и снижение размерности гиперспектральных данных с последующим выделением характерных длин волн. Оценивается эффективность различных математических моделей, построенных на основе обработанных данных.
Подготовка образцов и спектральные измерения
В качестве модельного пестицида использовался пиридабен. Для проведения эксперимента были отобраны 80 апельсинов, которые были тщательно промыты и высушены. Далее образцы были случайным образом разделены на четыре группы (по 20 апельсинов в каждой), обработанные раствором пиридабена различной концентрации (1:400, 1:800, 1:1500) и контрольная группа (без обработки). Для каждого образца определялась область интереса, для которой регистрировался средний спектр отражения.
Для каждого типа образцов было получено 20 спектров. В качестве примера, на рисунке представлен типичный спектр образца, обработанного раствором с концентрацией 1:400. Далее, для каждой группы образцов были рассчитаны средние спектральные кривые, полученные путем усреднения спектров всех 20 образцов с применением стандартного нормального преобразования (SNV) для компенсации рассеивания света.
Анализ полученных средних спектральных кривых показывает наличие различий в спектральном отражении апельсинов с различной концентрацией пестицидов. В диапазоне 400-1000 нм спектры всех образцов демонстрируют схожие тенденции. Однако наблюдаются значительные различия в интенсивности отражения в отдельных спектральных диапазонах, а также области перекрытия спектров, что затрудняет визуальное определение концентрации пестицида. На спектрах наблюдаются минимумы отражения вблизи 670 нм и 980 нм, а также небольшой максимум в районе 700 нм. Кривые отражения образцов группы 400-650 нм практически совпадают, так же как и кривые отражения контрольной группы и образцов, обработанных пириметанилом, в диапазоне 900-1000 нм. Наиболее выраженные различия между спектрами наблюдаются в диапазоне длин волн 650-890 нм.
Выделение характерных длин волн
Метод анализа главных компонент (PCA)
Предварительно обработанные спектральные данные были проанализированы с использованием метода главных компонент для выделения ключевых спектральных признаков. Получены изображения главных компонент (PC) и оценен вклад каждой компоненты в общую дисперсию данных. Как правило, первая главная компонента (PC-1) отражает наибольшую часть информации об исходных данных, а первые несколько компонент суммарно описывают до 99% спектральной изменчивости. В данном исследовании первые четыре главные компоненты объясняют 99.87% общей дисперсии данных.
Для визуализации и анализа использовалось программное обеспечение ENVI. Теоретически, каждое изображение, соответствующее определенной главной компоненте, формируется в результате линейного преобразования цифровой матрицы исходных данных. С помощью программного обеспечения ENVI были рассчитаны ковариации, коэффициенты корреляции и собственные векторы для каждой главной компоненты. В основном, PC-1 содержит наибольший объем исходной информации, а изображения первых четырех главных компонент представлены в соответствующем разделе.
Для выделения характерных длин волн были проанализированы векторы признаков для PC-2 и PC-3. На основе анализа весовых коэффициентов для каждой длины волны были построены графики, представленные на Рисунке 4.5. В качестве характерных длин волн рассматривались те, что соответствовали пикам и впадинам на графиках весовых коэффициентов, поскольку именно они несут наибольшую информацию. Для PC-2 были выделены длины волн 500 нм, 680 нм и 980 нм, а для PC-3 - 500 нм, 580 нм, 850 нм и 930 нм. В конечном итоге, в качестве характерных были выбраны следующие длины волн: 500 нм, 580 нм, 680 нм, 850 нм, 930 нм и 980 нм.
Заключение
В рамках данного исследования была проведена предварительная обработка и анализ спектральных данных, полученных для апельсинов сорта "Навел", обработанных различными концентрациями пестицида пириметанила. С целью снижения размерности данных и выделения характерных длин волн были использованы методы анализа главных компонент (PCA) и анализа непрерывного проекционного профилирования (SPA). На основе выделенных длин волн были построены модели классификации, использующие машину опорных векторов (SVM), нейронную сеть BP и экстремальную обучающую машину (ELM). Сравнение эффективности различных методов снижения размерности и соответствующих моделей классификации позволило определить оптимальную модель для дифференциации концентрации пестицида на поверхности апельсинов.