Оценка качества яблок с помощью гиперспектральной визуализации: выявление повреждений насекомыми
Одной из ключевых задач при оценке качества яблок является выявление повреждений, нанесенных насекомыми-вредителями, которые снижают пищевую ценность и товарный вид продукции. В настоящее время контроль качества осуществляется преимущественно по размеру и цвету плодов, а обнаружение дефектов от насекомых выполняется визуально, что является малоэффективным и субъективным. В связи с этим, разработка быстрых, надежных и неразрушающих методов контроля качества яблок является актуальной задачей. Гиперспектральная визуализация, сочетающая возможности спектрального анализа и обработки изображений, представляется перспективным решением для выявления внутренних и поверхностных дефектов фруктов.
Материалы и методы исследования
Объекты исследования:
- Использовались яблоки сорта Red Fuji (n=160), отобранные в демонстрационном саду.
- Диаметр плодов: 68,5-88 мм; масса: 128-211 г.
- Образцы были разделены на две группы: Поврежденные яблоки (n=80) с отверстиями сердцевинного червя (диаметр отверстий и зон некроза: 7-50 мм).
- Здоровые яблоки (n=80) с неповрежденной областью плодоножки/чашечки (размер области: 50-120 мм).
- Для построения модели использовались случайные выборки (n=50 для каждой группы), для верификации модели использовались оставшиеся образцы.
Оборудование:
- Гиперспектральная камера FS13 (Hangzhou Caipu Technology Co., Ltd.).
- Диапазон: 400-1000 нм.
- Разрешение: лучше 2,5 нм.
- Число каналов: до 1200.
- Скорость съемки: до 128 кадров/с (полный спектр), до 3300 Гц (выборочные диапазоны).
Рисунок 1 - Гиперспектральная камера FS13
Результаты и их обсуждение
Спектральный анализ относительного отражения
Проведен анализ спектральных кривых относительного отражения для различных областей интереса (поврежденная ткань, область плодоножки, область чашечки, здоровая ткань) на гиперспектральных изображениях яблок (80 поврежденных и 80 здоровых). Спектральные кривые для образцов одного типа демонстрировали высокую степень сходства, что указывает на воспроизводимость результатов. На Рисунке 2 представлены усредненные спектральные кривые относительного отражения для всех 160 образцов в диапазоне длин волн 400-1000 нм.
Рисунок 2 - Усредненные спектральные кривые относительного отражения для 160 образцов в диапазоне длин волн 400-1000 нм
Анализ спектральных кривых (Рисунок 2) выявил различия в спектральных характеристиках поврежденной ткани, области плодоножки, области чашечки и здоровой ткани яблок. В диапазоне 500-1000 нм относительное отражение здоровой ткани было выше, чем у поврежденной ткани, области плодоножки и области чашечки. Характерный пик поглощения при 680 нм в спектре здоровой ткани связан с поглощением света хлорофиллом, что отражает информацию о цвете поверхности плода. Поврежденная ткань, лишенная хлорофилла, демонстрировала значительно более низкое отражение при 680 нм по сравнению со здоровой тканью. Области плодоножки и чашечки, также характеризующиеся низким содержанием хлорофилла, демонстрировали низкое отражение. В диапазоне 500-700 нм среднее относительное отражение поврежденной ткани было ниже, чем у области плодоножки и области чашечки. В диапазоне 750-900 нм среднее относительное отражение поврежденной ткани находилось между значениями для области плодоножки и области чашечки. В большинстве образцов относительное отражение поврежденной ткани было ниже, чем у области чашечки, но выше, чем у области плодоножки.
Выбор характерных длин волн для разделения областей интереса
На основании анализа спектральных кривых (Рисунок 2) было установлено, что в диапазоне 800-980 нм максимальное различие в относительном отражении между поврежденной тканью и областями плодоножки/чашечки наблюдается при 900 нм. Однако, максимальная разница в спектре между поврежденной и здоровой тканью наблюдается при 824 нм, при этом разница в относительном отражении с областями плодоножки/чашечки также достаточно велика. Учитывая эти факторы, длина волны 824 нм была выбрана в качестве характеристической, поскольку обеспечивает наилучший контраст между поврежденной тканью, областями плодоножки/чашечки и здоровой тканью на гиперспектральных изображениях (Рисунки 3a, 3b, 3c).
Как показано на Рисунке 3, область яблока характеризуется более высоким значением оттенков серого, чем фон, что позволяет использовать пороговую сегментацию для получения двоичного изображения яблока. Последующие операции расширения и эрозии позволяют получить финальное двоичное изображение (Рисунки 3d, 3e, 3f). Данное изображение используется в качестве маски для устранения фонового шума и проведения анализа главных компонент (PCA) гиперспектрального изображения.
Рисунок 3 - Гиперспектральные изображения яблок
На основании анализа спектральных кривых (Рисунок 2) было установлено, что в диапазонах 400-500 нм и 980-1000 нм наблюдается значительный уровень шума. Кроме того, в диапазонах 500-620 нм и 950-980 нм спектральные характеристики поврежденной ткани близки к характеристикам области плодоножки, чашечки и здоровой ткани. В связи с этим, для PCA был выбран диапазон 620-950 нм. Результаты показывают, что в диапазоне 750-950 нм относительная отражательная способность поврежденной ткани перекрывается с данными области плодоножки/чашечки, что делает невозможным разделение этих областей с использованием ограниченного набора длин волн. В связи с этим, для сегментации необходимо использовать изображение главной компоненты (PC) с максимальным контрастом.
Рисунки 3g, 3h и 3i представляют собой PC1-изображения поврежденного яблока, области чашечки и области плодоножки, соответственно. Анализ данных изображений показал, что значения оттенков серого для поврежденной ткани, области плодоножки и области чашечки на PC1-изображениях относительно низкие, а границы с окружающими областями достаточно четкие. На основании этого, изображение PC1 было выбрано для дальнейшей обработки. Для определения границ поврежденной ткани, области плодоножки и области чашечки был применен метод сегментации с использованием максимального порога энтропии. Результаты сегментации представлены на Рисунках 3j, 3k и 3l.
Извлечение признаков
Если сегментированная область интереса на PC1-изображении содержит пиксели, то с высокой вероятностью эта область соответствует поврежденной ткани, области плодоножки или области чашечки. В этом случае извлекается изображение области интереса размером 160x120 пикселей, центрированное на данном пикселе. В случае, если сегментированная область интереса не содержит пикселей, считается, что анализируемый образец соответствует здоровому яблоку, и из PC1-изображения извлекается изображение области интереса размером 160x120 пикселей, центрированное в средней части яблока.
Таблица 1 - Статистический анализ текстурных признаков
В результате данной процедуры для 160 образцов яблок было получено 320 изображений областей интереса, для которых были рассчитаны четыре текстурные характеристики: энергия, энтропия, момент инерции и корреляция. Результаты статистического анализа текстурных характеристик для различных областей интереса представлены в Таблице 1.
Анализ текстурных характеристик и выводы исследования
Статистический анализ текстурных признаков (Таблица 1) выявил следующее:
- Среднее значение энергии для области повреждений насекомыми выше, чем для здоровой ткани и области плодоножки/чашечки, однако наблюдается перекрытие значений. Несмотря на высокую изменчивость данных для области повреждений, тест значимости подтверждает статистически значимые различия между средними значениями.
- Средние значения энтропии и момента инерции для области плодоножки/чашечки превышают значения для здоровой и поврежденной ткани. Перекрытие значений признаков между группами не исключает статистически значимых различий, подтвержденных результатами теста значимости.
- Для области плодоножки/чашечки характерно более низкое среднее значение корреляции по сравнению со здоровой и поврежденной тканью. Статистически значимые различия подтверждены результатами теста значимости.
Заключение
Данное исследование демонстрирует эффективность применения гиперспектральной визуализации для быстрой, неразрушающей и автоматизированной идентификации повреждений насекомыми и определения области плодоножки/чашечки на яблоках.
Основные выводы:
- В диапазоне 600-1000 нм наблюдаются различимые спектральные характеристики поврежденной ткани, здоровой ткани и области плодоножки/чашечки.
- Предложенная методика, включающая сегментацию, маскирование, анализ главных компонент и пороговую сегментацию PC1-изображений, обеспечивает эффективное выделение указанных областей интереса.
- Использование метода опорных векторов (SVM) для классификации с интеграцией текстурных и спектральных признаков позволяет достичь высокой точности распознавания повреждений насекомыми. Наилучший результат (97,8%) достигается при использовании изображений области интереса размером 160x120 пикселей и радиальной базисной функции (RBF) в качестве ядра SVM.