Тамират Х и Йоханнес Т
Для организаций, ориентированных на информацию, качество данных является основным вопросом. Необходимость связывания географических данных для спецификаций качества стала особенно очевидной за последние тридцать лет. Данные собираются из различных источников и хранятся в базе данных. Различное происхождение и качество цифровых пространственных данных обычно интегрируются в среды ГИС, путем определения неопределенного уровня глобальной точности в таких системах. Однако в информационной системе проблемы с качеством данных могут возникнуть где угодно. Оценка данных - это процесс, используемый для определения неточных, неполных или необоснованных данных, а затем улучшения качества путем исправления обнаруженных ошибок и упущений. Эфиопский институт биоразнообразия был основан в 1976 году с главной целью обеспечения надлежащего сохранения и использования биоразнообразия страны. В этом контексте набор данных был создан после компиляции записей о встречаемости (более 81 500), из которых 8 147 являются видами масличных культур, полученными из базы данных института. Настоящее исследование направлено на оценку качества геопространственных наборов данных и записей по масличным культурам, которые позволяют получить доступ к базовым и расширенным функциям для обнаружения проблем полноты и согласованности, а также общих ошибок в существующих или наборах записей по сохранению биоразнообразия. При оценке пригодности для использования пространственного набора данных по масличным культурам был применен анализ запросов атрибутов. Подход анализа запросов атрибутов пространственного набора данных использовался для проверки значимости различий между ожидаемой и наблюдаемой степенью качества пространственных данных. Для сравнения ошибок между позиционной и атрибутивной точностью был использован подход анализа запросов атрибутов. Результаты показали, что 3357 записей (41,2%) были признаны хорошими по качеству, а остальные 4790 записей (58,8%) набора данных были ошибочными по разным причинам. В целом было обнаружено пять групп причин ошибок, которые могли возникнуть либо при сборе данных, либо при кодировании данных, либо на любых других этапах. Из всех ошибочных записей 357 ошибочных точек были исправлены с использованием методов анализа запросов Arc-GIS с поддержкой информации Google Earth и Diva-GIS, а также даны рекомендации для дальнейшего использования.