представляют собой описательные данные, включая, например, описание истории обработки данных; системы больших данных спроектированы для выполнения распределенной обработки данных, в том числе тех. которые являются внешними и не находятся под контролем системы больших данных, поэтому использование метаданных становится все более значимой концепцией; большие данные повторно используются для целей, не связанных с целями, для которых они собирались, поэтому важно, чтобы любые данные, доступ к которым предоставляется другим сторонам, были снабжены адекватными метаданными; метаданные также включают в себя сведения об источниках данных и об использовании данных; их можно разделить на бизнес- и технические метаданные.
На максимальном уровне метаданные делятся на следующие группы:
Метаданные общего назначения.... Специфические или уникальные метаданные.... Другим методом классификации метаданных является классификация по разным параметрам:
Метаданные сферы... Метаданные технической сферы.
Метаданные различных процессов.... Фиксируется схемой метаданных, отражающей состав и структуру компонентов данных в объекте метаданных,
Приводятся краткие сведения о методологии метауправления и описывается подход, обеспечивающий независимость реализации метауправления в информационных системах от конкретного языка представления и средства доступа к метаданным.
При этом, постоянное применение в информационных системах данных и метаданных предполагает последовательное... семантических исследований, базовыми структурными элементами которых считаются объекты данных, объекты метаданных... Организация метаданных, основные понятия, правила использования, работа с метаданными.
Проанализированы взгляды на объем понятия «метаданные». Метаданные рассматриваются как вторично-информационное явление и разновидность информационного ресурса, которому присущи все свойства данных феноменов. Cопоставлены широкий и узкий подходы к этому понятию. Приводятся доказательства того, что метаданные это вторичная машиночитаемая информация, причем указывается, что ряд метаданных, перечисленных авторами публикаций по данной теме, не укладывается в «лоно» вторичной информации. Проведенный анализ позволяет сделать вывод о разнородности феномена «метаданные» и полисемичности термина «метаданные».
метод обучения без учителя, обнаруживающий ассоциации среди элементов данных, например товары, которые часто покупают вместе; есть три типичные ассоциативные метрики: поддержка {X} показывает, как часто появляется X; достоверность {X->Y} показывает, как часто Y появляется в присутствии X; лифт {X->Y} показывает то, как часто X и Y появляются вместе, в сравнении с тем, как часто они появляются по отдельности.