Большие Данные
Big Data
История понятия. Автор - Клиффорд Линч редактор журнала Nature. Время повеления – 3 сентября 2008 год. Место появления - журнал Nature, специальный выпуск, посвящённый взрывному росту мировых объёмов информации.
Смысловая основа понятия – понятие «данные». Данные – это информация об информации, то есть такая информация, которую нельзя напрямую использовать. Отсюда первый подход к определению понятия «большие данные» - структурный подход.
Большие данные – потоки неструктурированных данных, это информация, которая не имеет заранее определённой структуры или не организована в определённом порядке.
Вторая смысловая составляющая понятия – прилагательное «большие». Большие данные – потоки данных объемом свыше 100 гигабайт в сутки, это метаданные - данные о других данных, данные о «данных» об информации (греческого meta - выход за пределы).
Приведенные определения сфокусировались в подходе «три V». Большие данные – потоки данных с характеристиками «Три V»: volume – объём, velocity - скорость прироста и необходимость быстрой обработки данных, variety - одновременная обработка различных типов данных.
Но большие данные – это не столько «что», сколько «чем» и «как». Среди инструментов и методов Больших Данных: краудсорсинг, искусственные нейронные сети, смешение и интеграция данных, имитационное моделирование, машинное обучение, распознавание образов, визуализация аналитических данных.
Смысловая основа понятия – понятие «данные». Данные – это информация об информации, то есть такая информация, которую нельзя напрямую использовать. Отсюда первый подход к определению понятия «большие данные» - структурный подход.
Большие данные – потоки неструктурированных данных, это информация, которая не имеет заранее определённой структуры или не организована в определённом порядке.
Вторая смысловая составляющая понятия – прилагательное «большие». Большие данные – потоки данных объемом свыше 100 гигабайт в сутки, это метаданные - данные о других данных, данные о «данных» об информации (греческого meta - выход за пределы).
Приведенные определения сфокусировались в подходе «три V». Большие данные – потоки данных с характеристиками «Три V»: volume – объём, velocity - скорость прироста и необходимость быстрой обработки данных, variety - одновременная обработка различных типов данных.
Но большие данные – это не столько «что», сколько «чем» и «как». Среди инструментов и методов Больших Данных: краудсорсинг, искусственные нейронные сети, смешение и интеграция данных, имитационное моделирование, машинное обучение, распознавание образов, визуализация аналитических данных.