Методы прогнозирования. Технологии.
Добро пожаловать на Форум о прогнозах и прогнозировании. Если это ваш первый визит, рекомендуем ознакомиться с правилами форума и зарегистрироваться. Для размещения своих сообщений необходимо зарегистрироваться. Для просмотра сообщений выберите раздел.
Весьма известный термин и практикам вроде интуитивно понятен.
Но с определением не совсем понятно. Возьмём например:
http://www.basegroup.ru/tasks/datamining.html
Полный сумбур. Мол бурём всё что есть и пробуем. Что-то да сработает.
Кроме того, используют только с социально-экономических направлениях. Больше нигде не слышно. или я не прав?
Offline
Неужели нет специалистов в этой области? Или никто не разбирается в данном вопросе.
Что такое Data mining?
Offline
Да это целая куча методов и куча задач. Так же, как и "статистика" Поэтому слишком уж универсальный термин и вызывает некоторое удивление-непонимание.
Отличие (не совсем обязательное) - в нацеленности на такие большие объемы данных, которые тяжело или невозможно тянуть классическими методами.
Направления использования - везде, где есть гигантские потоки данных, а сейчас это и задачи биоинформатики с расшифровкой геномов, определением типа свертываемости белков и т.д, и ядреная физика с данными от ускорителей, и фильтрация электропочты (всякие там системы типа Эшелона), и контекстная реклама в интернет-поисковиках, и системы рекомендаций смежных товаров при выборе-заказе в инет-магазине. Т.е. это не только и не столько методы предварительной раскопки задачи и определения, чего же можно отковать, но и собственно методы решения тяжелых индустриальных задач прогноза, классификации, определения близости ситуации к какой-то из эталонных ситуаций, выделения этих самых эталонных ситуаций, определения информативных признаков для всех этих задач.
Насчет неудачности определения (вернее, расшифровки термина) - это на указанный сайт, пинать авторов той статьи
Отредактировал Victor G. Tsaregorodtsev (25.08.2007 09:15)
Offline
Спасибо за отзыв.
А не попытка ли это объять необъятное? Когда мы говорим "статистика", то, как правило, обязаны уточнить о чём речь (дескритиптивная, многомерная и т.п., а лучше назвать определённые методы). Мне, как экологу, не всегда понятно, о чём речь когда говорят просто о "добыче данных". Статистика это тоже добыча данных. Что такое искусственный интеллект (экспертные системы, ИНС и др.) я в принципе понимаю, да и применение этих методов в биологии наглядно, но Data mining это что-то невнятное (ИМХО).
Кстати, а где вам приходилось встречать примеры применения Data mining в биоинформатике? Я видел только примеры исследования в экономике (потреб. корзина, спрос и т.п.) и информатике (фильтрация почты).
Offline
В биоинформатике вроде сейчас народ активно прибивается по обработке microarrays, анализом геномов.
По ДМ есть универсальный ресурс kdnuggets.com, но будет ли там хоть как-то отражена биоинформатика - не знаю / не помню.
Offline
В биоинформатике есть ещё одна область применения для Dm как мне кажется. Существует масса баз данных с биологическим наполнением. Причём я имею в виду по большей части именно слабо упорядоченную информацию вроде экологической. Есть данные по компонентам биоразнообразия, есть данные по физическим данным среды. Вот куда бы мощные механизмы применять. Например как получить экологическую карту, чтобы на ней были отражены взаимодействия видов и как с помощью полученных паттернов осуществлять прогноз???
Offline