Поиск по блогу

среда, 24 декабря 2014 г.

Video from Stanford Две двухчасовых лекции о R

Надеюсь, что это то, что надо. Материалов по R в сети, пожалуй больше, чем по всем остальным пакетам. Первое впечатление про R я сформировал более года назад, и теперь хочу знать R не хуже, чем Python. Так что начать со Стэнфорда в самый раз. Здесь есть еще пара ссылок на короткие ролики.
И ссылка на rseek.org и на Rmagic-Functions-Extension для Ipython Notebook

вторник, 23 декабря 2014 г.

Processing Text In RapidMiner

Видео автора el chief мне понравились, все кратко и по делу. Просмотр подбрки видео об обработке текстов (5 штук) помог вспомнить основные подходы и этапы tokenizing, stemming, stopwords, and n-grams, Text Association Rules... Кроме того здесь еще две важные ссылки Top 16 free software for text analysis Text Mining, кластеризация текста в RapidMiner

RapidMiner: Нормализация, дискретизация данных

Кроме видео, здесь еще копипаст из документации с описанием 4-х вариантов нормализации

суббота, 20 декабря 2014 г.

RapidMiner: преобразование и фильтрация данных в таблицах, расширение таблиц

как объединять и/или склеивать таблицы, добавлять/убирать столбцы и строки, создавать новые столбцы из старых, формировать случайные и не очень выборки.
Здесь собрались три видеоролика с операторами: Read Database (только в платной версии), Read Excel, Read CSV, Rename, Set Role, Join, Append ... RapidMiner Extract Transform Load - Sampling, Selecting Rows, Filter Examples, Select Attributes... Generate Attributes

RapidMiner. Роли не надо путать с типами данных и переименованием столбцов

Я привык строить диаграммы в Statistica. Там сразу же можно было задавать функции, аргументы и параметры. А здесь поиск привел меня к новому понятию - "Роль". Получается, что надо сначала переназначить роль метки (Label), а потом строить диаграмму с параметрами. Set Role operator should not be confused with Rename operator or Type Conversion operators