как объединять и/или склеивать таблицы, добавлять/убирать столбцы и строки, создавать новые столбцы из старых, формировать случайные и не очень выборки.
Здесь собрались три видеоролика с операторами: Read Database (только в платной версии), Read Excel, Read CSV, Rename, Set Role, Join, Append ... RapidMiner Extract Transform Load - Sampling, Selecting Rows,
Filter Examples, Select Attributes... Generate Attributes
Оказывается, что у этого автора подборка из 1000 видеороликов, вот ссылка на страницу
PlayLists, среди которых обязателно надо посмотреть Text mining, web crawling
Краткое содержаеие ролика¶
from IPython.display import Image
Image("C:\\Users\\kiss\\Pictures\\pythonR\\rm_1.png")
Read Database (только в платной версии), но здесь видно, как легко можно использовать SQL Запросы.
Read Excel позволяет импоритровать диапазон,
Read CSV - отличный визард,
Rename - переименовывает столбцы,
Set Role - выполняет роль первичного ключа при слиянии таблиц (пока не пробовал),
Join - команда объединения (только) двух таблиц (по ключу ?),
Append - это команда (простого) приклеивания новых столбцов к таблице(не уверен, проверить !)
RapidMiner Extract Transform Load - Sampling, Selecting Rows
Sample - формирование случайной выбокри из таблицы,
Filter Examples - фильтруем строки ...и не забыть, что есть еще доп. фильтры для дубликатов...,
Select Attributes - а это (по сути) выбор столбцов
RapidMiner Extract Transform Load Transforming Attributes with Functions
Generate Attributes - This operator constructs new user defined attributes using mathematical expressions
Это очень полезная функция для добавления списком новых столбцов, как числовых, так и строковых, для построения новых строк можно использовать фильтры и регулярные выражения
Посты чуть ниже также могут вас заинтересовать
Комментариев нет:
Отправить комментарий