Пономаренко Роман
@rerand0m
rerandom@ispras.ru
[ Строка на входе -> строка на выходе ]
Для реализации нужно создать java класс, наследник org.apache.hadoop.hive.ql.exec.UDF, и реализовать в нём метод evaluate().
В HQL создать функцию на основе этого класса: CREATE TEMPORARY FUNCTION <my_udf> AS '<my.udf.class>'.
(Не забыв при этом положить jar в dfc)
[ Строка на входе -> таблица на выходе ]
Для реализации нужно создать java класс, наследник org.apache.hadoop.hive.ql.udf.generic.GenericUDTF, и реализовать в нём методы initialize(), process(), close().
В HQL создать функцию на основе этого класса: CREATE TEMPORARY FUNCTION <my_udf> AS '<my.udf.class>'.
(Не забыв при этом положить jar в dfc)
Ещё более лютая штука для агрегации.
В домашке не будет, но если хотите углубиться, вот линк.