GNU R to język programowania i środowisko do obliczeń statystycznych i wizualizacji wyników.
Każdy czytelnik w tym miejscu może zadawać sobie zasadnicze pytanie:
co można w tym zrobić i dlaczego lepej niżeli w moim języku programowania ?.
Oto kilka cech, które pozostawiają w tyle moje ulubiony języki programowania i skłaniają mnie do użycia języka R:
- dostarcza szeroką gamę technik statystycznych (liniowe i nieliniowe modelowanie, klasyczne testy statystyczne, analiza szeregów czasowych, klasyfikacja, grupowanie, etc)
- łatwość z jaką można tworzyć dobrze zaprojektowane wykresy z jakością nadającą się do publikacji. Dotyczy to także symboli i formuł matematycznych
- repozytorium pakietów CRAN, które zawiera ponad 1500 gotowych bibliotek do użytku w naszych statystykach - zaimplementowana jest spora liczba metod oraz przekształceń statystycznych
- tekstowa i graficzna konsola obsługi, jak również możliwość uruchamiania przygotowanych skryptów
- stworzenie wykresu często polega na wczytaniu w jednej linii danych ze źródła siecowego, plikowego, w tym popularne formaty CSV oraz Excel ! przypisaniu do zmiennej oraz w kolejnej linii wywołana funkcji plot() ze zminną(zmiennymi) przechowującą(przechowującymi) dane w argumencie. Efekt jest widoczny natychmiast w specjalnym oknie graficzym wykresów
- powalająca na kolana baza rodzajów wykresów w postaci galerii z przykładami kodu w języku R
- polecenia języka są intuicyjne i uproszczone do niezbędnego minimum:
- package.install("nazwaPakietu", depedencies=TRUE) - dodawania pakietu, w efekcie czego pakiet jest pobierany z wskazanego repozytorum CRAN oraz kompilowany wraz z dokumentacją i przykładami użycia
- library("NazwaBiblioteki") - użycie zainstalowanej biblioteki
- nazwaBibliotek.funcka(argumenty) - użycie funckcji z biblioteki
- tworzenie interaktywnych wykresów oraz możliwość używania akceleratorów grafiki 3D w wykresach
- wbudowane przestrzenie nazw, profiler, debuger, garbage collector :-), których niekiedy może pozazdrościć język PHP
- programowanie objaśniającego (pakiet Sweave)
- funkcje statystyczne do przeprowadzania analizy regresji i analizy wariancji
- funkcje do przeprowadzania klasyfikacji oraz analizy klastrowania
- generatory liczb losowych oraz generatory liczb losowych z określonych rodzin rozkładów prawdopodobieństwa
- funkcje do radzenia sobie z brakującymi obserwacjami oraz wstępną analizą danych
- funkcje do korzystania z metody bootstrap i analizy przeżycia
- prognozowanie na podstawie posiadanych danych !
- możliwa edukacja w zakresie testów statystycznych dotyczących testowania hipotez o równości parametrów położenia, o równości parametrów skali, dotyczących prawdopodobieństwa sukcesu, procedury testowania istotności dla wybranych współczynników zależności pomiędzy dwoma zmiennymi oraz testy zgodności
Przegląd możliwości systemu R w wygodny sposób zarysowuje możliwości tego specyficznego języka programowania. Liczne prezentacje oraz artykuły umacnają mnie w przekonaniu, że warto wykreślać w tym języku wykresy z danych pomiarowych, szczególnie jeśli zależy mi na dokładności oraz pewności, że dany wykres reprezentuje wskazaną porcję danych.
Brak komentarzy:
Prześlij komentarz