Description
Język R jest potężnym narzędziem używanym w statystyce, przetwarzaniu grafiki i programowaniu statystycznym; stanowi konkurencję dla komercyjnych systemów do obliczeń tego rodzaju. Zawiera wszystkie narzędzia, których potrzebują statystycy. Równocześnie jest to specyficzny język, przez co jego użytkowanie może sprawiać problemy. Zarówno proste, jak i złożone zadania są łatwe do wykonania, jeśli tylko wiadomo, w jaki sposób je zrobić. Jeżeli jednak trzeba stopniowo dochodzić do właściwego rozwiązania, może to kosztować sporo cierpliwości i zniechęcać.Oto zbiór 275 receptur instruktażowych, z których każda pomaga w rozwiązaniu konkretnego problemu. Wszystkie zostały starannie przetestowane i wielokrotnie dowodziły swojej przydatności. Każda z omawianych receptur została poprzedzona krótkim wprowadzeniem i omówieniem zastosowanych mechanizmów działania. Nie jest to klasyczny podręcznik programowania, jednak z pewnością przyśpieszy naukę praktycznego wykorzystania możliwości R. Jeśli masz już pewne doświadczenie z tym językiem, odświeżysz swoją wiedzę i uzyskasz szerszą perspektywę. Wśród receptur znajdziesz obejmujące szeroki zakres zadania – od podstawowych operacji na danych wejściowych i wyjściowych, poprzez statystykę ogólną, aż po grafikę i regresję liniową. Dowiesz się również, jak wykorzystać język R do wizualizacji danych za pomocą ciekawych wykresów graficznych.W tej książce między innymi:przygotowywanie danych wejściowych i upraszczanie danych wyjściowychmacierze, listy, wektory czynnikowe, ramki danychtesty statystyczne, przedziały ufności, prawdopodobieństwamodele statystyczne z wykorzystaniem regresji liniowej i analizy wariancjistosowanie zaawansowanych technik statystycznychR: błyskawicznie osiągniesz znakomite wyniki!Spis treści:1. Pierwsze kroki i uzyskiwanie pomocy 171.1. Pobranie i instalacja R 181.2. Instalacja środowiska RStudio 201.3. Uruchamianie środowiska RStudio 211.4. Wprowadzanie poleceń 231.5. Wyjście ze środowiska RStudio 241.6. Przerywanie realizacji kodu R 261.7. Przeglądanie dołączonej dokumentacji 271.8. Uzyskiwanie pomocy na temat funkcji 281.9. Wyszukiwanie dodatkowej dokumentacji 301.10. Uzyskiwanie pomocy na temat pakietu 311.11. Wyszukiwanie pomocy w internecie 321.12. Wyszukiwanie przydatnych funkcji i pakietów 351.13. Przeszukiwanie list dyskusyjnych 361.14. Przesyłanie pytań do serwisu Stack Overflow lub innego 372. Garść podstaw 412.1. Wyświetlanie interesujących nas danych na ekranie 412.2. Wyznaczanie zmiennych 432.3. Tworzenie listy zmiennych 442.4. Usuwanie zmiennych 462.5. Tworzenie wektorów 472.6. Obliczanie podstawowych statystyk 492.7. Tworzenie sekwencji 512.8. Porównywanie wektorów 522.9. Wybieranie elementów wektora 542.10. Wykonywanie obliczeń wektorowych 572.11. Ustalanie pierwszeństwa operatorów 592.12. Osiąganie więcej przy mniejszej liczbie znaków 612.13. Tworzenie strumienia wywołań funkcji 622.14. Unikanie najpowszechniejszych pomyłek 653. Korzystanie z oprogramowania 713.1. Sprawdzanie i wyznaczanie katalogu roboczego 713.2. Tworzenie nowego projektu RStudio 723.3. Zapisywanie przestrzeni roboczej 743.4. Przeglądanie historii wpisanych poleceń 753.5. Zapisywanie wyniku wcześniejszego polecenia 763.6. Wyświetlanie załadowanych pakietów poprzez ścieżkę wyszukiwania 773.7. Przeglądanie listy zainstalowanych pakietów 793.8. Uzyskiwanie dostępu do funkcji zawartych w pakiecie 803.9. Uzyskiwanie dostępu do wbudowanych zestawów danych 813.10. Instalowanie pakietów z repozytorium CRAN 823.11. Instalowanie pakietu z serwisu GitHub 843.12. Wyznaczanie lub zmiana domyślnego serwera CRAN 853.13. Uruchamianie skryptu 863.14. Uruchamianie skryptu wsadowego 873.15. Wyszukiwanie katalogu domowego R 893.16. Personalizowanie rozruchu R 913.17. Korzystanie z R i RStudio w chmurze 944. Dane wejściowe i wyjściowe 974.1. Wprowadzanie danych za pomocą klawiatury 974.2. Wyświetlanie mniejszej (lub większej) liczby znaków 984.3. Przekierowywanie wyników do pliku 1004.4. Wyświetlanie listy plików 1014.5. Problem z otwieraniem pliku w systemie Windows 1034.6. Odczytywanie rekordów o stałej szerokości 1044.7. Odczytywanie plików danych tabelarycznych 1074.8. Odczytywanie plików CSV 1104.9. Zapisywanie danych w pliku CSV 1124.10. Odczytywanie danych tabelarycznych lub CSV z internetu 1134.11. Odczytywanie danych z arkuszy Excel 1144.12. Zapisywanie ramki danych w pliku Excel 1164.13. Odczytywanie danych z pliku SAS 1184.14. Odczytywanie danych z tabel HTML 1204.15. Odczytywanie plików o skomplikowanej strukturze 1224.16. Odczyt baz danych MySQL 1264.17. Uzyskiwanie dostępu do bazy danych za pomocą pakietu dbplyr 1294.18. Zapisywanie i transportowanie obiektów 1315. Struktury danych 1355.1. Dodawanie danych do wektora 1425.2. Wstawianie danych do wektora 1445.3. Reguła zawijania 1445.4. Tworzenie wektora czynnikowego (zmiennej kategorialnej) 1465.5. Łączenie wielu wektorów w jeden wektor i wektor czynnikowy 1475.6. Tworzenie listy 1495.7. Wybieranie elementów listy za pomocą ich pozycji 1505.8. Wybieranie elementów listy po nazwie 1525.9. Tworzenie listy asocjacyjnej nazwa/wartość 1535.10. Usuwanie elementu z listy 1555.11. Spłaszczanie listy do postaci wektora 1565.12. Usuwanie elementów o wartości NULL z listy 1575.13. Warunkowe usuwanie elementów listy 1585.14. Inicjowanie macierzy 1595.15. Wykonywanie operacji macierzowych 1615.16. Nadawanie nazw opisowych rzędom i kolumnom macierzy 1625.17. Wybór jednego rzędu/kolumny macierzy 1635.18. Inicjowanie ramki danych z danymi kolumny 1645.19. Inicjowanie ramki danych z danymi rzędu 1655.20. Dołączanie rzędów do ramki danych 1685.21. Wybór kolumn ramki danych za pomocą pozycji 1705.22. Wybór kolumn ramki danych za pomocą nazwy 1745.23. Zmienianie nazw kolumn w ramce danych 1755.24. Usuwanie wartości NA z ramki danych 1765.25. Wykluczanie kolumn za pomocą nazwy 1775.26. Łączenie dwóch ramek danych 1785.27. Scalanie kolumn dwóch ramek danych 1795.28. Przekształcanie jednej wartości atomowej w inną 1815.29. Przekształcanie jednego ustrukturyzowanego typu danych w inny 1836. Przekształcenia danych 1876.1. Stosowanie funkcji wobec każdego elementu listy 1876.2. Stosowanie funkcji wobec każdego rzędu ramki danych 1906.3. Stosowanie funkcji wobec każdego rzędu macierzy 1916.4. Stosowanie funkcji wobec każdej kolumny 1926.5. Stosowanie funkcji wobec wektorów równoległych lub list 1946.6. Stosowanie funkcji wobec grup danych 1966.7. Tworzenie nowej kolumny na podstawie jakiegoś warunku 1977. Łańcuchy znaków i daty 1997.1. Uzyskiwanie długości łańcucha znaków 2017.2. Łączenie łańcuchów znaków 2027.3. Wydobywanie fragmentów łańcuchów znaków 2037.4. Rozdzielanie łańcucha znaków zgodnie z rozgranicznikiem 2047.5. Zastępowanie fragmentów łańcuchów znaków 2057.6. Tworzenie wszystkich kombinacji par łańcuchów znaków 2067.7. Uzyskiwanie bieżącej daty 2087.8. Przekształcanie łańcucha znaków w obiekt Date 2087.9. Przekształcanie obiektu Date w łańcuch znaków 2097.10. Przekształcanie roku, miesiąca i dnia w obiekt Date 2107.11. Uzyskiwanie daty juliańskiej 2117.12. Wydobywanie elementów składowych daty 2127.13. Tworzenie sekwencji dat 2138. Prawdopodobieństwo 2158.1. Wyznaczanie liczby kombinacji 2178.2. Generowanie kombinacji 2188.3. Generowanie liczb losowych 2198.4. Generowanie odtwarzalnych liczb losowych 2208.5. Generowanie próby losowej 2228.6. Generowanie sekwencji losowych 2238.7. Losowe permutacje wektora 2248.8. Obliczanie prawdopodobieństwa rozkładów dyskretnych 2258.9. Obliczanie prawdopodobieństwa rozkładów ciągłych 2268.10. Przekształcanie prawdopodobieństw w kwantyle 2288.11. Tworzenie wykresu funkcji gęstości 2299. Statystyka ogólna 2359.1. Podsumowywanie danych 2379.2. Obliczanie częstości względnych 2399.3. Zestawianie wektorów czynnikowych w tabeli i tworzenie tablic wielodzielczych 2409.4. Sprawdzanie niezależności zmiennych kategorialnych 2419.5. Obliczanie kwantylów (i kwartylów) zestawu danych 2429.6. Uzyskiwanie odwrotności kwantylu 2439.7. Normalizowanie danych 2449.8. Testowanie średniej próby (test t) 2449.9. Kształtowanie przedziału ufności dla średniej 2469.10. Kształtowanie przedziału ufności dla mediany 2479.11. Testowanie proporcji próby 2489.12. Kształtowanie przedziału ufności dla proporcji 2499.13. Testowanie pod względem rozkładu normalnego 2509.14. Testowanie przebiegów 2519.15. Porównywanie średnich dwóch prób 2529.16. Nieparametryczne porównywanie położenia dwóch prób 2549.17. Testowanie korelacji pod względem istotności 2569.18. Testowanie grup pod względem równych proporcji 2579.19. Porównywanie parami średnich poszczególnych grup 2599.20. Testowanie dwóch prób w kontekście tego samego rozkładu 26010. Grafika 26310.1. Tworzenie wykresu punktowego 26710.2. Wstawianie tytułu i etykiet 26710.3. Dodawanie (lub usuwanie) siatki 26910.4. Stosowanie motywu wobec wykresu ggplot 27210.5. Tworzenie wielogrupowego wykresu punktowego 27710.6. Dodawanie (lub usuwanie) legendy 27810.7. Rysowanie linii regresji na wykresie punktowym 28210.8. Tworzenie wykresów par zmiennych 28510.9. Tworzenie wykresów punktowych dla poszczególnych grup danych 28710.10. Tworzenie wykresu kolumnowego 28910.11. Umieszczanie przedziałów ufności na wykresie kolumnowym 29210.12. Wprowadzanie kolorów na wykresie kolumnowym 29510.13. Rysowanie linii łączącej pary punktów x i y 29710.14. Zmiana rodzaju, szerokości i koloru linii 29710.15. Tworzenie wykresu zawierającego wiele zestawów danych 30110.16. Dodawanie linii pionowych lub poziomych 30210.17. Tworzenie wykresu pudełkowego 30410.18. Tworzenie po jednym wykresie pudełkowym na każdy poziom wektora czynnikowego 30610.19. Tworzenie histogramu 30810.20. Dodawanie oszacowania gęstości do histogramu 31010.21. Tworzenie standardowego wykresu kwantyl-kwantyl 31110.22. Tworzenie innych wykresów kwantyl-kwantyl 31410.23. Rysowanie zmiennej w różnych kolorach 31610.24. Tworzenie wykresu funkcji 31910.25. Wyświetlanie wielu wykresów na jednej stronie 32110.26. Zapisywanie wykresu do pliku 32411. Regresja liniowa i analiza ANOVA 32711.1. Przeprowadzanie prostej analizy liniowej 32911.2. Przeprowadzanie wielorakiej regresji liniowej 33111.3. Uzyskiwanie statystyk regresji 33211.4. Omówienie podsumowania regresji 33511.5. Przeprowadzanie regresji liniowej bez użycia punktu przecięcia z osią współrzędnych 33811.6. Przeprowadzanie regresji wyłącznie przy użyciu zmiennych ściśle skorelowanych ze zmienną objaśnianą 33911.7. Przeprowadzanie regresji liniowej z członami interakcyjnymi 34211.8. Wybór najlepszych zmiennych regresji 34411.9. Przeprowadzanie regresji na podzbiorze danych 34911.10. Korzystanie ze wzorów w równaniu regresji 35011.11. Przeprowadzanie regresji względem wielomianu 35111.12. Regresja względem przekształconych danych 35311.13. Wyszukiwanie najlepszego przekształcenia potęgowego (procedura Boxa-Coxa) 35511.14. Kształtowanie przedziałów ufności dla współczynników regresji 35911.15. Tworzenie wykresu elementów resztowych regresji 36011.16. Diagnozowanie regresji liniowej 36111.17. Wykrywanie najbardziej znaczących obserwacji 36411.18. Testowanie wartości resztowych pod względem autokorelacji (test Durbina-Watsona) 36611.19. Przewidywanie nowych wartości 36711.20. Kształtowanie przedziałów predykcji 36811.21. Przeprowadzanie jednoczynnikowej analizy ANOVA 36911.22. Tworzenie wykresu interakcji 37111.23. Wyszukiwanie różnic pomiędzy średnimi grup 37211.24. Przeprowadzanie odpornej analizy ANOVA (test Kruskala-Wallisa) 37511.25. Porównywanie modeli za pomocą analizy ANOVA 37612. Przydatne sztuczki 37912.1. Zaglądanie do danych 37912.2. Wyświetlanie rezultatu przypisania 38012.3. Sumowanie rzędów lub kolumn 38212.4. Wyświetlanie danych w kolumnach 38312.5. Grupowanie danych w przedziały 38412.6. Określanie położenia danej wartości 38512.7. Wybieranie co n-tego elementu wektora 38512.8. Określanie minimów i maksimów 38612.9. Tworzenie wszystkich kombinacji kilku zmiennych 38812.10. Spłaszczanie ramki danych 38912.11. Sortowanie ramki danych 39012.12. Usuwanie atrybutów ze zmiennej 39112.13. Odkrywanie struktury obiektu 39212.14. Obliczanie czasu potrzebnego na realizację kodu 39512.15. Wstrzymywanie ostrzeżeń i komunikatów o błędach 39612.16. Pobieranie argumentów funkcji z listy 39712.17. Definiowanie własnych operatorów binarnych 39912.18. Blokowanie komunikatu rozruchowego 40112.19. Przeglądanie i wyznaczanie zmiennych środowiskowych 40112.20. Używanie sekcji kodu 40212.21. Równoległe przetwarzanie kodu R na komputerze lokalnym 40312.22. Równoległe przetwarzanie kodu R w sposób zdalny 40613. Zaawansowane obliczenia numeryczne i statystyczne 41113.1. Minimalizowanie lub maksymalizowanie funkcji jednoparametrowej 41113.2. Minimalizowanie lub maksymalizowanie funkcji wieloparametrowej 41213.3. Obliczanie wartości własnych i wektorów własnych 41413.4. Przeprowadzanie analizy głównych składowych 41513.5. Przeprowadzanie prostej regresji ortogonalnej 41613.6. Wyszukiwanie skupień w danych 41813.7. Przewidywanie zmiennej binarnej (regresja logistyczna) 42113.8. Metody samowsporne 42313.9. Analiza czynnikowa 42514. Analiza szeregów czasowych 43114.1. Reprezentowanie danych szeregów czasowych 43314.2. Tworzenie wykresów danych szeregów czasowych 43614.3. Wydobywanie najstarszych lub najnowszych obserwacji 43714.4. Tworzenie podzbiorów z szeregów czasowych 43914.5. Scalanie kilku szeregów czasowych 44114.6. Uzupełnianie brakujących obserwacji w szeregach czasowych 44314.7. Opóźnianie lub przyspieszanie szeregu czasowego 44614.8. Obliczanie kolejnych różnic 44714.9. Wykonywanie obliczeń na szeregu czasowym 44914.10. Obliczanie średniej kroczącej 45014.11. Stosowanie funkcji przy uwzględnieniu okresu kalendarzowego 45114.12. Stosowanie funkcji rozwijającej 45314.13. Tworzenie wykresu funkcji autokorelacji 45514.14. Testowanie szeregów czasowych pod kątem autokorelacji 45614.15. Tworzenie wykresu funkcji autokorelacji cząstkowej 45714.16. Wyszukiwanie korelacji opóźnionych pomiędzy dwoma szeregami czasowymi 45914.17. Usuwanie trendów z szeregów czasowych 46114.18. Dopasowywanie modelu ARIMA 46314.19. Usuwanie nieistotnych współczynników z modelu ARIMA 46614.20. Diagnozowanie modelu ARIMA 46814.21. Uzyskiwanie prognoz z modelu ARIMA 47014.22. Tworzenie wykresu prognoz 47114.23. Sprawdzanie występowania zjawiska równania do średniej w szeregu czasowym 47214.24. Wygładzanie szeregu czasowego 47515. Elementy prostego programowania 47915.1. Wybór pomiędzy dwiema alternatywnymi opcjami: if/else 48015.2. Przetwarzanie w pętli 48215.3. Definiowanie funkcji 48315.4. Tworzenie zmiennej lokalnej 48515.5. Wybór pomiędzy wieloma alternatywnymi ścieżkami: funkcja switch 48515.6. Definiowanie wartości domyślnych parametrów 48715.7. Sygnalizowanie błędów 48815.8. Ochrona przed błędami 48915.9. Tworzenie funkcji anonimowej 49015.10. Tworzenie zbioru funkcji wielokrotnego użytku 49115.11. Automatyczne formatowanie kodu 49216. Środowisko R Markdown i publikowanie 49516.1. Tworzenie nowego dokumentu 49616.2. Dodawanie tytułu, danych autora i daty 49816.3. Formatowanie dokumentu tekstowego 49916.4. Wstawianie nagłówków dokumentu 50016.5. Wstawianie listy 50016.6. Prezentowanie wyników kodu R 50216.7. Kontrolowanie wyświetlania kodu i wyników 50316.8. Wstawianie wykresu 50516.9. Wstawianie tabeli 50716.10. Wstawianie wygenerowanej tabeli 50916.11. Wstawianie równań matematycznych 51216.12. Generowanie wyniku w formacie HTML 51316.13. Generowanie wyniku w formacie PDF 51416.14. Generowanie wyników w formacie Microsoft Word 51616.15. Generowanie pliku prezentacji 52216.16. Tworzenie parametryzowanego raportu 52416.17. Organizowanie pracy z dokumentami R Markdown 527
Informatyka
podwójna składka zdrowotna, jeep grand cherokee sprzedam, wartość dolara, ulga na.dziecko 2022, rosja, bergen zimą, a1 zus, wskaźnik g dla gmin 2020, czy będąc na zwolnieniu lekarskim można prowadzić działalność gospodarczą, odyseusz podróż, winiety holandia gdzie kupić mapa, śmigłowiec sokół, ustawienie satelity cyfrowy polsat, gwiazdy na fladze ue, lotos konin, korea waluty
yyyyy