Algorytmy Data Science. Siedmiodniowy przewodnik. Wydanie II

34.06

Opis

Data science jest interdyscyplinarną dziedziną naukową łączącą osiągnięcia uczenia maszynowego, statystyki i eksploracji danych. Umożliwia wydobywanie nowej wiedzy z istniejących danych poprzez stosowanie odpowiednich algorytmów i analizy statystycznej. Stworzono dotąd wiele algorytmów tej kategorii i wciąż powstają nowe. Stanowią one podstawę konstruowania modeli umożliwiających wyodrębnianie określonych informacji z danych odzwierciedlających zjawiska zachodzące w świecie rzeczywistym, pozwalają też na formułowanie prognoz ich przebiegu w przyszłości. Algorytmy data science są postrzegane jako ogromna szansa na zdobycie przewagi konkurencyjnej, a ich znaczenie stale rośnie.Ta książka jest zwięzłym przewodnikiem po algorytmach uczenia maszynowego. Jej cel jest prosty: w ciągu siedmiu dni masz opanować solidne podstawy siedmiu najważniejszych dla uczenia maszynowego algorytmów. Opisom poszczególnych algorytmów towarzyszą przykłady ich implementacji w języku Python, a praktyczne ćwiczenia, które znajdziesz na końcu każdego rozdziału, ułatwią Ci lepsze zrozumienie omawianych zagadnień. Co więcej, dzięki książce nauczysz się właściwie identyfikować problemy z zakresu data science. W konsekwencji dobieranie odpowiednich metod i narzędzi do ich rozwiązywania okaże się dużo łatwiejsze.W tej książce:efektywne implementacje algorytmów uczenia maszynowego w języku Pythonklasyfikacja danych przy użyciu twierdzenia Bayesa, drzew decyzyjnych i lasów losowychpodział danych na klastery za pomocą algorytmu k-średnichstosowanie analizy regresji w parametryzacji modeli przewidywańanaliza szeregów czasowych pod kątem trendów i sezonowości danychAlgorytmy data science: poznaj, zrozum, zastosuj!Spis treści:O autorzeO recenzentachPrzedmowaDo kogo kierujemy tę książkę?Co zawiera ta książka?Jak najlepiej wykorzystać tę książkę?Kod przykładowych programówKonwencje typograficzne stosowane w książceRozdział 1. Klasyfikacja na podstawie najbliższego sąsiedztwaSubiektywne odczuwanie temperaturyImplementacja algorytmu k najbliższych sąsiadówDane wejścioweWynik klasyfikacjiWizualizacjaMapa Włoch przykład doboru wartości kAnalizaSkalowanie danych prognozowanie statusu własnościAnalizaNieeuklidesowe metryki odległości punktów klasyfikowanie tekstówAnalizaKlasyfikowania tekstów ciąg dalszy wielowymiarowy algorytm k-NNAnalizaPodsumowanieProblemySubiektywne odczuwanie temperaturyMapa Włoch przykład doboru wartości kStatus własnościAnalizaRozdział 2. Naiwny klasyfikator bayesowskiTesty medyczne podstawowe zastosowanie twierdzenia BayesaAnalizaPodstawowe twierdzenie Bayesa i jego rozszerzenieTwierdzenie BayesaDowódRozszerzone twierdzenie BayesaDowódZagramy w szachy? niezależne zdarzenia warunkująceAnalizaImplementacja naiwnego klasyfikatora bayesowskiegoDane wejścioweWynikZagramy w szachy? częściowo zależne zdarzenia warunkująceAnalizaDane wejścioweWynikChłopak czy dziewczyna? twierdzenie Bayesa dla ciągłych zmiennych losowychAnalizaPodsumowanieProblemyAnalizaRozdział 3. Drzewa decyzyjnePływamy? reprezentowanie danych w postaci drzewa decyzyjnegoElementy teorii informacjiEntropia informacyjnaPrzykład losowe rzucanie monetąDefinicjaZysk informacyjnyPływamy? obliczanie zysku informacyjnegoAlgorytm ID3 konstruowanie drzewa decyzyjnegoPływamy? budowanie drzewa decyzyjnegoImplementacja w języku PythonDane wejścioweWynikKlasyfikowanie danych za pomocą drzew decyzyjnychPrzykład pływamy czy nie?Przykład gra w szachy pod chmurkąAnalizaDane wejścioweWynikowe drzewo decyzyjneKlasyfikacjaNa zakupy przykład niespójnych danychAnalizaPodsumowanieProblemyAnalizaRozdział 4. Lasy losoweOgólne zasady konstruowania lasów losowychPływamy? klasyfikacja za pomocą lasu losowegoAnalizaKonstruowanie lasu losowegoLosowe drzewo decyzyjne nr 0Losowe drzewo decyzyjne nr 1Wynikowy las losowyKlasyfikowanie cechy na podstawie lasu losowegoImplementacja algorytmu konstruowania lasu losowegoDane wejścioweWynikPrzykład zagramy w szachy?AnalizaKonstruowanie lasu losowegoLosowe drzewo decyzyjne nr 0Losowe drzewa decyzyjne nr 1, 2 i 3Wynikowy las losowyKlasyfikacja w drodze głosowaniaDane wejścioweWynikIdziemy na zakupy? wnioskowanie z niespójnych danych i miara wiarygodności wynikuAnalizaDane wejścioweWynikPodsumowanieProblemyAnalizaDane wejścioweWynikRozdział 5. KlasteryzacjaDochód gospodarstwa domowego niski czy wysoki?Algorytm k-średnichPoczątkowy zbiór centroidówWyznaczanie centroidu klasteraPrzykład wykorzystanie algorytmu k-średnich do klasyfikacji dochodówKlasyfikowanie przez klasteryzację prognozowanie płci nieznanej osobyAnalizaImplementacja algorytmu k-średnichDane wejścioweWynik grupowaniaStatus własności dobór optymalnej liczby klasterówAnalizaDane wejścioweWynik podział między dwa klasteryWynik podział między trzy klasteryWynik podział między cztery klasteryWynik podział między pięć klasterówKlasyfikowanie dokumentów semantyczne znaczenie klasteryzacjiAnalizaDane wejścioweWynik podział między dwa klasteryWynik podział między trzy klasteryWynik podział między pięć klasterówPodsumowanieProblemyAnalizaDane wejścioweDwa klasteryTrzy klasteryCztery klasteryPięć klasterówWybór optymalnej liczby klasterów przy użyciu walidacji krzyżowejRozdział 6. Analiza regresjiKonwersja temperatur regresja liniowa dla danych doskonałychRozwiązanie analityczneMetoda najmniejszych kwadratów w regresji liniowejImplementacja analizy regresji liniowej w PythonieKod programuWynikWizualizacjaRegresja dla danych pomiarowych prognozowanie wagi na podstawie wzrostuAnalizaKod programuWynikMetoda spadku gradientowego i jej implementacjaSzczegóły algorytmuImplementacja w PythonieDane wejścioweWynikWizualizacja porównanie z metodą analitycznąPrzewidywanie czasu przelotu na podstawie odległościAnalizaKod programuWynikObliczenia balistyczne model nieliniowyAnalizaKod programuWynikPodsumowanieProblemyAnalizaKod programuWynikWizualizacjaRozdział 7. Analiza szeregów czasowychZysk w biznesie analiza trenduAnalizaKod programuWynikWizualizacjaKonkluzjaSprzedaż w sklepie internetowym analiza sezonowościAnalizaAnaliza trenduKod programuWynikWizualizacjaAnaliza sezonowościWizualizacjaPodsumowanieProblemyAnalizaKod programuWynikWizualizacjaWizualizacjaDodatek A Podstawy języka PythonPrzykładKomentarzeTypy danychintPrzykład example02_int.pyWynikfloatPrzykład example03_float.pyWynikNapisPrzykład example04_string.pyWynikKrotkaPrzykład example05_tuple.pyWynikListaPrzykład example06_list.pyWynikZbiórPrzykład example07_set.pyWynikSłownikPrzykład example08_dictionary.pyWynikPrzepływ sterowaniaInstrukcje warunkowePrzykład example09_if_else_elif.pyWynikPętla forPrzykład example10_for_loop_range.pyWynikPrzykład example11_for_loop_list.pyWynikPrzykład example12_for_loop_set.pyWynikPętla whilePrzykład example13_while_loop.pyWynikInstrukcje break i continuePrzykład example14_break_continue.pyWynikFunkcjePrzykład example15_function.pyWynikWejście-wyjście programuArgumenty wywołania programuPrzykład example16_arguments.pyWynikOperacje na plikachPrzykład example17_file.pyWynikDodatek B StatystykaPodstawowe koncepcjeNotacjaPodstawowe pojęciaWnioskowanie bayesowskieRozkład normalny GaussaWalidacja krzyżowaTestowanie A/BDodatek C Słownik pojęć, algorytmów i metod Data Science O autorze: Dávid Natingga jest naukowcem specjalizującym się w dziedzinie sztucznej inteligencji. Zajmuje się teorią obliczeń i wykorzystaniem matematyki w algorytmach SI. Wcześniej optymalizował algorytmy na potrzeby uczenia maszynowego oraz big data. Jest autorem ciekawego algorytmu sugerowania produktów na podstawie preferencji klientów i cech gatunków kawy. W 2016 roku spędził osiem miesięcy jako research visitor w Japońskim Instytucie Naukowo-Technologicznym w Kanazawie.

Informatyka

druk e115, shared service center, dom w lawendzie, władysławowo motylarnia, wyjaśnij przyczyny problemów z jakimi borykają się państwa afrykańskie, konto revolut, kraków przemysłowa, patty – zabiles te milosc nie ma nas, amstaf rasa, prom polska norwegia ile płynie, amortyzacja środków trwałych stawki

yyyyy