Uczenie maszynowe w Pythonie. Leksykon kieszonkowy 🔍
Matt Harrison
HELION S.A., Москва, Санкт-Петербург, Russia, 2020
英语 [en] · 波兰语 [pl] · EPUB · 6.6MB · 2020 · 📘 非小说类图书 · 🚀/lgli/lgrs · Save
描述
Uczenie maszynowe i nauka o danych są dziś ogromnie popularne. Dziedziny te szybko się rozwijają, a poszczególne techniki uczenia maszynowego znajdują coraz więcej różnorodnych zastosowań. Wiedza, którą można uzyskać dzięki odpowiedniemu przygotowaniu danych i ich eksploracji, często jest bezcenna. Umiejętność ich analizy oraz wiedza o możliwych sposobach rozwiązywania problemów napotykanych podczas uczenia maszynowego są więc dużymi atutami i mogą być wykorzystywane w wielu gałęziach nauki, techniki i biznesu.
Z tego zwięzłego przewodnika po technikach uczenia maszynowego opartego na strukturalnych danych skorzystają programiści, badacze, osoby zajmujące się nauką o danych oraz twórcy systemów sztucznej inteligencji. Znalazł się tu wyczerpujący opis procesu uczenia maszynowego i klasyfikacji danych strukturalnych. Przedstawiono też metody klastrowania danych, analizy regresji, redukcji wymiarowości oraz inne ważne zagadnienia. Prezentowane treści zostały zilustrowane uwagami, tabelami i przykładami kodu. Nie zabrakło opisu przydatnych bibliotek, niezwykle użytecznych w pracy analityka danych. W efekcie książka pozwala na szybkie rozwiązywanie różnego rodzaju problemów związanych z przetwarzaniem danych strukturalnych.
W książce między innymi:
klasyfikacja, oczyszczanie i uzupełnianie braków danych
eksploracyjna analiza danych i dobór modelu danych
przykłady analiz regresji
redukcja wymiarowości
potoki w bibliotece scikit-learn
Uczenie maszynowe: nowy wymiar analizy danych!
Z tego zwięzłego przewodnika po technikach uczenia maszynowego opartego na strukturalnych danych skorzystają programiści, badacze, osoby zajmujące się nauką o danych oraz twórcy systemów sztucznej inteligencji. Znalazł się tu wyczerpujący opis procesu uczenia maszynowego i klasyfikacji danych strukturalnych. Przedstawiono też metody klastrowania danych, analizy regresji, redukcji wymiarowości oraz inne ważne zagadnienia. Prezentowane treści zostały zilustrowane uwagami, tabelami i przykładami kodu. Nie zabrakło opisu przydatnych bibliotek, niezwykle użytecznych w pracy analityka danych. W efekcie książka pozwala na szybkie rozwiązywanie różnego rodzaju problemów związanych z przetwarzaniem danych strukturalnych.
W książce między innymi:
klasyfikacja, oczyszczanie i uzupełnianie braków danych
eksploracyjna analiza danych i dobór modelu danych
przykłady analiz regresji
redukcja wymiarowości
potoki w bibliotece scikit-learn
Uczenie maszynowe: nowy wymiar analizy danych!
备用文件名
lgrsnf/Uczenie maszynowe w Pythonie. Leksykon kieszonkowy (2020, Helion) - Matt Harrison.epub
备选标题
Машинное обучение: карманный справочник: краткое руководство по методам структурированного машинного обучения на Python
备选标题
Machine Learning Pocket Reference : Working with Structured Data in Python
备选标题
Harrison, M: Machine Learning Pocket Reference
备选作者
Мэтт Харрисон; перевод с английского и редакция В. А. Коваленко
备选作者
Harrison, Matt
备选作者
Харрисон, Мэтт
备用出版商
O'Reilly Media, Incorporated
备用出版商
Диалектика; Диалектика
备用版本
First edition, Beijing ; Boston ; Farnham ; Sebastopol ; Tokyo, 2019
备用版本
First edition, North Sebastopol, CA, 2019
备用版本
United States, United States of America
备用版本
O'Reilly Media, Sebastopol, 2019
备用版本
Poland, Poland
备用版本
1, 2019-09-17
备用版本
1, PS, 2019
备用版本
2024
元数据中的注释
Предм. указ.: с. 307-312
Пер.: Harrison, Matt Machine learning Beijing etc. : O'Reilly, cop. 2019 978-1-492-04754-4
Пер.: Harrison, Matt Machine learning Beijing etc. : O'Reilly, cop. 2019 978-1-492-04754-4
元数据中的注释
РГБ
元数据中的注释
Russian State Library [rgb] MARC:
=001 010391112
=005 20200828133016.0
=008 200819s2020\\\\ru\||||\\\\\\\0||\|\rus|d
=017 \\ $a КН-П-20-045080 $b RuMoRKP
=020 \\ $a 978-5-907203-17-4 $c 200 экз.
=040 \\ $a RuMoRGB $b rus $e rcr
=041 1\ $a rus $h eng
=044 \\ $a ru
=084 \\ $a З973.236я22 $2 rubbk
=100 1\ $a Харрисон, Мэтт
=245 00 $a Машинное обучение : $b карманный справочник : краткое руководство по методам структурированного машинного обучения на Python $c Мэтт Харрисон ; перевод с английского и редакция В. А. Коваленко
=260 \\ $a Москва $b Диалектика ; $c 2020 $a Санкт-Петербург $b Диалектика
=300 \\ $a 312 с. $b ил., табл. $c 20 см
=336 \\ $a Текст (визуальный)
=337 \\ $a непосредственный
=500 \\ $a Предм. указ.: с. 307-312
=534 \\ $p Пер.: $a Harrison, Matt $t Machine learning $c Beijing etc. : O'Reilly, cop. 2019 $z 978-1-492-04754-4
=650 \7 $a Техника. Технические науки -- Энергетика. Радиоэлектроника -- Радиоэлектроника -- Вычислительная техника -- Электронные вычислительные машины (компьютеры) -- Цифровые электронные вычислительные машины. Программирование -- Специализированные компьютеры и системы. Отдельные информационные технологии -- Образовательные системы -- Справочник $2 rubbk
=852 \\ $a РГБ $b FB $j 2 20-35/435 $x 90
=852 \\ $a РГБ $b FB $j 2 20-35/331 $x 90
=001 010391112
=005 20200828133016.0
=008 200819s2020\\\\ru\||||\\\\\\\0||\|\rus|d
=017 \\ $a КН-П-20-045080 $b RuMoRKP
=020 \\ $a 978-5-907203-17-4 $c 200 экз.
=040 \\ $a RuMoRGB $b rus $e rcr
=041 1\ $a rus $h eng
=044 \\ $a ru
=084 \\ $a З973.236я22 $2 rubbk
=100 1\ $a Харрисон, Мэтт
=245 00 $a Машинное обучение : $b карманный справочник : краткое руководство по методам структурированного машинного обучения на Python $c Мэтт Харрисон ; перевод с английского и редакция В. А. Коваленко
=260 \\ $a Москва $b Диалектика ; $c 2020 $a Санкт-Петербург $b Диалектика
=300 \\ $a 312 с. $b ил., табл. $c 20 см
=336 \\ $a Текст (визуальный)
=337 \\ $a непосредственный
=500 \\ $a Предм. указ.: с. 307-312
=534 \\ $p Пер.: $a Harrison, Matt $t Machine learning $c Beijing etc. : O'Reilly, cop. 2019 $z 978-1-492-04754-4
=650 \7 $a Техника. Технические науки -- Энергетика. Радиоэлектроника -- Радиоэлектроника -- Вычислительная техника -- Электронные вычислительные машины (компьютеры) -- Цифровые электронные вычислительные машины. Программирование -- Специализированные компьютеры и системы. Отдельные информационные технологии -- Образовательные системы -- Справочник $2 rubbk
=852 \\ $a РГБ $b FB $j 2 20-35/435 $x 90
=852 \\ $a РГБ $b FB $j 2 20-35/331 $x 90
备用描述
Spis treści
Przedmowa
Czego należy oczekiwać?
Dla kogo jest ta książka?
Konwencje typograficzne
Przykłady kodów
Podziękowania
Rozdział 1. Wprowadzenie
Wykorzystywane biblioteki
Instalowanie bibliotek za pomocą programu pip
Instalowanie bibliotek za pomocą programu conda
Rozdział 2. Schemat procesu uczenia maszynowego
Rozdział 3. Klasyfikacja danych: baza Titanic
Proponowany schemat projektu
Importowane biblioteki
Zadanie pytania
Stosowana terminologia
Zebranie danych
Oczyszczanie danych
Zdefiniowanie cech
Próbkowanie danych
Imputacja danych
Normalizacja danych
Refaktoryzacja kodu
Model odniesienia
Różne rodziny algorytmów
Kontaminacja modeli
Utworzenie modelu
Ocena modelu
Optymalizacja modelu
Macierz pomyłek
Krzywa ROC
Krzywa uczenia
Wdrożenie modelu
Rozdział 4. Brakujące dane
Badanie braków danych
Pomijanie braków
Imputacja danych
Tworzenie kolumn ze wskaźnikami
Rozdział 5. Oczyszczanie danych
Nazwy kolumn
Uzupełnianie brakujących wartości
Rozdział 6. Badanie danych
Ilość danych
Statystyki podsumowujące
Histogram
Wykres punktowy
Wykres łączony
Macierz wykresów
Wykresy pudełkowy i skrzypcowy
Porównywanie dwóch cech porządkowych
Korelacja
Wykres RadViz
Wykres współrzędnych równoległych
Rozdział 7. Wstępne przetwarzanie danych
Normalizacja
Skalowanie w zadanym zakresie
Kolumny wskaźnikowe
Kodowanie etykietowe
Kodowanie częstościowe
Wyodrębnianie kategorii danych z ciągów znaków
Inne rodzaje kodowania kolumn kategorialnych
Przetwarzanie dat
Tworzenie cechy col_na
Ręczne przetwarzanie cech
Rozdział 8. Wybieranie cech
Skorelowane kolumny danych
Regresja lasso
Rekurencyjna eliminacja cech
Informacja wzajemna
Analiza głównych składowych
Ważność cech
Rozdział 9. Niezrównoważone klasy danych
Wybór innego wskaźnika
Algorytmy drzewa decyzyjnego i metody zespołowe
Penalizacja modeli
Próbkowanie w górę mniej licznych klas
Generowanie danych w mniej licznych klasach
Próbkowanie w dół bardziej licznych klas
Próbkowanie w górę, a potem w dół
Rozdział 10. Klasyfikacja
Regresja logistyczna
Naiwny klasyfikator Bayesa
Maszyna wektorów nośnych
K najbliższych sąsiadów
Drzewo decyzyjne
Las losowy
XGBoost
Model LightGBM z gradientowym wzmacnianiem
TPOT
Rozdział 11. Wybór modelu
Krzywa weryfikacji
Krzywa uczenia
Rozdział 12. Wskaźniki i ocena klasyfikacji
Tablica pomyłek
Wskaźniki
Dokładność
Czułość
Precyzja
F1
Raport klasyfikacyjny
Krzywa ROC
Krzywa precyzja-czułość
Krzywa skumulowanych zysków
Krzywa podniesienia
Równowaga klas
Błąd prognozowania klas
Próg dyskryminacji
Rozdział 13. Interpretacja modelu
Współczynniki regresji
Ważność cech
Pakiet LIME
Interpretacja drzewa
Wykres częściowych zależności
Modele zastępcze
Pakiet Shapley
Rozdział 14. Regresja
Model odniesienia
Regresja liniowa
Maszyna wektorów nośnych
K najbliższych sąsiadów
Drzewo decyzyjne
Las losowy
XGBoost
LightGBM
Rozdział 15. Wskaźniki i ocena regresji
Wskaźniki
Wykres reszt
Heteroskedastyczność
Rozkład normalny reszt
Wykres błędów prognozowanych wyników
Rozdział 16. Interpretacja modelu regresyjnego
Shapley
Rozdział 17. Redukcja wymiarowości danych
Analiza głównych składowych
UMAP
t-SNE
PHATE
Rozdział 18. Klastrowanie danych
Algorytm k-średnich
Klastrowanie aglomeracyjne (hierarchiczne)
Interpretowanie klastrów
Rozdział 19. Potoki
Potok klasyfikacyjny
Potok regresyjny
Potok analizy głównych składowych
O autorze
Kolofon
Przedmowa
Czego należy oczekiwać?
Dla kogo jest ta książka?
Konwencje typograficzne
Przykłady kodów
Podziękowania
Rozdział 1. Wprowadzenie
Wykorzystywane biblioteki
Instalowanie bibliotek za pomocą programu pip
Instalowanie bibliotek za pomocą programu conda
Rozdział 2. Schemat procesu uczenia maszynowego
Rozdział 3. Klasyfikacja danych: baza Titanic
Proponowany schemat projektu
Importowane biblioteki
Zadanie pytania
Stosowana terminologia
Zebranie danych
Oczyszczanie danych
Zdefiniowanie cech
Próbkowanie danych
Imputacja danych
Normalizacja danych
Refaktoryzacja kodu
Model odniesienia
Różne rodziny algorytmów
Kontaminacja modeli
Utworzenie modelu
Ocena modelu
Optymalizacja modelu
Macierz pomyłek
Krzywa ROC
Krzywa uczenia
Wdrożenie modelu
Rozdział 4. Brakujące dane
Badanie braków danych
Pomijanie braków
Imputacja danych
Tworzenie kolumn ze wskaźnikami
Rozdział 5. Oczyszczanie danych
Nazwy kolumn
Uzupełnianie brakujących wartości
Rozdział 6. Badanie danych
Ilość danych
Statystyki podsumowujące
Histogram
Wykres punktowy
Wykres łączony
Macierz wykresów
Wykresy pudełkowy i skrzypcowy
Porównywanie dwóch cech porządkowych
Korelacja
Wykres RadViz
Wykres współrzędnych równoległych
Rozdział 7. Wstępne przetwarzanie danych
Normalizacja
Skalowanie w zadanym zakresie
Kolumny wskaźnikowe
Kodowanie etykietowe
Kodowanie częstościowe
Wyodrębnianie kategorii danych z ciągów znaków
Inne rodzaje kodowania kolumn kategorialnych
Przetwarzanie dat
Tworzenie cechy col_na
Ręczne przetwarzanie cech
Rozdział 8. Wybieranie cech
Skorelowane kolumny danych
Regresja lasso
Rekurencyjna eliminacja cech
Informacja wzajemna
Analiza głównych składowych
Ważność cech
Rozdział 9. Niezrównoważone klasy danych
Wybór innego wskaźnika
Algorytmy drzewa decyzyjnego i metody zespołowe
Penalizacja modeli
Próbkowanie w górę mniej licznych klas
Generowanie danych w mniej licznych klasach
Próbkowanie w dół bardziej licznych klas
Próbkowanie w górę, a potem w dół
Rozdział 10. Klasyfikacja
Regresja logistyczna
Naiwny klasyfikator Bayesa
Maszyna wektorów nośnych
K najbliższych sąsiadów
Drzewo decyzyjne
Las losowy
XGBoost
Model LightGBM z gradientowym wzmacnianiem
TPOT
Rozdział 11. Wybór modelu
Krzywa weryfikacji
Krzywa uczenia
Rozdział 12. Wskaźniki i ocena klasyfikacji
Tablica pomyłek
Wskaźniki
Dokładność
Czułość
Precyzja
F1
Raport klasyfikacyjny
Krzywa ROC
Krzywa precyzja-czułość
Krzywa skumulowanych zysków
Krzywa podniesienia
Równowaga klas
Błąd prognozowania klas
Próg dyskryminacji
Rozdział 13. Interpretacja modelu
Współczynniki regresji
Ważność cech
Pakiet LIME
Interpretacja drzewa
Wykres częściowych zależności
Modele zastępcze
Pakiet Shapley
Rozdział 14. Regresja
Model odniesienia
Regresja liniowa
Maszyna wektorów nośnych
K najbliższych sąsiadów
Drzewo decyzyjne
Las losowy
XGBoost
LightGBM
Rozdział 15. Wskaźniki i ocena regresji
Wskaźniki
Wykres reszt
Heteroskedastyczność
Rozkład normalny reszt
Wykres błędów prognozowanych wyników
Rozdział 16. Interpretacja modelu regresyjnego
Shapley
Rozdział 17. Redukcja wymiarowości danych
Analiza głównych składowych
UMAP
t-SNE
PHATE
Rozdział 18. Klastrowanie danych
Algorytm k-średnich
Klastrowanie aglomeracyjne (hierarchiczne)
Interpretowanie klastrów
Rozdział 19. Potoki
Potok klasyfikacyjny
Potok regresyjny
Potok analizy głównych składowych
O autorze
Kolofon
备用描述
With detailed notes, tables, and examples, this handy reference will help you navigate the basics of structured machine learning. Author Matt Harrison delivers a valuable guide that you can use for additional support during training and as a convenient resource when you dive into your next machine learning project.Ideal for programmers, data scientists, and AI engineers, this book includes an overview of the machine learning process and walks you through classification with structured data. You'll also learn methods for clustering, predicting a continuous value (regression), and reducing dimensionality, among other topics.This pocket reference includes sections that cover:Classification, using the Titanic datasetCleaning data and dealing with missing dataExploratory data analysisCommon preprocessing steps using sample dataSelecting features useful to the modelModel selectionMetrics and classification evaluationRegression examples using k-nearest neighbor, decision trees, boosting, and moreMetrics for regression evaluationClusteringDimensionality reductionScikit-learn pipelines
备用描述
With detailed notes, tables, and examples, this handy reference will help you navigate the basics of structured machine learning. Author Matt Harrison delivers a valuable guide that you can use for additional support during training and as a convenient resource when you dive into your next machine learning project. Ideal for programmers, data scientists, and AI engineers, this book includes an overview of the machine learning process and walks you through classification with structured data. You??ll also learn methods for clustering, predicting a continuous value (regression), and reducing dimensionality, among other topics. This pocket reference includes sections that
备用描述
With detailed notes, tables, and examples, this handy reference will help you navigate the basics of structured machine learning. Author Matt Harrison delivers a valuable guide that you can use for additional support during training and as a convenient resource when you dive into your next machine learning project. Ideal for programmers, data scientists, and AI engineers, this book includes an overview of the machine learning process and walks you through classification with structured data. You'll also learn methods for clustering, predicting a continuous value (regression), and reducing dimensionality, among other topics. -- Provided by publisher
备用描述
A Quick Guide to Structured Machine Learning Techniques
开源日期
2024-10-03
🚀 快速下载
成为会员以支持书籍、论文等的长期保存。为了感谢您对我们的支持,您将获得高速下载权益。❤️
🐢 低速下载
由可信的合作方提供。 更多信息请参见常见问题解答。 (可能需要验证浏览器——无限次下载!)
- 低速服务器(合作方提供) #1 (稍快但需要排队)
- 低速服务器(合作方提供) #2 (稍快但需要排队)
- 低速服务器(合作方提供) #3 (稍快但需要排队)
- 低速服务器(合作方提供) #4 (稍快但需要排队)
- 低速服务器(合作方提供) #5 (无需排队,但可能非常慢)
- 低速服务器(合作方提供) #6 (无需排队,但可能非常慢)
- 低速服务器(合作方提供) #7 (无需排队,但可能非常慢)
- 低速服务器(合作方提供) #8 (无需排队,但可能非常慢)
- 下载后: 在我们的查看器中打开
所有选项下载的文件都相同,应该可以安全使用。即使这样,从互联网下载文件时始终要小心。例如,确保您的设备更新及时。
外部下载
-
对于大文件,我们建议使用下载管理器以防止中断。
推荐的下载管理器:Motrix -
您将需要一个电子书或 PDF 阅读器来打开文件,具体取决于文件格式。
推荐的电子书阅读器:Anna的档案在线查看器、ReadEra和Calibre -
使用在线工具进行格式转换。
推荐的转换工具:CloudConvert和PrintFriendly -
您可以将 PDF 和 EPUB 文件发送到您的 Kindle 或 Kobo 电子阅读器。
推荐的工具:亚马逊的“发送到 Kindle”和djazz 的“发送到 Kobo/Kindle” -
支持作者和图书馆
✍️ 如果您喜欢这个并且能够负担得起,请考虑购买原版,或直接支持作者。
📚 如果您当地的图书馆有这本书,请考虑在那里免费借阅。
下面的文字仅以英文继续。
总下载量:
“文件的MD5”是根据文件内容计算出的哈希值,并且基于该内容具有相当的唯一性。我们这里索引的所有影子图书馆都主要使用MD5来标识文件。
一个文件可能会出现在多个影子图书馆中。有关我们编译的各种数据集的信息,请参见数据集页面。
有关此文件的详细信息,请查看其JSON 文件。 Live/debug JSON version. Live/debug page.