Maria Cristina Mariani - Data Science in Theory and Practice

Здесь есть возможность читать онлайн «Maria Cristina Mariani - Data Science in Theory and Practice» — ознакомительный отрывок электронной книги совершенно бесплатно, а после прочтения отрывка купить полную версию. В некоторых случаях можно слушать аудио, скачать через торрент в формате fb2 и присутствует краткое содержание. Жанр: unrecognised, на английском языке. Описание произведения, (предисловие) а так же отзывы посетителей доступны на портале библиотеки ЛибКат.

Data Science in Theory and Practice: краткое содержание, описание и аннотация

Предлагаем к чтению аннотацию, описание, краткое содержание или предисловие (зависит от того, что написал сам автор книги «Data Science in Theory and Practice»). Если вы не нашли необходимую информацию о книге — напишите в комментариях, мы постараемся отыскать её.

DATA SCIENCE IN THEORY AND PRACTICE delivers a comprehensive treatment of the mathematical and statistical models useful for analyzing data sets arising in various disciplines, like banking, finance, health care, bioinformatics, security, education, and social services. Written in five parts, the book examines some of the most commonly used and fundamental mathematical and statistical concepts that form the basis of data science. The authors go on to analyze various data transformation techniques useful for extracting information from raw data, long memory behavior, and predictive modeling. The book offers readers a multitude of topics all relevant to the analysis of complex data sets. Along with a robust exploration of the theory underpinning data science, it contains numerous applications to specific and practical problems. The book also provides examples of code algorithms in R and Python and provides pseudo-algorithms to port the code to any other language. Ideal for students and practitioners without a strong background in data science, readers will also learn from topics like: Analyses of foundational theoretical subjects, including the history of data science, matrix algebra and random vectors, and multivariate analysis A comprehensive examination of time series forecasting, including the different components of time series and transformations to achieve stationarity Introductions to both the R and Python programming languages, including basic data types and sample manipulations for both languages An exploration of algorithms, including how to write one and how to perform an asymptotic analysis A comprehensive discussion of several techniques for analyzing and predicting complex data sets Perfect for advanced undergraduate and graduate students in Data Science, Business Analytics, and Statistics programs,
will also earn a place in the libraries of practicing data scientists, data and business analysts, and statisticians in the private sector, government, and academia.

Data Science in Theory and Practice — читать онлайн ознакомительный отрывок

Ниже представлен текст книги, разбитый по страницам. Система сохранения места последней прочитанной страницы, позволяет с удобством читать онлайн бесплатно книгу «Data Science in Theory and Practice», без необходимости каждый раз заново искать на чём Вы остановились. Поставьте закладку, и сможете в любой момент перейти на страницу, на которой закончили чтение.

Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Specifically, the joint density of an Data Science in Theory and Practice - изображение 215‐dimensional random vector Data Science in Theory and Practice - изображение 216is defined as:

Data Science in Theory and Practice - изображение 217

where Data Science in Theory and Practice - изображение 218is an indicator function.

Definition 2.23 (Indicator function)The indicator function of a subset Data Science in Theory and Practice - изображение 219of a set Data Science in Theory and Practice - изображение 220is a function

Data Science in Theory and Practice - изображение 221

defined as

The components of the random vector thus are always positive and have the - фото 222

The components of the random vector Data Science in Theory and Practice - изображение 223thus are always positive and have the property Data Science in Theory and Practice - изображение 224. The normalizing constant is the multinomial beta function that is defined as where we used the - фото 225is the multinomial beta function, that is defined as:

Data Science in Theory and Practice - изображение 226

where we used the notation Data Science in Theory and Practice - изображение 227and for the Gamma function Because the Dirichlet distribution creates positive - фото 228for the Gamma function.

Because the Dirichlet distribution creates картинка 229positive numbers that always sum to 1, it is extremely useful to create candidates for probabilities of картинка 230possible outcomes. This distribution is very popular and related to the multinomial distribution which needs картинка 231numbers summing to 1 to model the probabilities in the distribution. The multinomial distribution is defined in Section 2.3.2.

With the notation mentioned above and Data Science in Theory and Practice - изображение 232as the sum of all parameters, we can calculate the moments of the distribution. The first moment vector has coordinates:

Data Science in Theory and Practice - изображение 233

The covariance matrix has elements:

and when The covariance matrix is singular its determinant i - фото 234

and when The covariance matrix is singular its determinant is zero Finally the - фото 235

Data Science in Theory and Practice - изображение 236

The covariance matrix is singular (its determinant is zero).

Finally, the univariate marginal distributions are all beta with parameters Data Science in Theory and Practice - изображение 237. All these are in the reference (see Balakrishnan and Nevzorov 2004).

Please refer to Lin (2016) for the proof of the properties of the Dirichlet distribution.

2.3.2 Multinomial Distribution

We begin with a definition of the binomial distribution.

Definition 2.24 (Binomial distribution)A random variable картинка 238is said to have a binomial distribution with parameters and if it has a pmf shown below where - фото 239and if it has a pmf shown below where is the probability of success on an - фото 240if it has a pmf shown below

where is the probability of success on an individual trial and is number o - фото 241

where картинка 242is the probability of success on an individual trial and картинка 243is number of trials in the binomial experiment.

The multinomial distribution is a generalization of the binomial distribution. Specifically, assume that Data Science in Theory and Practice - изображение 244independent distributions may result in one of the Data Science in Theory and Practice - изображение 245outcomes generically labeled Data Science in Theory and Practice - изображение 246, each with corresponding probabilities Data Science in Theory and Practice - изображение 247. Now define a vector Data Science in Theory and Practice - изображение 248, where each of the картинка 249counts the number of outcomes картинка 250in the resulting sample of size The joint distribution of the vector is In the same way as the binom - фото 251. The joint distribution of the vector is In the same way as the binomial probabilities appear as coefficients in the - фото 252is

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Похожие книги на «Data Science in Theory and Practice»

Представляем Вашему вниманию похожие книги на «Data Science in Theory and Practice» списком для выбора. Мы отобрали схожую по названию и смыслу литературу в надежде предоставить читателям больше вариантов отыскать новые, интересные, ещё непрочитанные произведения.


Отзывы о книге «Data Science in Theory and Practice»

Обсуждение, отзывы о книге «Data Science in Theory and Practice» и просто собственные мнения читателей. Оставьте ваши комментарии, напишите, что Вы думаете о произведении, его смысле или главных героях. Укажите что конкретно понравилось, а что нет, и почему Вы так считаете.

x