Maria Cristina Mariani - Data Science in Theory and Practice

Здесь есть возможность читать онлайн «Maria Cristina Mariani - Data Science in Theory and Practice» — ознакомительный отрывок электронной книги совершенно бесплатно, а после прочтения отрывка купить полную версию. В некоторых случаях можно слушать аудио, скачать через торрент в формате fb2 и присутствует краткое содержание. Жанр: unrecognised, на английском языке. Описание произведения, (предисловие) а так же отзывы посетителей доступны на портале библиотеки ЛибКат.

Data Science in Theory and Practice: краткое содержание, описание и аннотация

Предлагаем к чтению аннотацию, описание, краткое содержание или предисловие (зависит от того, что написал сам автор книги «Data Science in Theory and Practice»). Если вы не нашли необходимую информацию о книге — напишите в комментариях, мы постараемся отыскать её.

DATA SCIENCE IN THEORY AND PRACTICE delivers a comprehensive treatment of the mathematical and statistical models useful for analyzing data sets arising in various disciplines, like banking, finance, health care, bioinformatics, security, education, and social services. Written in five parts, the book examines some of the most commonly used and fundamental mathematical and statistical concepts that form the basis of data science. The authors go on to analyze various data transformation techniques useful for extracting information from raw data, long memory behavior, and predictive modeling. The book offers readers a multitude of topics all relevant to the analysis of complex data sets. Along with a robust exploration of the theory underpinning data science, it contains numerous applications to specific and practical problems. The book also provides examples of code algorithms in R and Python and provides pseudo-algorithms to port the code to any other language. Ideal for students and practitioners without a strong background in data science, readers will also learn from topics like: Analyses of foundational theoretical subjects, including the history of data science, matrix algebra and random vectors, and multivariate analysis A comprehensive examination of time series forecasting, including the different components of time series and transformations to achieve stationarity Introductions to both the R and Python programming languages, including basic data types and sample manipulations for both languages An exploration of algorithms, including how to write one and how to perform an asymptotic analysis A comprehensive discussion of several techniques for analyzing and predicting complex data sets Perfect for advanced undergraduate and graduate students in Data Science, Business Analytics, and Statistics programs,
will also earn a place in the libraries of practicing data scientists, data and business analysts, and statisticians in the private sector, government, and academia.

Data Science in Theory and Practice — читать онлайн ознакомительный отрывок

Ниже представлен текст книги, разбитый по страницам. Система сохранения места последней прочитанной страницы, позволяет с удобством читать онлайн бесплатно книгу «Data Science in Theory and Practice», без необходимости каждый раз заново искать на чём Вы остановились. Поставьте закладку, и сможете в любой момент перейти на страницу, на которой закончили чтение.

Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать
The rectangular array contains the data consisting of all of the observations - фото 323

The rectangular array картинка 324contains the data consisting of all of the observations on all of the variables.

Example 3.1 (A data array)A selection of three receipts from Bestbuy was obtained in order to investigate the nature of movie sales. Each receipt provided, among other things, the number of movies sold and the total amount of each sale. Let the first variable be total dollar sales and the second variable be number of movies sold. Then we can take the corresponding numbers on the receipts as three measurements on two variables. From the above description, we obtain the tabular form of the data as follows:

Data Science in Theory and Practice - изображение 325

Then the data matrix Data Science in Theory and Practice - изображение 326is

Data Science in Theory and Practice - изображение 327

with three rows and two columns.

We now present some descriptive statistics. We will begin with the mean vectors.

3.3 Mean Vectors

Let Data Science in Theory and Practice - изображение 328be картинка 329random variables, where картинка 330denotes the transpose of a matrix. The expected value of the random Data Science in Theory and Practice - изображение 331vector is defined as the vector of expectations i.e.

Data Science in Theory and Practice - изображение 332

More generally, if Data Science in Theory and Practice - изображение 333is a matrix of random variables, then the is the matrix of expectations with elements ie For a random vecto - фото 334is the matrix of expectations with elements Data Science in Theory and Practice - изображение 335, i.e.:

Data Science in Theory and Practice - изображение 336

For a random vector Data Science in Theory and Practice - изображение 337, the mean vector consists of the means of each variable:

Data Science in Theory and Practice - изображение 338

where Data Science in Theory and Practice - изображение 339. For example let Data Science in Theory and Practice - изображение 340be картинка 341measurements on the first variable. Then the sample meanfor the first variable Data Science in Theory and Practice - изображение 342is defined as follows:

Data Science in Theory and Practice - изображение 343

The sample mean can be computed from the картинка 344measurements on each of the variables Therefore in general for sample means we have Ex - фото 345variables. Therefore, in general for sample means we have Example 32Consider the following data matrix - фото 346sample means, we have:

Data Science in Theory and Practice - изображение 347

Example 3.2Consider the following data matrix introduced in Example 3.1:

Data Science in Theory and Practice - изображение 348

Each receipt yields a pair of measurements, total dollar sales, and number of movies sold. To find the sample mean we calculate the average of each column as follows Therefore - фото 349, we calculate the average of each column as follows:

Therefore This implies that the average dollar sales for two movies is - фото 350

Therefore,

This implies that the average dollar sales for two movies is 4000 Therefore - фото 351

This implies that the average dollar sales for two movies is $40.00. Therefore, the average amount of dollars that cost a movie is 20 dollars.

3.4 Variance–Covariance Matrices

The variance–covariance matrix (or simply the covariance matrix) of a random vector is given by where is the mean vector The sample covariance mat - фото 352is given by

where is the mean vector The sample covariance matrix is the matri - фото 353

where картинка 354is the mean vector.

The sample covariance matrix картинка 355is the matrix of sample variances and covariances of the variables 31 In 31 the covariance matrix consists of the variances - фото 356variables.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Похожие книги на «Data Science in Theory and Practice»

Представляем Вашему вниманию похожие книги на «Data Science in Theory and Practice» списком для выбора. Мы отобрали схожую по названию и смыслу литературу в надежде предоставить читателям больше вариантов отыскать новые, интересные, ещё непрочитанные произведения.


Отзывы о книге «Data Science in Theory and Practice»

Обсуждение, отзывы о книге «Data Science in Theory and Practice» и просто собственные мнения читателей. Оставьте ваши комментарии, напишите, что Вы думаете о произведении, его смысле или главных героях. Укажите что конкретно понравилось, а что нет, и почему Вы так считаете.

x