Computational Statistics in Data Science

Здесь есть возможность читать онлайн «Computational Statistics in Data Science» — ознакомительный отрывок электронной книги совершенно бесплатно, а после прочтения отрывка купить полную версию. В некоторых случаях можно слушать аудио, скачать через торрент в формате fb2 и присутствует краткое содержание. Жанр: unrecognised, на английском языке. Описание произведения, (предисловие) а так же отзывы посетителей доступны на портале библиотеки ЛибКат.

Computational Statistics in Data Science: краткое содержание, описание и аннотация

Предлагаем к чтению аннотацию, описание, краткое содержание или предисловие (зависит от того, что написал сам автор книги «Computational Statistics in Data Science»). Если вы не нашли необходимую информацию о книге — напишите в комментариях, мы постараемся отыскать её.

An essential roadmap to the application of computational statistics in contemporary data science
Computational Statistics in Data Science
Computational Statistics in Data Science
Wiley StatsRef: Statistics Reference Online
Computational Statistics in Data Science

Computational Statistics in Data Science — читать онлайн ознакомительный отрывок

Ниже представлен текст книги, разбитый по страницам. Система сохранения места последней прочитанной страницы, позволяет с удобством читать онлайн бесплатно книгу «Computational Statistics in Data Science», без необходимости каждый раз заново искать на чём Вы остановились. Поставьте закладку, и сможете в любой момент перейти на страницу, на которой закончили чтение.

Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

7 Examples

7.1 Action Figure Collector Problem

Consider the general coupon collector problem [38] where the goal is to collect картинка 726distinct objects (e.g., coupons, trading cards, and action figures). Specifically, independent draws of size картинка 727are made from картинка 728with replacement, and interest is in the number of draws necessary, say картинка 729, to draw all картинка 730objects at least once. The classical case where картинка 731and all картинка 732objects are equally likely yields a closed‐form solution (related to random sampling of digits). We consider a variation where картинка 733and картинка 734action figures appear in cereal boxes with probabilities in Table 1.

We estimate the expected number of boxes needed to collect all 15 action figures and the probability we needed to buy more than 100 and 200 total boxes. Denote these as Computational Statistics in Data Science - изображение 735, Computational Statistics in Data Science - изображение 736, and Computational Statistics in Data Science - изображение 737, respectively. Additionally, we implement an absolute precision sequential stopping rule to simulate until 95% confidence interval lengths for the three quantities of interest are below 1, 0.01, and 0.01, respectively. Specifically, we set картинка 738and simulate an additional 100 Monte Carlo sample between checking the stopping rule. The sequential stopping rule terminates at Computational Statistics in Data Science - изображение 739with estimates of Computational Statistics in Data Science - изображение 740. We note that stopping is based on картинка 741since its 95% confidence interval criteria is the most restrictive. The left panel of Figure 1provides a histogram of the Monte Carlo samples along with vertical bold lines corresponding to 100 and 200 boxes.

Table 1 Probabilities for each action figure

Figures A B C D E F G H I J K L M N O
Probability 0.2 0.1 0.1 0.1 0.1 0.1 0.05 0.05 0.05 0.05 0.02 0.02 0.02 0.02 0.02
Figure 1 Histograms of simulated boxes and mean number of boxes for two Monte - фото 742

Figure 1 Histograms of simulated boxes and mean number of boxes for two Monte Carlo sampling strategies in the collector problem.

A more efficient Monte Carlo experiment is available if we only wish to estimate Computational Statistics in Data Science - изображение 743. Suppose that Computational Statistics in Data Science - изображение 744is the set of all permutations of the set Computational Statistics in Data Science - изображение 745representing the order in which the action figures were collected. Then, for any Computational Statistics in Data Science - изображение 746, we can calculate Computational Statistics in Data Science - изображение 747and notice

This calculation is unavailable since there are over 3 trillion partitions in - фото 748

This calculation is unavailable since there are over 3 trillion partitions in картинка 749. However, we can simulate картинка 750equally likely permutations from and estimate with Using this sampler we simulate until the 95 confid - фото 751and estimate with Using this sampler we simulate until the 95 confidence interval length - фото 752with

Using this sampler we simulate until the 95 confidence interval length for is - фото 753

Using this sampler, we simulate until the 95% confidence interval length for картинка 754is below 1. Again, we set картинка 755and simulate an additional 100 Monte Carlo sample between checking the stopping rule. Now the sequential stopping rule terminates at картинка 756with an estimate of 116.1, which is approximately 10 times more efficient than the naive Monte Carlo sampling. The right panel of Figure 1provides a histogram of the Monte Carlo simulated means.

7.2 Estimating Risk for Empirical Bayes

Risk of empirical Bayes estimators is often not available in closed form, and Monte Carlo simulation is used to estimate it. Consider Example 3.3 from Robert and Casella [4] where for a fixed The posterior distribution of given - фото 757,

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Похожие книги на «Computational Statistics in Data Science»

Представляем Вашему вниманию похожие книги на «Computational Statistics in Data Science» списком для выбора. Мы отобрали схожую по названию и смыслу литературу в надежде предоставить читателям больше вариантов отыскать новые, интересные, ещё непрочитанные произведения.


Отзывы о книге «Computational Statistics in Data Science»

Обсуждение, отзывы о книге «Computational Statistics in Data Science» и просто собственные мнения читателей. Оставьте ваши комментарии, напишите, что Вы думаете о произведении, его смысле или главных героях. Укажите что конкретно понравилось, а что нет, и почему Вы так считаете.

x