Computational Statistics in Data Science

Здесь есть возможность читать онлайн «Computational Statistics in Data Science» — ознакомительный отрывок электронной книги совершенно бесплатно, а после прочтения отрывка купить полную версию. В некоторых случаях можно слушать аудио, скачать через торрент в формате fb2 и присутствует краткое содержание. Жанр: unrecognised, на английском языке. Описание произведения, (предисловие) а так же отзывы посетителей доступны на портале библиотеки ЛибКат.

Computational Statistics in Data Science: краткое содержание, описание и аннотация

Предлагаем к чтению аннотацию, описание, краткое содержание или предисловие (зависит от того, что написал сам автор книги «Computational Statistics in Data Science»). Если вы не нашли необходимую информацию о книге — напишите в комментариях, мы постараемся отыскать её.

An essential roadmap to the application of computational statistics in contemporary data science
Computational Statistics in Data Science
Computational Statistics in Data Science
Wiley StatsRef: Statistics Reference Online
Computational Statistics in Data Science

Computational Statistics in Data Science — читать онлайн ознакомительный отрывок

Ниже представлен текст книги, разбитый по страницам. Система сохранения места последней прочитанной страницы, позволяет с удобством читать онлайн бесплатно книгу «Computational Statistics in Data Science», без необходимости каждый раз заново искать на чём Вы остановились. Поставьте закладку, и сможете в любой момент перейти на страницу, на которой закончили чтение.

Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать
The idea is that the global scale parameter would shrink most s t - фото 130

The idea is that the global scale parameter картинка 131would shrink most картинка 132s toward zero, while the local scale картинка 133s, with its heavy‐tailed prior картинка 134, allow a small number of картинка 135and hence картинка 136s to be estimated away from zero. While motivated by two different conceptual frameworks, the spike‐and‐slab can be viewed as a subset of global–local priors in which картинка 137is chosen as a mixture of delta masses placed at картинка 138and картинка 139. Continuous shrinkage mitigates the multimodality of spike‐and‐slab by smoothly bridging small and large values of картинка 140.

On the other hand, the use of continuous shrinkage priors does not address the increasing computational burden from growing картинка 141and картинка 142in modern applications. Sparse regression posteriors under global–local priors are amenable to an effective Gibbs sampler, a popular class of MCMC we describe further in Section 4.1. Under the linear and logistic models, the computational bottleneck of this Gibbs sampler stems from the need for repeated updates of from its conditional distribution 4 where is an additional pa - фото 143from its conditional distribution

(4) Computational Statistics in Data Science - изображение 144

where Computational Statistics in Data Science - изображение 145is an additional parameter of diagonal matrix and Computational Statistics in Data Science - изображение 146. 5 Sampling from this high‐dimensional Gaussian distribution requires Computational Statistics in Data Science - изображение 147operations with the standard approach [58]: картинка 148for computing the term картинка 149and картинка 150for Cholesky factorization of Computational Statistics in Data Science - изображение 151. While an alternative approach by Bhattacharya et al . [48] provides the complexity of Computational Statistics in Data Science - изображение 152, the computational cost remains problematic in the big Computational Statistics in Data Science - изображение 153and big Computational Statistics in Data Science - изображение 154regime at Computational Statistics in Data Science - изображение 155after choosing the faster of the two.

3.1.2 Conjugate gradient sampler for structured high‐dimensional Gaussians

The conjugate gradient (CG) sampler of Nishimura and Suchard [57] combined with their prior‐preconditioning technique overcomes this seemingly inevitable Computational Statistics in Data Science - изображение 156growth of the computational cost. Their algorithm is based on a novel application of the CG method [59, 60], which belongs to a family of iterative methods in numerical linear algebra. Despite its first appearance in 1952, CG received little attention for the next few decades, only making its way into major software packages such as MATLAB in the 1990s [61]. With its ability to solve a large and structured linear system картинка 157via a small number of matrix–vector multiplications картинка 158without ever explicitly inverting картинка 159, however, CG has since emerged as an essential and prototypical algorithm for modern scientific computing [62, 63].

Despite its earlier rise to prominence in other fields, CG has not found practical applications in Bayesian computation until rather recently [57, 64]. We can offer at least two explanations for this. First, being an algorithm for solving a deterministic linear system, it is not obvious how CG would be relevant to Monte Carlo simulation, such as sampling from Computational Statistics in Data Science - изображение 160; ostensively, such a task requires computing a “square root” Computational Statistics in Data Science - изображение 161of the precision matrix so that Computational Statistics in Data Science - изображение 162for Computational Statistics in Data Science - изображение 163. Secondly, unlike direct linear algebra methods, iterative methods such as CG have a variable computational cost that depends critically on the user's choice of a preconditioner and thus cannot be used as a “black‐box” algorithm. 6 In particular, this novel application of CG to Bayesian computation is a reminder that other powerful ideas in other computationally intensive fields may remain untapped by the statistical computing community; knowledge transfers will likely be facilitated by having more researchers working at intersections of different fields.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Похожие книги на «Computational Statistics in Data Science»

Представляем Вашему вниманию похожие книги на «Computational Statistics in Data Science» списком для выбора. Мы отобрали схожую по названию и смыслу литературу в надежде предоставить читателям больше вариантов отыскать новые, интересные, ещё непрочитанные произведения.


Отзывы о книге «Computational Statistics in Data Science»

Обсуждение, отзывы о книге «Computational Statistics in Data Science» и просто собственные мнения читателей. Оставьте ваши комментарии, напишите, что Вы думаете о произведении, его смысле или главных героях. Укажите что конкретно понравилось, а что нет, и почему Вы так считаете.

x