Peter Bruce - Estadística práctica para ciencia de datos con R y Python

Здесь есть возможность читать онлайн «Peter Bruce - Estadística práctica para ciencia de datos con R y Python» — ознакомительный отрывок электронной книги совершенно бесплатно, а после прочтения отрывка купить полную версию. В некоторых случаях можно слушать аудио, скачать через торрент в формате fb2 и присутствует краткое содержание. Жанр: unrecognised, на испанском языке. Описание произведения, (предисловие) а так же отзывы посетителей доступны на портале библиотеки ЛибКат.

Estadística práctica para ciencia de datos con R y Python: краткое содержание, описание и аннотация

Предлагаем к чтению аннотацию, описание, краткое содержание или предисловие (зависит от того, что написал сам автор книги «Estadística práctica para ciencia de datos con R y Python»). Если вы не нашли необходимую информацию о книге — напишите в комментариях, мы постараемся отыскать её.

Los métodos estadísticos son una parte fundamental de la ciencia de datos, pero pocos científicos de datos tienen una formación avanzada en estadística. Los cursos y libros sobre estadística básica rara vez tratan el tema desde la perspectiva de la ciencia de datos. La segunda edición de este libro incluye ejemplos detallados de Python, ofrece una orientación práctica sobre la aplicación de los métodos estadísticos a la ciencia de datos, te indica cómo evitar su uso incorrecto y te aconseja sobre lo que es y lo que no es importante.
Muchos recursos de la ciencia de datos incorporan métodos estadísticos, pero carecen de una perspectiva estadística más profunda. Si estás familiarizado con los lenguajes de programación R o Python y tienes algún conocimiento de estadística, este libro suple esas carencias de una forma práctica, accesible y clara.
Con este libro aprenderás:
Por qué el análisis exploratorio de datos es un paso preliminar clave en la ciencia de datos
Cómo el muestreo aleatorio puede reducir el sesgo y ofrecer un conjunto de datos de mayor calidad, incluso con Big Data
Cómo los principios del diseño experimental ofrecen respuestas definitivas a preguntas
Cómo utilizar la regresión para estimar resultados y detectar anomalías
Técnicas de clasificación esenciales para predecir a qué categorías pertenece un registro
Métodos estadísticos de aprendizaje automático que «aprenden» a partir de los datos
Métodos de aprendizaje no supervisados para extraer significado de datos sin etiquetar
Peter Bruce es el fundador del Institute for Statistics Education en Statistics.com.
Andrew Bruce es científico investigador jefe en Amazon y tiene más de 30 años de experiencia en estadística y ciencia de datos.
Peter Gedeck es científico de datos senior en Collaborative Drug Discovery, desarrolla algoritmos de aprendizaje automático para pronosticar propiedades de posibles futuros fármacos.

Estadística práctica para ciencia de datos con R y Python — читать онлайн ознакомительный отрывок

Ниже представлен текст книги, разбитый по страницам. Система сохранения места последней прочитанной страницы, позволяет с удобством читать онлайн бесплатно книгу «Estadística práctica para ciencia de datos con R y Python», без необходимости каждый раз заново искать на чём Вы остановились. Поставьте закладку, и сможете в любой момент перейти на страницу, на которой закончили чтение.

Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать
Figura 112 Valor de tasación fiscal en relación con la superficie terminada - фото 88

Figura 1.12 Valor de tasación fiscal en relación con la superficie terminada en pies cuadrados por código postal.

La mayoría de los paquetes de Python utilizan Matplotlib para sus visualizaciones. Si bien en principio es posible crear gráficos facetados usando Matplotlib, el código puede complicarse. Afortunadamente, es posible crear gráficos de forma sencilla mediante seaborn:

Utilizamos los argumentos col y row para especificar las variables - фото 89

картинка 90Utilizamos los argumentos col y row para especificar las variables condicionantes. Para una sola variable condicionante, utilizamos col junto con col_wrap para empaquetar los gráficos facetados en varias filas.

картинка 91El método map llama a la función hexbin con los subconjuntos para los diferentes códigos postales del conjunto de datos original. extent define los límites de los ejes x e y.

El concepto de variables condicionantes en un sistema gráfico lo iniciaron los gráficos Trellis ( Trellis graphics ), desarrollados por Rick Becker y Bill Cleveland entre otros, en los Bell Labs [Trellis-Graphics]. Esta idea se ha extendido a varios sistemas gráficos modernos, como son los paquetes lattice [lattice] y ggplot2 de R y los módulos seaborn [seaborn] y Bokeh [bokeh] de Python . Las variables condicionantes también son parte integral de las plataformas de inteligencia empresarial como Tableau y Spotfire. Con la llegada de equipos con una gran potencia informática, las plataformas de visualización modernas han ido mucho más allá de lo que fueron los humildes comienzos del análisis exploratorio de datos. Sin embargo, los conceptos y herramientas clave desarrolladas hace medio siglo (por ejemplo, los sencillos diagramas de caja) todavía constituyen la base de estos sistemas.

Ideas clave

• La agrupación hexagonal y los gráficos de contorno son herramientas útiles que permiten el examen gráfico de dos variables numéricas a la vez, sin que nos abrumen las grandes cantidades de datos.

• Las tablas de contingencia son la herramienta estándar para observar los recuentos de dos variables categóricas.

• Los diagramas de caja y los diagramas de violín nos permiten representar una variable numérica frente a una variable categórica.

Lecturas complementarias

Modern Data Science with R de Benjamin Baumer, Daniel Kaplan y Nicholas Horton (Chapman & Hall/CRC Press, 2017) tiene una excelente presentación: "a grammar for graphics" (las "gg" de ggplot).

ggplot2: Elegant Graphics for Data Analysis de Hadley Wickham (Springer, 2009) es un excelente recurso del creador de ggplot2.

• Josef Fruehwald tiene un tutorial web sobre ggplot2 ( https://www.ling.upenn.edu/~joseff/avml2012/ ).

Resumen

El análisis exploratorio de datos (Exploratory Data Analysis [EDA]), iniciado por John Tukey, sentó las bases para desarrollar el campo de la ciencia de datos. La idea clave de EDA es que el primer paso y el más importante en cualquier proyecto basado en datos es la observación de los datos ( look at the data ). Al resumir y visualizar los datos, podemos desarrollar una valiosa intuición y conseguir comprender los proyectos.

Este capítulo ha revisado conceptos que van desde métricas sencillas, como son las estimaciones de localización y variabilidad, hasta completas presentaciones visuales que exploran las relaciones entre múltiples variables, como se muestra en la figura 1.12. El variado conjunto de herramientas y técnicas que está desarrollando la comunidad de código abierto, combinado con la expresividad de los lenguajes R y Python , han creado una gran cantidad de formas de explorar y analizar datos. El análisis exploratorio debería ser la piedra angular de cualquier proyecto de ciencia de datos.

Конец ознакомительного фрагмента.

Текст предоставлен ООО «ЛитРес».

Прочитайте эту книгу целиком, купив полную легальную версию на ЛитРес.

Безопасно оплатить книгу можно банковской картой Visa, MasterCard, Maestro, со счета мобильного телефона, с платежного терминала, в салоне МТС или Связной, через PayPal, WebMoney, Яндекс.Деньги, QIWI Кошелек, бонусными картами или другим удобным Вам способом.

Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Похожие книги на «Estadística práctica para ciencia de datos con R y Python»

Представляем Вашему вниманию похожие книги на «Estadística práctica para ciencia de datos con R y Python» списком для выбора. Мы отобрали схожую по названию и смыслу литературу в надежде предоставить читателям больше вариантов отыскать новые, интересные, ещё непрочитанные произведения.


Отзывы о книге «Estadística práctica para ciencia de datos con R y Python»

Обсуждение, отзывы о книге «Estadística práctica para ciencia de datos con R y Python» и просто собственные мнения читателей. Оставьте ваши комментарии, напишите, что Вы думаете о произведении, его смысле или главных героях. Укажите что конкретно понравилось, а что нет, и почему Вы так считаете.

x