Tomás Domínguez Mínguez - Visión artificial

Здесь есть возможность читать онлайн «Tomás Domínguez Mínguez - Visión artificial» — ознакомительный отрывок электронной книги совершенно бесплатно, а после прочтения отрывка купить полную версию. В некоторых случаях можно слушать аудио, скачать через торрент в формате fb2 и присутствует краткое содержание. Жанр: unrecognised, на испанском языке. Описание произведения, (предисловие) а так же отзывы посетителей доступны на портале библиотеки ЛибКат.

Visión artificial: краткое содержание, описание и аннотация

Предлагаем к чтению аннотацию, описание, краткое содержание или предисловие (зависит от того, что написал сам автор книги «Visión artificial»). Если вы не нашли необходимую информацию о книге — напишите в комментариях, мы постараемся отыскать её.

La visión artificial es una disciplina científica formada por un conjunto de técnicas que permiten la captura, el procesamiento y el análisis de imágenes, con el fin de extraer información de utilidad. Su objetivo es automatizar tareas reservadas hasta hace poco tiempo al ámbito humano en áreas como la seguridad, la industria, el comercio, la medicina, etc.
Muchas de las técnicas empleadas en visión artificial proceden de otras disciplinas como la inteligencia artificial o el deep learning, que exigen amplios conocimientos matemáticos. Por ese motivo, su expansión no se ha producido hasta la llegada de librerías como OpenCV, que ocultan esta complejidad y las ponen al alcance de cualquiera que disponga de unos conocimientos básicos de programación, en este caso, de Python.
En este libro aprenderá a usar la librería OpenCV de Python, con la que podrá desarrollar aplicaciones de visión artificial, tanto para imágenes estáticas como para vídeo. Todas las técnicas empleadas se exponen de forma clara y sencilla, sin entrar en conceptos matemáticos complejos. Además, se trata de un libro práctico, por lo que está repleto de ejercicios, cuyo código se explica línea a línea.
OpenCV es software libre, lo que significa que podrá usarlo sin restricciones. También es multiplataforma, así que es posible ejecutarlo tanto en Windows como en MacOS o Linux. Pero lo que realmente ha dado lugar a su enorme popularidad es la gran cantidad de algoritmos que implementa, con los que podrá:
· Poner en práctica técnicas de reconocimiento facial, identificación de objetos o personas, seguimiento de sus movimientos, etc.
· Crear aplicaciones de realidad aumentada, de inspección y vigilancia, orientadas a la robótica o juegos.
En cuanto a Python, este es uno de los lenguajes de programación más extendidos debido a que su código es abierto y multiplataforma, pero, sobre todo, por su sencillez y facilidad de uso. Eso ha hecho que se utilice en infinidad de ámbitos, entre los que destaca el de la visión artificial. Si no conoce este lenguaje, se proporciona un amplio anexo en el que se enseñan sus principios básicos de funcionamiento y con el que podrá seguir las prácticas propuestas de un modo fácil.
Sin lugar a dudas, este es el libro indicado para aprender a desarrollar con agilidad sus propias aplicaciones de visión artificial. No espere más, hágase con su ejemplar y exprima todo su potencial.
Tomás Domínguez es ingeniero de telecomunicación y doctorado en inteligencia artificial. Su labor profesional se ha desarrollado en una multinacional de telecomunicaciones, donde ha ocupado diversos cargos relacionados con la tecnología. Asimismo, ha ejercido como profesor universitario de ingeniería informática en la Universidad Alfonso X el Sabio de Madrid.

Visión artificial — читать онлайн ознакомительный отрывок

Ниже представлен текст книги, разбитый по страницам. Система сохранения места последней прочитанной страницы, позволяет с удобством читать онлайн бесплатно книгу «Visión artificial», без необходимости каждый раз заново искать на чём Вы остановились. Поставьте закладку, и сможете в любой момент перейти на страницу, на которой закончили чтение.

Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

split( imagen )

Esta función devuelve tres imágenes, una por cada uno de los colores primarios que la componen. Dichas imágenes se muestran en blanco y negro. Cuanto más claro sea un píxel, mayor será la intensidad del color primario correspondiente. Para comprobarlo, observe las siguientes figuras geométricas, cada una de las cuales se ha pintado en uno de los colores primarios.

Ahora escriba y ejecute el siguiente programa En este código primero se - фото 33

Ahora escriba y ejecute el siguiente programa:

En este código primero se importa la librería OpenCV y luego se carga la - фото 34

En este código, primero se importa la librería OpenCV y luego se carga la imagen anterior en color. A continuación, se ejecuta la función split(), que devuelve como resultado tres imágenes, una por cada color primario (img_azul, img_verde y img_roja). Finamente, dichas imágenes se muestran en ventanas independientes llamando tres veces a la función imshow().

Por lo tanto, el resultado de la ejecución del programa anterior serán tres ventanas, en cada una de la cuales se mostrará un solo color (que se verá blanco en su máxima intensidad y negro en su ausencia). Puesto que cada figura geométrica es de un color primario, en cada ventana se mostrará en blanco solo una de ellas (la que tiene el color por el que se filtra), y desaparecen el resto, que se funden con el negro del fondo. En visión artificial, este tipo de filtros de color son de gran utilidad, ya que sirven para seleccionar objetos en la imagen sobre los que interesa poner atención y descartar el resto.

Para volver a juntar los componentes de cada color en la misma imagen utilice - фото 35 картинка 36

Para volver a juntar los componentes de cada color en la misma imagen, utilice la función:

merge( imagen azul, imagen verde, imagen roja )

Dicha función devolvería la imagen en color original.

3.2 OBTENCIÓN DE LAS CARACTERÍSTICAS DE UNA IMAGEN

Las imágenes se almacenan como matrices de píxeles en objetos de la clase ndarray, de los que se pueden extraer características clave como sus dimensiones, el número de canales que las componen, el tipo de dato con el que se almacena la información o el tamaño que ocupa en disco.

Para conocer las dimensiones y el número de canales de una imagen, acceda a su atributo:

shape

El valor de dicho atributo es una tupla con tres valores:

(alto, ancho, n.° canales)

El tamaño que ocupa en disco una imagen vendrá dado por su ancho y alto, así como por el número de canales que contiene. Una imagen en blanco y negro tiene un canal, mientras que las de color se componen de tres (uno por cada color primario). Si cada color se almacenara en un byte, el tamaño en bytes de una imagen sería:

tamaño imagen = ancho x alto x n.° canales

Como se ha indicado, este cálculo es válido cuando los elementos de la matriz de la imagen ocupen un byte, por ejemplo, del tipo uint8. No todos los tipos de datos ocupan lo mismo en disco. Si quiere conocer cuál es el utilizado en una imagen, consulte el atributo:

dtype

Sin embargo, la forma más sencilla de conocer el tamaño en disco de una imagen es accediendo a su atributo:

size

Añada las siguientes sentencias al final del programa visto anteriormente (aquel con el que se cargaba y visualizaba la imagen en color de la niña):

Ahora además de mostrarse la imagen en pantalla en la shell obtendrá como - фото 37

Ahora, además de mostrarse la imagen en pantalla, en la shell obtendrá como resultado que tiene un tamaño de 921 600 píxeles, sus dimensiones son de 640 × 480 píxeles y se compone de tres canales, cuyos valores son del tipo uint8.

Compruebe que el tamaño de la imagen es el resultado de multiplicar el ancho - фото 38 картинка 39

Compruebe que el tamaño de la imagen es el resultado de multiplicar el ancho por el alto y el número de canales (colores por píxel). En este caso, 640 × 480 × 3 = 921 600.

3.3 CREACIÓN DE UNA IMAGEN A PARTIR DE UNA MATRIZ DE PÍXELES

Como ya sabe, una imagen es un objeto ndarray que contiene una matriz cuyos elementos establecen el nivel de luz (o color) de cada píxel. Si la imagen fuera en blanco y negro, el valor de dichos elementos sería un entero comprendido entre el 0 (oscuridad absoluta) y el 255 (máximo nivel de luz). Para entenderlo mejor, en la siguiente figura se muestra una imagen negra de 5 × 5 píxeles y su representación como una matriz.

En Python esta matriz de píxeles sería la siguiente Para convertir dicha - фото 40

En Python, esta matriz de píxeles sería la siguiente:

Para convertir dicha matriz en un objeto de la clase ndarray que es como - фото 41

Para convertir dicha matriz en un objeto de la clase ndarray, que es como realmente se representan las imágenes en OpenCV, tendría que utilizar la función array() de la propia librería NumPy. El código sería el siguiente:

Más abajo puede ver el resultado de la ejecución de este programa que muestra - фото 42

Más abajo puede ver el resultado de la ejecución de este programa, que muestra en la shell la matriz que representa una imagen negra de 5 × 5.

Observe que una matriz NumPy no muestra sus elementos separados por comas Sin - фото 43 картинка 44

Observe que una matriz NumPy no muestra sus elementos separados por comas.

Sin embargo, esta forma de trabajar no sería práctica cuando se manejan imágenes con una resolución de miles de píxeles. Por eso, la librería NumPy permite crear esta matriz de forma más sencilla, mediante la función:

zeros( dimensiones , tipo )

El primer argumento es una tupla con las dimensiones de la matriz. El segundo es el tipo de los elementos que contiene. Así, el programa anterior podría sustituirse por:

Antes de ejecutar la función que crea la imagen es necesario importar la - фото 45

Antes de ejecutar la función que crea la imagen, es necesario importar la librería NumPy, ya que la clase ndarray pertenece a dicha librería, no a OpenCV. La imagen devuelta por la función zeros() es de 5 × 5 píxeles, mientras que la información almacenada en cada píxel son valores enteros sin signo entre 0 y 255 (uint8). El resultado de la ejecución de este programa sería el mismo que el anterior.

Читать дальше
Тёмная тема
Сбросить

Интервал:

Закладка:

Сделать

Похожие книги на «Visión artificial»

Представляем Вашему вниманию похожие книги на «Visión artificial» списком для выбора. Мы отобрали схожую по названию и смыслу литературу в надежде предоставить читателям больше вариантов отыскать новые, интересные, ещё непрочитанные произведения.


Отзывы о книге «Visión artificial»

Обсуждение, отзывы о книге «Visión artificial» и просто собственные мнения читателей. Оставьте ваши комментарии, напишите, что Вы думаете о произведении, его смысле или главных героях. Укажите что конкретно понравилось, а что нет, и почему Вы так считаете.

x