Ir al contenido principal

Diagrama de temas

    • Visión Artificial

      La visión artificial es la disciplina que implica que los computadores interpreten imágenes y videos a un alto nivel. Su computador muestra elementos visuales dibujando píxeles en la pantalla en función de la información binaria contenida en un archivo JPEG, PNG o algún otro archivo de imagen. Sin embargo, en tareas como esta, su computador "entiende" las imágenes a un nivel muy bajo. No puede analizar esa imagen mediante la identificación de objetos específicos, ni puede identificar la dirección del movimiento en un video. La visión artificial puede hacerlo.

      Al igual que el PNL, la visión artificial es una disciplina que impulsa muchos más campos y tecnologías. Algunos ejemplos son:

      • Reconocimiento de objetos
      • Clasificación de objetos
      • Generación de imágenes
      • Detección de movimientos
      • Estimación de trayectoria
      • Seguimiento mediante video
      • Navegación

      También como el PNL, la visión artificial permite que los computadores comprendan mejor los conceptos que son inherentes a la inteligencia similar a la humana, como llamar a un objeto una "silla" y otro objeto una "mesa" en función de su forma, material, cómo se está utilizando, etc. La visión artificial también se puede usar para ayudar a las personas con discapacidad visual, como un computador que habla el nombre de un objeto que ve en un video a una persona con discapacidad visual.

      Figura 1. Algunas de las subdisciplinas involucradas en la visión artificial.
      Considere el ejemplo presentado anteriormente del uso del aprendizaje profundo con reconocimiento facial. Si bien puede proporcionar una lista de rasgos faciales comunes, ningún rostro es igual. No importa cuántas características comunes comparta el rostro de cada persona, siempre hay diferencias. Esto incluso es cierto para objetos más simples, ¿cómo se puede llamar objetivamente a algo una "silla" cuando las sillas vienen en todas las formas y tamaños? Incluso si considera cómo se usa, ¿no se sienta la gente también en objetos que no consideraría una silla? Este es un problema que la IA debe resolver.

      Al igual que cualquier otro tipo de datos, los algoritmos de aprendizaje automático pueden entrenar en un conjunto de imágenes para determinar el contenido de alto nivel de esas imágenes.

      La detección de objetos y otras formas de visión artificial son especialmente aplicables a las redes neuronales artificiales (ANN) en modelos de aprendizaje profundo. La capa visible puede comenzar analizando píxeles sin procesar y las capas superiores pueden identificar formas cada vez más complejas que componen un objeto completo. Por supuesto, el reconocimiento y la clasificación de objetos son solo dos componentes de la visión artificial, aunque componentes muy grandes. La IA también puede facilitar la generación de imágenes y videos realistas entrenando un algoritmo sobre los diversos elementos que hacen que una escena sea "realista". Los sistemas de navegación también pueden responder de manera más inteligente si pueden observar su entorno: el sistema puede ver un árbol caído en la carretera y aconsejarle al conductor que modifique su rumbo.

      Información adicional

      Para obtener más información acerca de la visión artificial, consulte esta página