Ir al contenido principal

Diagrama de temas

    • Herramientas de IA de Código Abierto

      Herramientas de IA de código abierto

      Los siguientes son algunos ejemplos de herramientas de código abierto que se usan comúnmente en el aprendizaje automático y otras tareas de IA. El software de código abierto está libre de restricciones y cualquier persona lo puede utilizar, copiar, distribuir y modificar.
      Herramienta Descripción
      Lenguajes de programación

      Una variedad de lenguajes de programación está disponible para el aprendizaje automático.

      Los lenguajes Python® y R se utilizan con frecuencia, y se ha desarrollado un gran número de herramientas de soporte y bibliotecas de software en estos lenguajes para proporcionar un amplio soporte para la manipulación de conjuntos de datos, análisis estadístico, algoritmos de aprendizaje automático, visualización y otras capacidades relacionadas con IA/AA.

      También puede usar lenguajes empleados para el desarrollo de software general, como Java, C++, C#, etc., para IA/AA.

      Se siguen desarrollando nuevos lenguajes que están encontrando un uso significativo en IA/AA.

      Incluso los lenguajes muy antiguos utilizados tradicionalmente en el campo de la IA, como Lisp y Prolog, todavía están en uso hoy en día.

      NumPy

      Esta es una biblioteca para el lenguaje de programación Python. Una biblioteca de programación incluye código y otros recursos que los programadores pueden reutilizar en sus propios proyectos. NumPy, en particular, le permite crear y realizar cálculos matemáticos en arrays (matrices) grandes y multidimensionales. En programación, una matriz es una colección de valores u otros elementos.

      NumPy es una biblioteca fundamental para el aprendizaje automático con Python porque admite cálculos mucho más eficientes que las matrices estándar de Python, y las matrices NumPy pueden almacenar muchos tipos diferentes de datos.

      SciPy

      SciPy es otro componente de la pila de aprendizaje automático de Python, o una colección de componentes de software (como bibliotecas) que conforman una plataforma completa. Se basa en NumPy al ofrecer operaciones matemáticas más potentes, en particular las utilizadas en el campo de la computación científica. También incluye algunos de los otros componentes de aprendizaje automático que se tratan en esta tabla, incluidos pandas y Matplotlib.

      pandas
      La biblioteca pandas, parte de SciPy, admite estructuras de datos y funciones de análisis de datos para la programación de Python. En programación, una función es un fragmento de código que realiza una tarea específica y repetible. En el aprendizaje automático, el tipo de objeto pandas DataFrame es particularmente útil, ya que le permite cargar datos en una estructura similar a una hoja de cálculo (es decir, con filas y columnas). También puede utilizar varias funciones de pandas para describir y manipular datos en un DataFrame.
      Matplotlib Matplotlib, también parte de SciPy, incluye varios métodos para representar datos en gráficos. La representación de datos visualmente puede proporcionarle perspectivas nuevas y útiles sobre sus datos, lo que puede influir en su flujo de trabajo de datos (y en el propio proceso de entrenamiento). Matplotlib admite muchos tipos de técnicas de visualización.
      scikit-learn

      Si bien SciPy y sus módulos son fundamentales para el aprendizaje automático, scikit-learn en realidad implementa algoritmos de aprendizaje automático. Proporciona compatibilidad con algoritmos de aprendizaje automático fundamentales.

      NLTK Natural Language Toolkit (NLTK) es un conjunto de bibliotecas de Python que admiten el procesamiento de lenguaje natural (PLN). NTLK se utiliza más comúnmente como una herramienta de enseñanza para la teoría lingüística y la aplicación práctica. Brinda funcionalidad para la clasificación, tokenización, lematización y otras operaciones basadas en el lenguaje.
      Jupyter Notebook

      Jupyter Notebook es una aplicación web que permite a los usuarios crear, ver y compartir blocs de notas interactivos, archivos que incluyen código ejecutable en vivo, así como texto de marcado explicativo. El código de programa de un bloc de notas a menudo se separa en varios bloques y el usuario puede ejecutar cada bloque de forma independiente, secuencial o todos a la vez. Aunque no está diseñado en especial para el aprendizaje automático, Jupyter Notebook se utiliza a menudo para enseñar los principios de aprendizaje automático a través de un proceso instructivo práctico y paso a paso. Además de Python, Jupyter Notebook también admite código escrito en R y Julia.

      Anaconda

      Anaconda es una distribución de código abierto multiplataforma de muchas bibliotecas de ciencia de datos de Python y R, incluidas NumPy, SciPy, pandas, Matplotlib, scikit-learn, NTLK y muchas más. También incluye una interfaz gráfica de usuario (GUI) llamada Anaconda Navigator para administrar paquetes y ejecutar procesos. Debido a que incluye muchas de las bibliotecas que componen el aprendizaje automático de código abierto, Anaconda es a menudo el método preferido para configurar un entorno de aprendizaje automático en lugar de instalar cada componente de forma individual.

      Nota: En las actividades de este curso, se utiliza Anaconda.