El término AIOps fue acuñado por primera vez por Gartner en el año 2017, y se refiere a la aplicación del aprendizaje automático y al análisis de grandes cantidades de data (big data) para la automatización y la gestión de las operaciones de TI (ITOps). Si se toma cualquier área de operaciones de TI (análisis de registros, monitoreo de aplicaciones, mesa de servicio, gestión de incidentes, etc.) y la ampliamos con IA se obtendrá AIOps. Hay muchas formas en que la IA se puede integrar en las operaciones de TI existentes para ayudar a su equipo a ser más proactivo, preciso y productivo. Echemos un vistazo más de cerca a los conceptos básicos de AIOps.
¿Qué es una plataforma AIOps?
Las implementaciones de TI modernas deben lidiar cada vez más con demandas de datos más grandes y rápidas. Estos datos a menudo no están estructurados y se transmiten en tiempo real desde una gran red de fuentes aisladas. Las plataformas AIOps ayudan a los equipos de ITOps a comprender el volumen, la variedad y la velocidad de los grandes datos.
Gartner define las plataformas AIOps como herramientas que ayudan a las organizaciones a consolidar fuentes de datos en silos en big data para permitir conocimientos continuos en las operaciones y el monitoreo de TI (ITOM).

¿Cómo AIOps agiliza las operaciones tradicionales?
La mejor manera de comprender AIOps es considerar qué debe hacer un profesional de operaciones de TI típico para responder a una interrupción de los servicios y cómo la IA puede automatizar el proceso. Gartner rompe el ciclo de respuesta y resolución de interrupciones en tres pasos:
1.- Observar: el incidente inicial que desencadenó la interrupción debe ser detectado para que alguien responda. Una plataforma AIOps consume registros automáticamente, métricas, alertas, eventos y otros datos necesarios para comprender qué sucedió en el back-end de la aplicación cuando ocurrió el incidente. En lugar de que un ser humano extraiga manualmente esa información de fuentes de datos diferentes e intente darle sentido a todo, la plataforma AIOps consolidará todos estos datos e identificará patrones.
2.- Notificar: este paso implica analizar la información monitoreada y diagnosticar la causa raíz de la interrupción. La información relevante para resolver el problema se contextualiza y se transmite al personal de operaciones responsable mejor equipado para resolverlo. La herramienta AIOps puede realizar análisis de riesgo, automatizar la comunicación de responsabilidades y empaquetar datos relevantes para el personal de operaciones de TI.
3.- Actuar: El responsable directo resuelve el problema, restableciendo el servicio a la aplicación. Se pueden crear secuencias de comandos, procesos y automatización de release de aplicaciones que se ejecutarán la próxima vez que la herramienta AIOps detecte este problema en particular.
Al automatizar partes del proceso, AIOps puede ayudar a las operaciones de TI a responder a los desastres más rápido, minimizando los objetivos de tiempo de recuperación (RTO) y los objetivos de punto de recuperación (RPO).
Soluciones AIOps típicas:
Aquí hay una lista de roles comunes de ITOps que pueden automatizarse con el aprendizaje automático:
- Gestión de aplicaciones
- Manejo técnico
- Administración de incidentes
- Gestión de la mesa de servicio
- Gestión de la configuración
- Gestión de infraestructuras
- Mitigación de desastres.
Conecta con Jesús Rivas
Influenciador Tecnológico en Latinoamérica con más de 25 años de experiencia en software de misión crítica.