Industria y servicios
El desafío
El equipo del cliente trabaja con un conjunto de archivos (documentos PDF, audio e imágenes) y necesitan extraer el texto y la información subyacente para convertirlos en activos de valor para el negocio.
| El resultado
Los datos en crudo obtenidos en diferentes formatos se han convertido en datos anotados, válidos para su posterior utilización en aplicaciones de negocio.
Cómo lo logramos
- Realizar operaciones cuando un usuario inserta PDF, audio o imagen en un medio adecuado para su procesamiento generando como resultado un fichero de texto con la transcripción.
- Identificación de los ficheros de transcripción y generación de anotaciones para el análisis de lenguaje natural (NLP).
- Almacenamiento de la información en algún sistema para facilitar su posterior procesamiento.
Trasladamos la información desde el exterior del sistema a un sistema de almacenamiento, donde tratamos con varias unidades de computación, y volcamos el resultado parcial en un servicio de almacenamiento basado en objetos (Google Storage) y en el servicio de base de datos para analítica (Google Big Query).
Dispusimos un sistema de automatización para el cliente con el fin de que los entornos sean desplegables desde código, permitiendo levantar el sistema en diferentes proyectos de Google Cloud Platform.
¿Hablamos?
Si necesitas conocer más detalles o estás interesado en que podamos ayudar a tu organización, utiliza el formulario a continuación.