Key Takeaways
- 1Los portales gubernamentales en LatAm rompen constantemente los scrapers web tradicionales basados en el DOM.
- 2La navegación visual ignora por completo el código HTML frágil y calcula las coordenadas exactas de los píxeles en la pantalla.
- 3Puedes automatizar ERPs de escritorio anticuados como Siigo o TOTVS usando Python por unos cuantos centavos por ejecución.
Timeouts del DOM
Portales como la AFIP en Argentina usan tokens de sesión dinámicos metidos hasta el fondo del HTML. Los bots estándar que intentan leer la estructura de la página mueren al instante cuando la sesión se cae sin avisar.
Esta semana
1. Regístrate en la API de OpenAI (el plan de pago por uso requiere menos de 5 dólares para empezar). 2. Instala Python, `pyautogui` y `mss` en tu máquina local con Windows. 3. Ejecuta un script de 10 líneas que le tome una foto a tu portal de la DIAN y le pida a GPT-4o que devuelva las coordenadas XY del botón de iniciar sesión.
Preguntas Frecuentes
¿Por qué los bots tradicionales siempre fallan en los portales del gobierno en LatAm?
Portales como el SAT en México o la DIAN en Colombia usan tiempos de espera agresivos, tokens de sesión ocultos y CAPTCHAs que rompen al instante cualquier bot tradicional que intente leer el código HTML.
¿En qué se diferencia un agente visual?
En lugar de leer el código de la página, un agente visual toma una captura de pantalla de tu escritorio. Usa IA para encontrar las coordenadas exactas de los píxeles de un botón y hace clic como lo harías tú.
Kyto
AI & Automation Firm
We design and build AI automations and business operating systems. Agency results + Academy sovereignty.

