Falta de transparencia gubernamental en el Perú

Yoni Pacheco

En el año 2003, en el Perú se promulgó la ley Nº 27806 - "Ley de Transparencia y Acceso a la Información Pública" (modificada por la Ley N° 27927), la cual dice lo siguiente: “toda la información que posea el Estado se presume pública, salvo las excepciones expresamente previstas por el Artículo 15”.

El artículo 15 dice que las excepciones son asuntos militares, de inteligencia, información correspondiente a la defensa nacional, entre otros. Es por esta razón que el Gobierno peruano desarrolló una plataforma web para que las instituciones estatales puedan compartir su información con fines de transparencia. Estas instituciones comenzaron a incluir un enlace a la plataforma donde los ciudadanos podían encontrar y descargar datos sobre contrataciones de personal, gasto de presupuesto, etc. Si bien esto comenzó con fuerza luego de promulgada la ley, luego de unos años se perdió el interés y ahora es común encontrar instituciones que han dejado de publicar información desde hace unos años.

Muchas instituciones peruanas llevan un control de las personas que visitan físicamente sus instalaciones. Algunos ministerios se dan el trabajo de digitalizar el registro y publicar la información usando un buscador web desarrollado por el Estado peruano. Pero el buscador no es muy amigable y sólo se puede ver la lista de personas que visitaron las instalaciones día por día. No es posible buscar personas usando nombres como palabras clave, o buscar por documentos de identidad.

Usando estos buscadores, algunos periodistas peruanos han encontrado que familiares de políticos ingresan a la institución de contrataciones estatales para hacer diligencias y caen en evidente conflicto de interés. Sin embargo, su labor periodística sería mucho más ágil si los buscadores fueran de mejor calidad.

Con el fin de ayudar al periodismo peruano, en el blog “el Útero de Marita” hemos desarrollado software que se encarga de descargar todos los días la información nueva que va a apareciendo en algunas instituciones que tengan el registro de visitas en línea. Esta información es almacenada en una base datos local que sirve como soporte para el motor de búsqueda que hemos desarrollado. Si bien nuestro buscador es simple, también es poderoso. Los periodistas pueden ingresar parte del nombre de una persona y automáticamente aparecerán todas las coincidencias almacenadas en la base de datos. Hemos bautizado a nuestro buscador con el nombre de "Manolo" y puede ser visitado en el sitio.

Si bien algunas instituciones del Gobierno publican su registro de visitas, tenemos al Congreso peruano que se niega a hacerlo. Periodistas y abogados han hecho pedidos oficiales al Congreso, amparándose en la Ley 27.806, para que libere su registro. El Congreso ha contestado múltiples veces que su registro es secreto y no lo va a publicar, lo cual está en evidente infracción de la legislación peruana.

Otro problema frecuente es que las instituciones estatales peruanas liberan su información únicamente mediante la construcción de un buscador web y no hacen posible la descarga masiva de sus datos. Sería ideal si la información fuera publicada de las dos maneras: un buscador para la mayoría de la población y un enlace para descarga masiva para los periodistas de datos. Ya que la información es pública y además está publicada en la internet no deberían poner trabas para que los periodistas de datos puedan hacer una copia local de la información con el fin de hacer un eficiente minado de datos.

En el Útero de Marita hemos desarrollado y liberado software open source para realizar webscrapping y descargar masivamente documentos de las bases de datos estatales. En esto nos ha sido muy útil la librería open source llamada Scrapy.

Algunas instituciones como el Poder Judicial llegan al extremo de poner un captcha que debe ser ingresado para poder descargar cada documento sobre sentencias de la Corte Suprema. Esto hace que nuestro trabajo de scrapping sea un poco más dificultoso. Pero en el Útero de Marita hemos desarrollado varios scrappers y en junio del 2014 logramos liberar casi 60 mil archivos estatales en nuestro blog.

Una de las instituciones peruanas que posee más datos (y quizá más importantes) es el Instituto Nacional de Estadística e Informática (INEI). Esta institución constantemente recopila información en todo el Perú mediante encuestas y censos. Además genera reportes, boletines y publican los datos crudos en su página web. Sin embargo, estos datos consisten en archivos producidos con software propietario: archivos MS Excel, SPSS y STATA.

Esta situación tiene varios problemas. Primero, que para poder leer los archivos hay que comprar el software y se supone que los contribuyentes ya pagaron para que la información se recopile y no sería justo que tengan que pagar dinero adicional para leer los datos recopilados. El otro problema de esto consiste en que no hay garantía que futuras versiones del software propietario pueda ser capaz de leer estos archivos y ya no se pueda acceder a la información. Sería un gran paso si las instituciones usaran únicamente formatos abiertos al momento de diseminar su información.

Si bien las instituciones estatales peruanas han hecho un esfuerzo inicial para transparentar sus funciones y actividades, pueden hacerlo mejor. Parte de la problemática es que las plataformas y buscadores son difíciles de usar. Otro problema es que las autoridades políticas no siempre tienen un buen entendimiento de la tecnología y liberan datos públicos pero con trabas y restricciones. Ojalá que se mejore con el tiempo.

Yoni Pacheco (@AniversarioPeru)

Biólogo con un PhD en ecología. Como parte de sus hobbies es investigador en usos de las tecnologías de información, periodismo de datos, y colabora escribiendo para el blog "el Útero de Marita"

Un proyecto de               Gracias al apoyo de