Introducción
En el análisis de datos públicos publicados mediante dashboards interactivos (por ejemplo, en Tableau Public), es frecuente que la información no esté disponible directamente en formato descargable como CSV.
Sin embargo, cuando se logra obtener el archivo federated.hyper (extracto interno de Tableau), es posible convertirlo a un formato abierto para fines de:
- Investigación académica
- Auditoría de información pública
- Replicabilidad científica
- Análisis criminológico y estadístico
Esta guía explica cómo convertir un archivo .hyper a .csv en macOS, e incorpora la fundamentación jurídica que legitima el uso de datos públicos en el Perú.
La Constitución Política del Perú reconoce el derecho de acceso a la información pública (art. 2 inciso 5). Este derecho se desarrolla en la Ley N° 27806 – Ley de Transparencia y Acceso a la Información Pública, Dicha norma establece que toda información producida por el Estado es pública, salvo excepciones expresamente establecidas por ley.
Si una entidad estatal publica información estadística en un dashboard oficial, estamos frente a:
- Información pública
- Datos agregados
- Información no confidencial
Por tanto, su uso para investigación es legítimo.
Debe considerarse también la Ley N° 29733 – Ley de Protección de Datos Personales
Esta norma protege:
- Datos identificables
- Información sensible
- Datos que permitan identificar directamente a una persona
En el caso de dashboards estadísticos de denuncias por ejemplo SIDPOL, generalmente se publican:
- Datos agregados
- Categorías delictivas
- Distribución geográfica
- Series temporales
Mientras no se revele información identificable, el tratamiento con fines académicos es jurídicamente válido.
El uso de datos públicos con fines:
- Científicos
- Estadísticos
- Académicos
- Criminológicos
Está protegido por el principio de interés público y transparencia administrativa.
No constituye acceso indebido cuando:
- El archivo fue descargado legalmente
- No se vulneran sistemas de seguridad
- No se accede a información restringida
II. Requisitos Técnicos
Para convertir el archivo en macOS necesitas:
- macOS
- Python 3.7 o superior
- Archivo
federated.hyper - API oficial de Tableau
Se utilizará:
Tableau Hyper API
III. Procedimiento Técnico en macOS
1. Verificar Python
Abrir Terminal:
python3 --version
Debe mostrar versión 3.7 o superior.
2. Instalar Hyper API
pip3 install tableauhyperapi
Si falla:
python3 -m pip install tableauhyperapi
3. Colocar el archivo
Ubicar federated.hyper en la carpeta donde se trabajará (ejemplo: Downloads).
Verificar:
ls
4. Crear el Script export.py
En Terminal ejecutar:
cat << 'EOF' > export.py
from tableauhyperapi import HyperProcess, Telemetry, Connection
import csvhyper_file = "federated.hyper"with HyperProcess(telemetry=Telemetry.DO_NOT_SEND_USAGE_DATA_TO_TABLEAU) as hyper:
with Connection(endpoint=hyper.endpoint, database=hyper_file) as connection:
schemas = connection.catalog.get_schema_names()
for schema in schemas:
tables = connection.catalog.get_table_names(schema)
for table in tables:
table_name = table.name.unescaped
print("Exportando tabla:", table_name)
result = connection.execute_list_query("SELECT * FROM " + str(table))
with open(table_name + ".csv", "w", newline="", encoding="utf-8") as f:
writer = csv.writer(f)
writer.writerows(result)print("Exportación completa.")
EOF
5. Ejecutar el Script
python3 export.py
6. Resultado
Se generará:
- Un archivo CSV por cada tabla contenida en el archivo
.hyper - Los CSV aparecerán en la misma carpeta