🗃 Guía para crear una base de datos con metadatos Dublin Core
Esta guía te explica paso a paso cómo crear una base de datos en formato .csv
que pueda usarse en herramientas como Google Colab, VS Code o JupyterLab, utilizando la clasificación estándar de metadatos Dublin Core.
🎯 1. Define el propósito de tu base de datos
Antes de comenzar, responde:
- ¿Qué tipo de datos vas a registrar? (Ej: libros, películas, entrevistas, objetos digitales)
- ¿Para qué se usará esta base? (Análisis, archivo, visualización, etc.)
- ¿Quién la consultará?
Ejemplo: Una base de datos de novelas de ciencia ficción escritas por mujeres entre 2000 y 2025.
🧱 2. Diseña la estructura usando Dublin Core
Usa campos del estándar Dublin Core Metadata Element Set como encabezados de tus columnas.
📊 Tabla de campos recomendados (Dublin Core simplificado)
Campo csv |
Descripción |
---|---|
id | Identificador único por fila (obligatorio) |
title | Título del recurso |
creator | Autor/a o creador/a |
subject | Temas o palabras clave |
description | Breve resumen del contenido |
publisher | Editorial o entidad responsable |
contributor | Otras personas que colaboraron |
date | Fecha de publicación o creación |
type | Tipo de recurso (libro, artículo, audio, etc.) |
format | Formato del archivo o medio |
identifier | ID externo (ISBN, DOI, URL, etc.) |
source | Fuente de origen |
language | Idioma |
relation | Relación con otras obras |
coverage | Cobertura geográfica o temporal |
rights | Derechos de uso o licencia |
📌 El campo id
debe ser único para cada línea de datos (bk001
, bk002
, etc.).
📂 3. Crea tu archivo .csv
- Abre Google Sheets, Excel o un editor de texto plano.
- Usa los encabezados anteriores como la primera fila.
- Llena cada fila con los datos correspondientes.
- Guarda el archivo como
mi_base_de_datos.csv
.
📘 Ejemplo de contenido .csv
:
id,title,creator,date,publisher,language,identifier
bk001,Kindred,Octavia E. Butler,1979,Beacon Press,en,978-0807083697
bk002,La mujer habitada,Gioconda Belli,1988,DASA,es,978-958-05-0372-6
bk003,Los recuerdos del porvenir,Elena Garro,1963,Joaquín Mortiz,es,978-968-27-0123-4
🖥 4. Carga tu base en Google Colab o VS Code
En Google Colab:
import pandas as pd
from google.colab import files
uploaded = files.upload()
df = pd.read_csv("mi_base_de_datos.csv")
df.head()
En VS Code o Jupyter:
import pandas as pd
df = pd.read_csv("ruta/a/mi_base_de_datos.csv")
print(df.head())
🧹 5. Limpieza y validación de los datos
- Verifica que cada
id
sea único. - Asegúrate de no dejar columnas clave vacías (
title
,creator
,date
). - Usa formatos consistentes: fecha (
YYYY
), idioma (es
,en
), tipo (Libro
,Ensayo
, etc.).
📝 6. Documenta tu base
Acompaña tu archivo .csv
con un README.md
que contenga:
- Objetivo del proyecto
- Descripción de las columnas
- Fuente de los datos
- Fecha de elaboración
- Licencia o derechos de uso
🧾 Plantilla .csv
de ejemplo
👉 Descargar plantilla CSV de ejemplo
📌 Recomendaciones finales
- Usa OpenRefine para depurar y estandarizar los datos.
- Mantén consistencia terminológica y de formato.
- Si planeas escalar, considera una base de datos como SQLite o Airtable.
🖼️ ¿Cómo agregar audios, imágenes o videos a tu base de datos?
Si quieres enriquecer tu base de datos con archivos multimedia —como imágenes, audios o videos—, puedes hacerlo de varias maneras según el nivel técnico y los objetivos de tu proyecto.
✅ Opción 1: Vincular archivos multimedia desde tu archivo .csv
Puedes agregar columnas adicionales con enlaces a los recursos multimedia:
id | title | image_url | audio_url | video_url |
---|---|---|---|---|
bk001 | Kindred | assets/images/img1.jpg | assets/audio/01.mp3 | assets/video/clip1.mp4 |
Asegúrate de que los archivos estén disponibles públicamente en tu repositorio, por ejemplo:
/assets/images/
assets/audio/
assets/video/
También puedes usar URLs externas (como YouTube, SoundCloud, etc.).
🔍 Recomendaciones
- Añade campos como
image_caption
,audio_transcript
,video_language
, etc., si deseas más control o accesibilidad. - Usa nombres de archivo coherentes con los IDs (
img_bk001.jpg
,audio_bk001.mp3
, etc.).
✅ Opción 2: Usar plataformas como Omeka o CollectionBuilder
Estas plataformas permiten asociar archivos multimedia a cada ítem descrito con metadatos como Dublin Core.
- Omeka.net: Plataforma de exhibición digital para humanidades y archivos. Permite importar metadatos y subir archivos.
- CollectionBuilder: Funciona con GitHub Pages y Jekyll. Lee un
.csv
, carga medios desde/assets/
y genera un sitio navegable.
✅ Opción 3: Integrar medios en visualizaciones interactivas (Jupyter/Colab o HTML)
Si estás trabajando en Jupyter Notebooks o Google Colab, puedes insertar los medios directamente desde los datos:
from IPython.display import Image, Audio, HTML
Image(filename='assets/images/img1.jpg')
Audio(filename='assets/audio/01.mp3', autoplay=True)
También puedes usar HTML en sitios estáticos para incrustar los recursos en páginas personalizadas.
📁 Estructura de carpetas recomendada
/assets/
├── data/
│ └── mi_base.csv
├── images/
│ └── img1.jpg
├── audio/
│ └── 01.mp3
└── video/
└── clip1.mp4
En el .csv
:
id,title,image,audio,video
bk001,Kindred,assets/images/img1.jpg,assets/audio/01.mp3,assets/video/clip1.mp4
Esto facilitará cargar los medios desde tu base de datos y mantener todo organizado y visible desde GitHub Pages u otras plataformas.